Python怎么通过 正则表达式提取汉字
字符串如下,怎么通过正则表达式拿到<p></p>标签里的内容呢<h1class="title"><p>晚上晚上晚上晚上晚上晚上晚上晚上晚上晚上111<br/>晚上晚上晚上...
字符串如下,怎么通过正则表达式拿到<p></p>标签里的内容呢
<h1 class="title">
<p>晚上晚上晚上晚上晚上晚上晚上晚上晚上晚上111<br />晚上晚上晚上晚上晚上晚上晚上晚上晚上晚上2223……</p>
</h1> 展开
<h1 class="title">
<p>晚上晚上晚上晚上晚上晚上晚上晚上晚上晚上111<br />晚上晚上晚上晚上晚上晚上晚上晚上晚上晚上2223……</p>
</h1> 展开
2个回答
推荐于2018-03-21
展开全部
python有很多网页解析的包啊,BeautifulSoup,lxml之类的都很好用,犯不着正则
举个栗子:
from bs4 import BeautifulSoup
text = '<h1 class="title">.....</h1>'
soup = BeautifulSoup(text)
print soup.text
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询