python 怎么提取html内容啊？（正则）

我是用的：...html=r'''<li>Coffee</li><li>Tea</li><li>Milk</li>'''p=re.compile(r'''<li>(.*)... 我是用的：
...
html = r'''<li>Coffee</li> <li>Tea</li> <li>Milk</li>'''
p = re.compile(r'''<li>(.*)</li>''')
p.search(aa).group()
....
但显示结果是：
'<li>Coffee</li> <li>Tea</li> <li>Milk</li>'
我想让结果是
Coffee Tea Milk
怎么弄？谢谢了展开

 我来答

2个回答

#热议# 网上掀起『练心眼子』风潮，真的能提高情商吗？

织丰德
推荐于2016-02-16 · 超过16用户采纳过TA的回答

知道答主

回答量：50

采纳率：60%

帮助的人：21.3万

我也去答题访问个人页

关注

展开全部

我一般使用BeautifulSoup，还是比较简单的
soup=BeaitifulSoup(html,'html.parser')
要找到某各元素使用find_all方法就行
for div in soup.find_all('div'):

但是经常会遇到网站有反爬的设置，比如子结点中含有换行符，只要写个函数去掉子结点间的换行符就行

已赞过 已踩过<

评论收起

匿名用户
2014-03-12

展开全部

html = r'''<li>Coffee</li> <li>Tea</li> <li>Milk</li>'''
p = re.compile(r'''<li>(\w+)</li>''')
p.findall(html)
 
结果:
['Coffee', 'Tea', 'Milk']

本回答被网友采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

python 怎么提取html内容啊？（正则）

其他类似问题

为你推荐：