python 怎么提取html内容啊？（正则）

我是用的：...html=r'''<li>Coffee</li><li>Tea</li><li>Milk</li>'''p=re.compile(r'''<li>(.*)... 我是用的：
...
html = r'''<li>Coffee</li> <li>Tea</li> <li>Milk</li>'''
p = re.compile(r'''<li>(.*)</li>''')
p.search(aa).group()
....
但显示结果是：
'<li>Coffee</li> <li>Tea</li> <li>Milk</li>'
我想让结果是
Coffee Tea Milk
怎么弄？谢谢了展开

 我来答

2个回答

#热议# 什么是淋病？哪些行为会感染淋病？

织丰德
推荐于2016-02-16 · 超过16用户采纳过TA的回答

知道答主

回答量：50

采纳率：60%

帮助的人：21.4万

我也去答题访问个人页

关注

展开全部

我一般使用BeautifulSoup，还是比较简单的
soup=BeaitifulSoup(html,'html.parser')
要找到某各元素使用find_all方法就行
for div in soup.find_all('div'):

但是经常会遇到网站有反爬的设置，比如子结点中含有换行符，只要写个函数去掉子结点间的换行符就行

已赞过 已踩过<

评论收起

匿名用户
2014-03-12

展开全部

html = r'''<li>Coffee</li> <li>Tea</li> <li>Milk</li>'''
p = re.compile(r'''<li>(\w+)</li>''')
p.findall(html)
 
结果:
['Coffee', 'Tea', 'Milk']

本回答被网友采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

html前端工程师2023新升级，全栈多面手养成计划

html零基础到源码解析，80+小时新增内容，打造职场核心竞争力!html6年迭代经典课程，38周全面学习，助力技术深度与宽度双提升。

class.imooc.com广告

python 怎么提取html内容啊？（正则）

您可能关注的内容

其他类似问题

为你推荐：