python 怎么提取html内容啊?(正则)

我是用的:...html=r'''<li>Coffee</li><li>Tea</li><li>Milk</li>'''p=re.compile(r'''<li>(.*)... 我是用的:
...
html = r'''<li>Coffee</li> <li>Tea</li> <li>Milk</li>'''
p = re.compile(r'''<li>(.*)</li>''')
p.search(aa).group()
....
但显示结果是:
'<li>Coffee</li> <li>Tea</li> <li>Milk</li>'
我想让结果是
Coffee Tea Milk
怎么弄?谢谢了
展开
 我来答
织丰德
推荐于2016-02-16 · 超过16用户采纳过TA的回答
知道答主
回答量:50
采纳率:60%
帮助的人:21.4万
展开全部
我一般使用BeautifulSoup,还是比较简单的
soup=BeaitifulSoup(html,'html.parser')
要找到某各元素使用find_all方法就行
for div in soup.find_all('div'):

但是经常会遇到网站有反爬的设置,比如子结点中含有换行符,只要写个函数去掉子结点间的换行符就行
匿名用户
2014-03-12
展开全部
html = r'''<li>Coffee</li> <li>Tea</li> <li>Milk</li>'''
p = re.compile(r'''<li>(\w+)</li>''')
p.findall(html)

结果:
['Coffee', 'Tea', 'Milk']
本回答被网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式