请问如何利用python的正则表达式截取td里面的数据? 20

html='<tdclass="dd"><ahref="#">Test</a></td>'html=re.findall(r'<td[^>]>(.*?)</td>',ht... html = '<td class="dd"><a href="#">Test</a></td>'
html = re.findall(r'<td[^>]>(.*?)</td>',html,re.I|re.M)
print (html)
以上是我的代码,我想提取Test的数据,但是输出的html结果是[],期待有高手可以解答
展开
 我来答
lch743
2016-07-07 · TA获得超过1181个赞
知道小有建树答主
回答量:377
采纳率:50%
帮助的人:371万
展开全部

应该是这么写吧

h = re.findall(r'<td[^>]*><a[^>]*>(.*?)</a></td>', html, re.I|re.M)
追问
您好,感谢您的答案,完美解决了。另外如果html是

Test
Test2
正则表达又是如何表达,才能同时把Test和Test2拿下呢?
追答

可以换个思路,将标签全部拿掉。

h = re.sub(r'<.*?>', '', html)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式