python如何一个正则表达式获取html中表格内容
用正则匹配html中的表格数据时,总是要先用一个正则匹配出<table>标签中的字符串,再用个正则从这个字符串中去匹配tr。请问有没有办法一个正则表达式搞定?把上面两步合...
用正则匹配html中的表格数据时,总是要先用一个正则匹配出<table>标签中的字符串,再用个正则从这个字符串中去匹配tr。请问有没有办法一个正则表达式搞定?把上面两步合并成一个正则表达式也行。
像下面的页面中的表格http://gongwuyuan.eol.cn/difang/skzx/201509/t20150908_1312842.shtml 展开
像下面的页面中的表格http://gongwuyuan.eol.cn/difang/skzx/201509/t20150908_1312842.shtml 展开
2个回答
2015-09-08
展开全部
var reg = /<table>(?:(?!<\/table>)[\s\S])*<\/table>/gi;
追问
我要python的,不是js
追答
findall(string[, pos[, endpos]]) | re.findall(pattern, string[, flags]):
搜索string,以列表形式返回全部能匹配的子串。
-------------------------------------------------
import re
p = re.compile(r'<table>(?:(?!<\/table>)[\s\S])*<\/table>')
print p.findall('one1two2three3four4')
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询