python 正则如何提取<li>标签?
如图注释的为<li>标签内容,但输出报错为<_sre.SRE_Patternobjectat0x0000000003038450>该如何处理?...
如图 注释的为<li>标签内容,但输出报错为<_sre.SRE_Pattern object at 0x0000000003038450>该如何处理?
展开
1个回答
展开全部
findDiv = re.findall(r'<li>\s*<div class="viewimg">(.*?)</li>', h, re.S)
或(import requests用这个模块的话会更方便)
pattern = re.compile(r'<li>\s*<div class="viewimg">(.*?)</li>', re.S)
findDiv = pattern.findall(html)
In [1]: import re
In [2]: h = '''<li>
...: <div class="viewimg"><sdfsdf>
...: sdfsdf
...: </li>'''
In [3]: findDiv = re.findall(r'<li>\s*<div class="viewimg">(.*?)</li>', h, re.S)
...:
In [7]: pattern = re.compile(r'<li>\s*<div class="viewimg">(.*?)</li>', re.S)
In [8]: pattern.findall(h)
Out[8]: ['<sdfsdf>\nsdfsdf\n']
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询