python怎么匹配这个div下面的ul 下面的 li 下面的 a连接和文字

最终结果:a连接和文字求解,本人正则表达式本身就不好,只会匹配简单的,复杂的不会了要从外面的div匹配因为我根据外面那个id=“1030”来匹配里面的内容,并且最终建一个... 最终结果:a连接和文字
求解,本人正则表达式本身就不好,只会匹配简单的,复杂的不会了
要从外面的div匹配
因为我根据外面那个 id=“1030”来匹配里面的内容,
并且最终建一个字典:{1030:{href,文字},1031{href,文字}}
展开
 我来答
日TimE寸
推荐于2018-03-05 · TA获得超过9568个赞
知道大有可为答主
回答量:1358
采纳率:83%
帮助的人:478万
展开全部

解析HTML,最好不要使用正则表达式

而是使用专门的HTML解析器,比如Python的lxml包

举个例子如何获取id

from lxml import etree

url = 'xxx'
doc = etree.parse(url)
div = doc.xpath('//div[@class="car-familylist"]')
ids = list(map(lambda e:int(e.attrib[id][-4:]),div))
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式