python xpath语法问题?

1.python做爬虫时,用xpath语法提取某个属性的值,有些条目存在该属性,有些条目不存在该属性时,如何顺利提取已存在的属性值,不存在的不做操作,或者付给他一个指定的... 1 . python做爬虫时 ,用xpath 语法提取某个属性的值,有些条目存在该属性,有些条目不存在该属性时,如何顺利提取已存在的属性值,不存在的不做操作,或者付给他一个指定的值?

2 。'''<div class="con"><a href="北苑租房_北京北苑房屋出租(北京链家网)">北苑租房</a><span>/</span>高楼层(共28层)<span>/</span>2011年建板楼</div>'''

如上html,div下面两个span节点,如何区分两个节点,分别进行提取呢?

谢谢大神
展开
 我来答
职业人和培训师
2018-01-14 · TA获得超过1399个赞
知道小有建树答主
回答量:428
采纳率:90%
帮助的人:111万
展开全部

需要先找到两个节点的共同点,然后用正则(规则)表达式来提取。

'</span>(.+?)<'

import re

text = '''<div class="con"><a href="北苑租房_北京北苑房屋出租(北京链家网)">北苑租房</a><span>/</span>高楼层(共28层)<span>/</span>2011年建板楼</div>'''
list1 = re.findall('</span>(.+?)<', text)
for list2 in list1:
    print(list2)

输出结果:

高楼层(共28层)
2011年建板楼

不知道是不是你想要的答案。

追问
正则可以实现,我只是想用xpath实现
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式