python xpath语法问题?
1.python做爬虫时,用xpath语法提取某个属性的值,有些条目存在该属性,有些条目不存在该属性时,如何顺利提取已存在的属性值,不存在的不做操作,或者付给他一个指定的...
1 . python做爬虫时 ,用xpath 语法提取某个属性的值,有些条目存在该属性,有些条目不存在该属性时,如何顺利提取已存在的属性值,不存在的不做操作,或者付给他一个指定的值?
2 。'''<div class="con"><a href="北苑租房_北京北苑房屋出租(北京链家网)">北苑租房</a><span>/</span>高楼层(共28层)<span>/</span>2011年建板楼</div>'''
如上html,div下面两个span节点,如何区分两个节点,分别进行提取呢?
谢谢大神 展开
2 。'''<div class="con"><a href="北苑租房_北京北苑房屋出租(北京链家网)">北苑租房</a><span>/</span>高楼层(共28层)<span>/</span>2011年建板楼</div>'''
如上html,div下面两个span节点,如何区分两个节点,分别进行提取呢?
谢谢大神 展开
1个回答
展开全部
需要先找到两个节点的共同点,然后用正则(规则)表达式来提取。
'</span>(.+?)<'
import re
text = '''<div class="con"><a href="北苑租房_北京北苑房屋出租(北京链家网)">北苑租房</a><span>/</span>高楼层(共28层)<span>/</span>2011年建板楼</div>'''
list1 = re.findall('</span>(.+?)<', text)
for list2 in list1:
print(list2)
输出结果:
高楼层(共28层)
2011年建板楼
不知道是不是你想要的答案。
追问
正则可以实现,我只是想用xpath实现
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询