python怎么爬去<span>lt;/span>中间标签的内容

 我来答

1个回答

#热议# 什么是淋病？哪些行为会感染淋病？

哦_廿一
2017-06-22 · TA获得超过431个赞

知道小有建树答主

回答量：273

采纳率：91%

帮助的人：230万

我也去答题访问个人页

关注

展开全部

这个要看你使用的是什么页面解析工具了，

html = """
<span class='red'>item1</span>
<div>
    <span id='s1'>item2</span>
</div>
"""
# 使用 scrapy 的Selector
from scrapy.selector import Selector

# scrapy 的选择器支持 css和xpath选择。下面是css选择器。如果你了解前端JQuery的知识，
# 会发现
Selector(text=html).css('span::text').extract()
# 输出 : ['item1','item2']
Selector(text=html).css('span#s1::text').extract()
# 输出 : ['item2']
Selector(text=html).css('div>span::text').extract()
# 输出 : ['item2']


# 使用bs4
from bs4 import BeautifulSoup


soup = BeautifulSoup(html,'html.parser')
sl = soup.find_all("span")
result = [span.get_text() for span in sl]
print(result)
# ['item1', 'item2']

本回答由提问者推荐

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

python怎么爬去<span>lt;/span>中间标签的内容

其他类似问题

为你推荐：