如何在 python 中使用 beautifulsoup4 来抓取标签中的内容

 我来答

2个回答

#合辑# 面试问优缺点怎么回答最加分？

从空去听8
2017-11-03 · TA获得超过7439个赞

知道大有可为答主

回答量：6907

采纳率：93%

帮助的人：5541万

我也去答题访问个人页

关注

展开全部

小白入门阶段，主要用requests和beautifulsoup4库来爬取内容。目前遇到的问题是，使用beautifulsoup抓取标签内容出错。所以来咨询下过往前辈的建议。
1、像上图HTML文档中的滴滴出行，应该如何抓取？用select函数可以实现嘛？
2、像抓取战略投资，我使用了下面的语句，内容截取到了，但是还多了个括号。不知道怎么把括号去掉。
investment=soup.select('span[class="t-small c-green"]')[0].text.strip()
3、我光是select函数就用迷糊了。。。更别说添加别的函数了。
问题比较简单，但是已经卡了我很久了。求大神指点一二啊！

from bs4 import BeautifulSoup

html_doc = '''
<div class="line-title">


滴滴出行

（战略投资）





编辑

</div>
'''

soup = BeautifulSoup(html_doc, "html.parser")
# 初级版
didi = soup.b.next_element.strip()
invest = soup.b.span.next_element.strip()

# 进阶版

didi, invest = soup.b.stripped_strings

已赞过 已踩过<

评论收起

sun_pxy1
2020-06-08

知道答主

回答量：2

采纳率：0%

帮助的人：1352

我也去答题访问个人页

关注

展开全部

.lstrip("(").rstrip(")")

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

商汤科技日日新·CoRaccoon-AI代码辅助生成

基于商汤大模型，让AI帮你写代码，支持100+语言与主流IDE，提升编程效率超50%。涵盖多场景，已助数万用户提升效率。点击立即体验!

www.sensetime.com广告

pytnon 3.11下载-2.5-3.11简体中文新版环境搭建

正版软件，不捆绑安装一次收费，长期使用，绿色通道，无广告，十年安装经验致力用户高效开发，支持远程协助安装，支持重置，使用便捷放心。

www1.msc23.cn广告

如何在 python 中使用 beautifulsoup4 来抓取标签中的内容

您可能关注的内容

其他类似问题

为你推荐：