Python爬虫用Beautifulsoup怎么提取纯文本

soup=BeautifulSoup(r.text,'html.parser')titles=soup.find_all('div',class_='nr_03')con... soup=BeautifulSoup(r.text,'html.parser')
titles=soup.find_all('div',class_='nr_03')
contents=soup.find_all('div',class_='content')
print(contents.text)

这是部分代码,我想提取titles和contents里面的纯文本,去除标签,但是在后面添加.text会报错,不知道怎么提取,哪位大神指点下
展开
 我来答
sd1863vxe
2018-08-09 · 超过27用户采纳过TA的回答
知道答主
回答量:38
采纳率:92%
帮助的人:17.3万
展开全部

contents是一个数组

contents[0].text即可获取

下面的代码你可以运行看下效果

print(titles[0].text)

for title in titles:
    print(title.text)

for content in contents:
    print(content.text)
追问
能再问一个问题吗?怎么把这个处于H1标签中的标题提取出来呢

标题

发布日期:2018-06-04
来源
作者:网络

推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式