Python爬虫用Beautifulsoup怎么提取纯文本

soup=BeautifulSoup(r.text,'html.parser')titles=soup.find_all('div',class_='nr_03')con... soup=BeautifulSoup(r.text,'html.parser')
titles=soup.find_all('div',class_='nr_03')
contents=soup.find_all('div',class_='content')
print(contents.text)

这是部分代码，我想提取titles和contents里面的纯文本，去除标签，但是在后面添加.text会报错，不知道怎么提取，哪位大神指点下展开

 我来答

1个回答

#热议# 海关有哪些禁运商品？查到后怎么办？

sd1863vxe
2018-08-09 · 超过27用户采纳过TA的回答

知道答主

回答量：38

采纳率：92%

帮助的人：17.3万

我也去答题访问个人页

关注

展开全部

contents是一个数组

contents[0].text即可获取

下面的代码你可以运行看下效果

print(titles[0].text)

for title in titles:
    print(title.text)

for content in contents:
    print(content.text)

追问

能再问一个问题吗？怎么把这个处于H1标签中的标题提取出来呢

标题

发布日期：2018-06-04
来源
作者：网络

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

Python爬虫用Beautifulsoup怎么提取纯文本

其他类似问题

为你推荐：