如何在 python 中使用 beautifulsoup4 来抓取标签中的内容

 我来答
盗墓者18
2017-11-10 · TA获得超过2028个赞
知道小有建树答主
回答量:820
采纳率:84%
帮助的人:257万
展开全部

比如一个简单的html标签:

<html>
<title>test</title>
</html>

代码:(使用的是python2)

# -*- coding:utf-8 -*-
import bs4  #导入bs4模块

html='''
<html>

<title>test</title>

</html>
'''
test=bs4.BeautifulSoup(html,'html.parser') #生成BeautifulSoup对象,并用python自带的解析器html.parser解析
print test.title.string   #打印标签内的数据

结果:

这样就取出标签内的数据了。

补充一句:bs4是第三方模块,需要在终端使用pip installl BeautifulSoup
4或者easy_install BeautifulSoup4先安装再使用。并且导入的时候模块名是bs4,而不是BeautifulSoup4

推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式