如何在 python 中使用 beautifulsoup4 来抓取标签中的内容
1个回答
展开全部
比如一个简单的html标签:
<html>
<title>test</title>
</html>
代码:(使用的是python2)
# -*- coding:utf-8 -*-
import bs4 #导入bs4模块
html='''
<html>
<title>test</title>
</html>
'''
test=bs4.BeautifulSoup(html,'html.parser') #生成BeautifulSoup对象,并用python自带的解析器html.parser解析
print test.title.string #打印标签内的数据
结果:
这样就取出标签内的数据了。
补充一句:bs4是第三方模块,需要在终端使用pip installl BeautifulSoup
4或者easy_install BeautifulSoup4先安装再使用。并且导入的时候模块名是bs4,而不是BeautifulSoup4
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询