如何在 python 中使用 beautifulsoup4 来抓取标签中的内容

 我来答

1个回答

#热议# 海关有哪些禁运商品？查到后怎么办？

paipai虫
2017-07-24 · TA获得超过603个赞

知道小有建树答主

回答量：875

采纳率：63%

帮助的人：233万

我也去答题访问个人页

关注

展开全部

可以，直接使用，具体案例如下：
#coding:utf-8
#author:http://www.chenhaifei.com/
import requests #打开
import sys #专门乱码的
from bs4 import BeautifulSoup as bs #把html结构化
reload(sys)
sys.setdefaultencoding('utf-8')
headers={
'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.71 Safari/537.36',
}
url='http://www.chenhaifei.com/archive'
print url
cont = requests.get(url,timeout=120,headers=headers).content #通过request获取网页源码
soup = bs(cont, "html.parser") ##使用soup结构话源码
infos = soup.find('ul',{'class':"listing"}).find_all('li') ##批量获取ul下的li标签
for i in infos: ##遍历li的数组
title=i.find('a').text ##获取li下的a标签
date=i.find('span',{'class':"date"}).text #获取li下的span标签
print title,date

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

pytnon环境搭建-在线下载全新中文版pytnon安装

正版软件，不捆绑安装一次收费，长期使用，绿色通道，无广告，十年安装经验致力用户高效开发，支持远程协助安装，支持重置，使用便捷放心。

www1.msc23.cn广告

如何在 python 中使用 beautifulsoup4 来抓取标签中的内容

您可能关注的内容

其他类似问题

为你推荐：