Python requests爬取今日头条，为什么获取不了网页内容

headers={'user-agent':'Mozilla/5.0(WindowsNT10.0;WOW64)AppleWebKit/537.36(KHTML,likeG... headers = {
'user - agent': 'Mozilla / 5.0(Windows NT 10.0; WOW64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 53.0.2785.104Safari / 537.36Core / 1.53.4882.400QQBrowser / 9.7.13059.400'
}
response = requests.get('http://toutiao.com/group/6552087122092753412', headers = headers)
print(response.text)
-------------------------------------------------------------------------
得到的结果：
---------------------------------------------------------------------------
E:\Python_Pro\Spider\venv\Scripts\python.exe E:/Python_Pro/toutiao/jiepai.py
<html><head></head><body></body></html>

进程已结束,退出代码0
-----------------------------------------------------------------
求大神解答，是因为这个网页有反爬虫机制吗？我需要怎么破解。。萌新求大神指导展开

 我来答

2个回答

#热议# 网上掀起『练心眼子』风潮，真的能提高情商吗？

百度网友c8c8fb385e
2018-05-06 · TA获得超过248个赞

知道小有建树答主

回答量：428

采纳率：62%

帮助的人：136万

我也去答题访问个人页

关注

展开全部

感觉并没有什么反爬吧，照着你的写明明可以获取图片呀

也不大可能是requests的版本问题吧，我2.12.4都可以额~

追问

额。这就奇怪了？我这print（response.text）,显示不了网页源代码，只能显示

<html><head></head><body></body></html>，导致后面要爬取图片直接报错。

已赞过 已踩过<

评论收起

百度网友ce7b2e7
2018-10-13

知道答主

回答量：1

采纳率：0%

帮助的人：806

我也去答题访问个人页

关注

展开全部

这个是网页的反爬虫机制决定的，在requests请求的时候加入headers参数就可以了

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

宝塔面板一款提升提升服务器配置效率的好帮手

操作简单，只需轻松点击鼠标就能部署一键配置服务器且功能丰富各种功能一应俱全。只需要轻松地点击鼠标，就可以一键配置服务器部署各种运行环境的运维工具。

www.bt.cn广告

资料下载标准版-资料文档库-全文阅读下载

资料下载专题资料下载，不用四处查资料，360文库海量精选资料下载全行业资料覆盖，千万文档即刻下载，享专属优惠!

wenku.so.com广告

Python requests爬取今日头条，为什么获取不了网页内容

您可能关注的内容

其他类似问题

为你推荐：