python爬虫只能获取部分源码,与浏览器上的不一致?
想获取所有的中文字符,并且和他们的拼音相对应。就在爬取网上的新华字典网页的时候我只能获取到一半的网页。另外一半不管我是保存在文件里还是打印在屏幕上。都是一样的。只能拿到一...
想获取所有的中文字符,并且和他们的拼音相对应。就在爬取网上的新华字典网页的时候我只能获取到一半的网页。另外一半不管我是保存在文件里还是打印在屏幕上。都是一样的。只能拿到一部分。可以明显看到浏览器后面还有大部分源码没有拿到。这是我获得的网页源码。我只能拿到一半。而且这一半还给他加上了对应的标签。我想可能是网站的反爬。但是具体 是什么不清楚。谁能给我讲讲。。
展开
1个回答
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询