python爬虫遇到有等待响应的网站怎么爬取
用python3.4爬取某一网页时遇到了问题。。代码如图二,问题如图一。该网站使用浏览器访问时,需要在图一卡个一两秒,然后才有正确的内容显示出来,而网站网址是没有发生改变...
用python3.4爬取某一网页时遇到了问题。。代码如图二,问题如图一。该网站使用浏览器访问时,需要在图一卡个一两秒,然后才有正确的内容显示出来,而网站网址是没有发生改变的。爬取时,会出现:直接爬取了等待时候的html而不是最终的。这个是不是访问速度太快造成的?能设置爬取维持的时间吗?还是说是用其他的方法绕过?
展开
2个回答
2016-07-18
展开全部
python + selenium + phantomjs
追问
能否说的详细些,本人大菜鸟
追答
去学selenium 及 phantomjs 这两个模块的使用。
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询
广告 您可能关注的内容 |