
如何抓取js动态生成的网页
3个回答
展开全部
可以考虑用phantonjs或者它的衍生物casperjs以及spookyjs。phontonjs是个无界面的浏览器,通过js代码来控制浏览器的浏览行为。casper在它上面封装了很多好用的API,很方便的实现点击、等待某元素出现等动作。spookyjs则是相当于nodejs版的casperjs,有了nodejs支持,你就很容易把抓到的内容写文件、数据等。
2017-04-12 · 百度知道合伙人官方认证企业
1【专注:Python+人工智能|Java大数据|HTML5培训】 2【免费提供名师直播课堂、公开课及视频教程】 3【地址:北京市昌平区三旗百汇物美大卖场2层,微信公众号:yuzhitc】
向TA提问
关注

展开全部
很多网站是用js或Jquery 生成数据的,到后台获取到数据以后,用 document.write()或者("#id").html="" 的方式 写到页面中,这个时候用浏览器查看源码是看不到数据的。
所以直接调用js调用的url再发送请求吧。HttpClient是绝对不可能的,所以还是直接写代码调用。
所以直接调用js调用的url再发送请求吧。HttpClient是绝对不可能的,所以还是直接写代码调用。
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
2017-05-25 · 知道合伙人互联网行家
关注

展开全部
js一般是通过ajax来获取列表,你可以找到ajax中的GET地址或者POST地址,来取得分页内容。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询