5个回答
展开全部
不是高手哈。只是做过类似的,了解一些。
就像楼上所说的,要抓AJAX的东西,需要你针对他网站来分析之后再抓取的。一般静态站大多用这种方法。
比如,他的评论是JAVASCRIPT加载的,你就用爬虫去抓他的脚本,然后在脚本中间取数据。
如果你懂原理的话,并不是一件很困难的事情。
注意要模拟GET或者POST方法,也有可能需要用到COOKIE的。。
还要看对方的网站有没有做特别的限制,必须是他的域名下面才能取数啊什么的。
就像楼上所说的,要抓AJAX的东西,需要你针对他网站来分析之后再抓取的。一般静态站大多用这种方法。
比如,他的评论是JAVASCRIPT加载的,你就用爬虫去抓他的脚本,然后在脚本中间取数据。
如果你懂原理的话,并不是一件很困难的事情。
注意要模拟GET或者POST方法,也有可能需要用到COOKIE的。。
还要看对方的网站有没有做特别的限制,必须是他的域名下面才能取数啊什么的。
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
楼主还是别想了吧,这个问题,无解,更不是10分能解决问题的。 除非有一天 爬虫能够支持javascript,xmlhttprequest ,那可能还有希望。
当然,你可以人工的去分析 他的ajax代码,找到数据源,然后用爬虫去采集。。。
当然,你可以人工的去分析 他的ajax代码,找到数据源,然后用爬虫去采集。。。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
ajax是网页局部加载的方式,不完全重新加载。
页面的本质,最终还是HTML,所以爬取和其它页面是一样的原理,通过解析网页的html实现爬取
页面的本质,最终还是HTML,所以爬取和其它页面是一样的原理,通过解析网页的html实现爬取
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
这样的问题是0分能够搞定的吗,建议还是google一下,或许能够找到答案。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
晕,抓取ajax比直接抓取网页更爽啊
我汗了.......怎么想的呢,你们,哎·· ··
我汗了.......怎么想的呢,你们,哎·· ··
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询