爬虫如何解析动态网页 100

很多动态网站,页面都是javascript生成的,一般的抓源码只能看到很多script,js这些,就爬不到东西了。我现在看到的很多方法都是要调用浏览器来渲染页面再取出来,... 很多动态网站,页面都是javascript生成的,一般的抓源码只能看到很多script,js这些,就爬不到东西了。
我现在看到的很多方法都是要调用浏览器来渲染页面再取出来,这样效率比较低,刚接触这块,很多都不懂,特来求教各位有什么比较高效的办法。
或者叫解析动态JS,就是那些html的dom都是由js生成的
展开
 我来答
北白翠2z
2009-09-14 · 超过10用户采纳过TA的回答
知道答主
回答量:35
采纳率:0%
帮助的人:29万
展开全部
这里的动态网站不是你想象的那样是一个又动画的网页,这里的动态是用JSP或者是用asp及其php做的网页,你直接让浏览器保存的页面其中又script.js这样的文件。或者是你得到后缀是.js的文件其实那就是JavaScript这样的脚本了,但是这些东西是控制HTML页面的已经有的东西,并不是新的生成的,动态页面的意思是动态的生成新的内容,JSP和asp还有php这样的脚本语言就可以实现这样的功能了。呵呵………………
百度网友312835d2c
2009-09-14 · TA获得超过155个赞
知道小有建树答主
回答量:156
采纳率:0%
帮助的人:134万
展开全部
1.页面不是javaScript生成的,是由java service page即jsp页面,由

服务器处理后生成的,

换句话说,你看到的不是源文件,而是经过处理器处理的,

保证了代码的安全性!

2.js文件只是记录了javaScript的一些方法,设置等....

3.javaScript控制界面的东西

4.JSP控制后台的东西
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式