请问如何用VB编写抓取动态网页信息的程序??
我可以熟练编写抓取静态网页的内容;但依然不知道该如何抓取动态网页内容,希望得到专家指点;我想用Winsock控件,实现动态网页内容的抓取,请问是否可行??(用WebBro...
我可以熟练编写抓取静态网页的内容;
但依然不知道该如何抓取动态网页内容,希望得到专家指点;
我想用Winsock控件,实现动态网页内容的抓取,请问是否可行??(用WebBrowser控件似乎无法实现动态网页信息的抓取);
以下是抓取流程的初步思路,有啥不对的地方,请指点指点:
1、通过HTTP请求,获取需要抓取的页面
2、分析页面元素信息,形成DOM树,对DOM树进行遍历,提取出JS脚本代码;
3、由JS解析模块执行上一模块中得到的JS脚本代码,获取从服务器返回的请求内容;
4、提取URL模块,利用上一模块的结果,重新组合生成新的页面内容,提取页面中的URL和文本内容 展开
但依然不知道该如何抓取动态网页内容,希望得到专家指点;
我想用Winsock控件,实现动态网页内容的抓取,请问是否可行??(用WebBrowser控件似乎无法实现动态网页信息的抓取);
以下是抓取流程的初步思路,有啥不对的地方,请指点指点:
1、通过HTTP请求,获取需要抓取的页面
2、分析页面元素信息,形成DOM树,对DOM树进行遍历,提取出JS脚本代码;
3、由JS解析模块执行上一模块中得到的JS脚本代码,获取从服务器返回的请求内容;
4、提取URL模块,利用上一模块的结果,重新组合生成新的页面内容,提取页面中的URL和文本内容 展开
展开全部
你告兄察说的动态网页是指ajax吗?如果是这样的话,恐怕只能用WebBrowser控件了。当然,如果你袜茄能找到单独尘哗的JS解释引擎更好。
更多追问追答
追问
还是没搞懂
单独的JS解释引擎是什么?
WebBrowser控件可以抓取静态网页,这个我已经实现了,但好像无法抓取动态网页吧?
总之我现在还是一头雾水,还没找到北
追答
就是执行JS脚本的东西。
WebBrowser用的东西就是IE浏览器用的东西,两者的核心部件是一样的。所以说你用IE可以看到的内容用WebBrowser就可以看到。
WebBrowser中看到的一切内容的源代码都是可以通过VB访问到的。
你说的动态网页能贴一下网址吗?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询