C/C++ 怎么获取网页内容?
不是静态网页的,而是动态网页从数据库读出来的东西!既然浏览器能显示,没道理,我们用代码解析不出我要的东西啊,那GOOGLE之流怎么搜索的?希望有详细说明,或是有例子或是推...
不是静态网页的,而是动态网页从数据库读出来的东西!既然浏览器能显示,没道理,我们用代码解析不出我要的东西啊,那GOOGLE之流怎么搜索的?希望有详细说明,或是有例子或是推荐相关技术文章也行。
展开
3个回答
展开全部
模拟浏览器行为,按照http协议像服务器发送请求,解析服务器返回内容,根据需要决定是否继续发送请求(比如获取该页面某个链接的内容?),如果遇到js只流,那你还要写个东东来解析js。。
总之,简单应用可以,复杂应用免谈。
Google之流的技术不是我们小作坊能比拟的。
百度cprops,这是一个c写的http库
总之,简单应用可以,复杂应用免谈。
Google之流的技术不是我们小作坊能比拟的。
百度cprops,这是一个c写的http库
本回答被提问者和网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
解析不到的,网页内容是在服务器已经生成后再传送到客户端,浏览器只是将接收到的内容显示出来而已
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
大体上有三种方法:
1、第一种是编写一个 HTTP 客户端程序,主动连接对端地址,并发送 GET 请求,然后接收响应。代码量较大,而且需要对 HTTP 协议非常熟知,不仅要处理 HTTP, 若是安全连接的网站,可能还要处理 HTTPS, 不建议采用;
2、第二种是使用外部工具,若你 Linux 下编程,可以在程序中调用 wget 命令,将请求的 URL 传入 wget 做为参数,并将返回的结果输出到一个指定的文件,然后去读取这个文件,分析返回的 HTML 源码即可;
3、第三种是使用 HTTP 库,比如 libcurl 库,网上有使用方法,使用起来很简单,推荐使用这种方法。
1、第一种是编写一个 HTTP 客户端程序,主动连接对端地址,并发送 GET 请求,然后接收响应。代码量较大,而且需要对 HTTP 协议非常熟知,不仅要处理 HTTP, 若是安全连接的网站,可能还要处理 HTTPS, 不建议采用;
2、第二种是使用外部工具,若你 Linux 下编程,可以在程序中调用 wget 命令,将请求的 URL 传入 wget 做为参数,并将返回的结果输出到一个指定的文件,然后去读取这个文件,分析返回的 HTML 源码即可;
3、第三种是使用 HTTP 库,比如 libcurl 库,网上有使用方法,使用起来很简单,推荐使用这种方法。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询