c#利用WebClient和WebRequest获取网页源代码

 我来答
科创17
2022-10-30 · TA获得超过5901个赞
知道小有建树答主
回答量:2846
采纳率:100%
帮助的人:175万
展开全部

  C#中一般是可以利用WebClient类和WebRequest类获取网页源代码 下面分别说明这两种方法的实现

  WebClient类获取网页源代码

  WebClient类

  WebClient类位于System Net命名空间下 WebClient类提供向URI标识的任何本地 Intranet或Internet资源发送数据以及从这些资源接收数据的公共方法

  源代码

  ///引用命名空间

  using System IO;

  using System Net;

  using System Text;

  PageUrl = webkaka ; //需要获取源代码的网页

  WebClient wc = new WebClient(); // 创建WebClient实例提供向URI 标识的资源发送数据和从URI 标识的资源接收数据

  wc Credentials = CredentialCache DefaultCredentials; // 获取或设置用于对向 Internet 资源的请求进行身份验证的网络凭据

  ///方法一

  Encoding enc = Encoding GetEncoding( GB ); // 如果是乱码就改成 utf / GB

  Byte[] pageData = wc DownloadData(PageUrl); // 从资源下载数据并返回字节数组

  ContentHtml Text = enc GetString(pageData); // 输出字符串(HTML代码) ContentHtml为Multiline模式的TextBox控件

  /// 方法二

  /// ***************代码开始**********

  /// Stream resStream = wc OpenRead(PageUrl); //以流的形式打开URL

  /// Encoding enc = Encoding GetEncoding( GB ); // 如果是乱码就改成 utf / GB

  /// StreamReader sr = new StreamReader(resStream enc); //以指定的编码方式读取数据流

  /// ContentHtml Text = sr ReadToEnd(); //输出(HTML代码) ContentHtml为Multiline模式的TextBox控件

  /// resStream Close();

  /// **************代码结束********

  ///

  wc Dispose();

  WebRequest类获取网页源代码

  WebRequest类

  WebRequest类是 NET Framework中 请求/响应 模型的abstract基类 用于访问Internet数据 使用WebRequest类请求/响应模型的应用程序可以用协议不可知的方式从Internet请求数据 在这种方式下 应用程序处理WebRequest类的实例 而协议特定的子类则执行请求的具体细节 请求从应用程序发送到某个特定的URI 如服务器上的网页 URI从一个为应用程序注册的WebRequest子类列表中确定要创建的适当子类 注册WebRequest子类通常是为了处理某个特定的协议(如HTTP或FTP) 但是也可以注册它以处理对特定服务器或服务器上的路径的请求

  WebRequest类中最常用的是Create方法 Create方法用于为指定的URI方案初始化新的WebRequest实例

  语法

  public static WebRequest Create

  (

  string requestUriString

  )

  参数

  requestUriString 标识Internet资源的URI

  返回值 特定URI方案的WebRequest子类

  注意 Create方法将运行时确定的WebRequest类的子类作为与requestUri最接近的注册匹配项返回 例如 当//开头的URI在requestUri中传递时 由Create返回一个HttpWebRequest 如果改为传递以file://开头的URI 则Create方法将返回FileWebRequest实例 NET Framework包括//和file:// URI方案的支持

  WebResponse类

  WebResponse类是abstract基类 协议特定的响应类从该抽象基类派生 应用程序可以使用 WebResponse类的实例以协议不可知的方式参与请求和响应事务 而从WebResponse类派生的协议特定的类携带请求的详细信息

  在WebResponse类中最常用的是GetResponse方法 GetResponse方法用于当在子类中被重写时 返回对 Internet 请求的响应

  语法

  public virtual WebResponse GetResponse ()

  返回值 包含对Internet请求的响应的WebResponse

  源代码

  ///引用命名空间

  using System IO;

  using System Net;

  using System Text;

  PageUrl = ; //需要获取源代码的网页

  WebRequest request = WebRequest Create(PageUrl); //WebRequest Create方法 返回WebRequest的子类HttpWebRequest

  WebResponse response = request GetResponse(); //WebRequest GetResponse方法 返回对 Internet 请求的响应

  Stream resStream = response GetResponseStream(); //WebResponse GetResponseStream 方法 从 Internet 资源返回数据流

  Encoding enc = Encoding GetEncoding( GB ); // 如果是乱码就改成 utf / GB

  StreamReader sr = new StreamReader(resStream enc); //命名空间:System IO StreamReader 类实现一个 TextReader (TextReader类 表示可读取连续字符系列的读取器) 使其以一种特定的编码从字节流中读取字符

  ContentHtml Text = sr ReadToEnd(); //输出(HTML代码) ContentHtml为Multiline模式的TextBox控件

  resStream Close();

lishixinzhi/Article/program/net/201311/13576

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式