C# 用html agility pack怎么获取网页上的纯文本 10
展开全部
using System;
using System.IO;
using HtmlAgilityPack;
class P{
static void Main(string[] args)
{
var web=new HtmlWeb();
var doc=web.Load("网址http://开头");
Console.WriteLine(doc.DocumentNode.InnerText);//输出网页的全部文本
}
}
追问
这个爬百度首页 出来的全是一大堆代码==为啥啊这是 我想要的是 新闻 网页 贴吧。。。这样的纯文本啊老师T T
追答
那你得先了解XPath 语法,了解你要抓取的部分的XPath。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询