C# HTML agility pack 网络爬虫怎么读txt文件里的网址 10

C#用HTMLagilitypack进行网络爬虫可以将多个网址保存在txt里然后读这个txt获取网址吗?可以的话代码怎么写?... C# 用HTML agility pack 进行网络爬虫 可以将多个网址保存在txt里 然后读这个txt获取网址吗?可以的话代码怎么写? 展开
 我来答
lrh3321
2015-03-24 · TA获得超过2183个赞
知道大有可为答主
回答量:2296
采纳率:75%
帮助的人:2118万
展开全部
 using System;
 using System.IO;
 using HtmlAgilityPack;
 class P{
 static void Main(string[] args)
        {
var urls=File.ReadAllLines("1.txt");// http:// 开头的网址,每输入一个,换行输入下一个
var web=new HtmlWeb();
foreach(var url in urls){
var doc=web.Load(url);
Console.WriteLine(doc.DocumentNode.OuterHtml);
}
}
}
更多追问追答
追问
可不可以读第一个网址 输出我想要的节点里的文本 然后再读下一个网址 输出下一个网址里的相同节点里的文本?
追答
当然可以,自己学习XPath语法,用HtmlNode 的SelectSingleNode方法
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式