C# HTML agility pack 网络爬虫怎么读txt文件里的网址 10
C#用HTMLagilitypack进行网络爬虫可以将多个网址保存在txt里然后读这个txt获取网址吗?可以的话代码怎么写?...
C# 用HTML agility pack 进行网络爬虫 可以将多个网址保存在txt里 然后读这个txt获取网址吗?可以的话代码怎么写?
展开
1个回答
展开全部
using System;
using System.IO;
using HtmlAgilityPack;
class P{
static void Main(string[] args)
{
var urls=File.ReadAllLines("1.txt");// http:// 开头的网址,每输入一个,换行输入下一个
var web=new HtmlWeb();
foreach(var url in urls){
var doc=web.Load(url);
Console.WriteLine(doc.DocumentNode.OuterHtml);
}
}
}
更多追问追答
追问
可不可以读第一个网址 输出我想要的节点里的文本 然后再读下一个网址 输出下一个网址里的相同节点里的文本?
追答
当然可以,自己学习XPath语法,用HtmlNode 的SelectSingleNode方法
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询