C# 正则表达式 提取URL并保存 5
目前在做一个简单的网络爬虫,但是在URL过滤这里遇到点麻烦希望大家帮我解决一下,谢谢了!1.先从网页的源码中,把所有herf后面的URL地址提取出来,必须是以http开头...
目前在做一个简单的网络爬虫,但是在URL过滤这里遇到点麻烦 希望大家帮我解决一下,谢谢了!
1.先从网页的源码中,把所有herf后面的URL地址提取出来,必须是以http开头的地址
2.在提取出来的URL地址中,保留满足这个正则表达式(http://companyadc\.51job\.com/companyads/2\d{3}/\w{2,6}/\w*\d{4}_\d{4}/index\.htm)的URL,其他的删除。
3.将保留的URL保存到桌面的一个文本文件中
请问这3个步骤用C#分别应该怎么实现啊? 展开
1.先从网页的源码中,把所有herf后面的URL地址提取出来,必须是以http开头的地址
2.在提取出来的URL地址中,保留满足这个正则表达式(http://companyadc\.51job\.com/companyads/2\d{3}/\w{2,6}/\w*\d{4}_\d{4}/index\.htm)的URL,其他的删除。
3.将保留的URL保存到桌面的一个文本文件中
请问这3个步骤用C#分别应该怎么实现啊? 展开
5个回答
展开全部
分太少了。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
2009-11-05
展开全部
这么多问题,居然一分都没有???
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
用一个就行了吧
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询