C# 正则表达式提取href里面的连接

最好能过滤掉例如(空格、JPG、GIF、EXE)这样的连接是排除exe|jpg|gif。。。。这类的,就是说不抓取jpg这类结尾的... 最好能过滤掉例如(空格、JPG、GIF、EXE)这样的连接
是排除exe|jpg|gif。。。。这类的,就是说不抓取jpg这类结尾的
展开
 我来答
凌清晖2d
推荐于2016-04-30 · TA获得超过174个赞
知道小有建树答主
回答量:105
采纳率:0%
帮助的人:87.2万
展开全部
using System.Text.RegularExpressions;
using System.Collections.Generic;

public static long GetHref(string html)
{
List<String> links = new List<String>();
MatchCollection matches = Regex.Matches(html, @"(href|src)=""(?<href>\S+?(jpg|gif|exe))""", RegexOptions.IgnoreCase);
foreach(Match match in matches)
{
links.Add(match.Groups["href"].Value);
}
return links;
}
再试试
本回答被提问者采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式