C# 正则表达式提取href里面的连接
最好能过滤掉例如(空格、JPG、GIF、EXE)这样的连接是排除exe|jpg|gif。。。。这类的,就是说不抓取jpg这类结尾的...
最好能过滤掉例如(空格、JPG、GIF、EXE)这样的连接
是排除exe|jpg|gif。。。。这类的,就是说不抓取jpg这类结尾的 展开
是排除exe|jpg|gif。。。。这类的,就是说不抓取jpg这类结尾的 展开
展开全部
using System.Text.RegularExpressions;
using System.Collections.Generic;
public static long GetHref(string html)
{
List<String> links = new List<String>();
MatchCollection matches = Regex.Matches(html, @"(href|src)=""(?<href>\S+?(jpg|gif|exe))""", RegexOptions.IgnoreCase);
foreach(Match match in matches)
{
links.Add(match.Groups["href"].Value);
}
return links;
}
再试试
using System.Collections.Generic;
public static long GetHref(string html)
{
List<String> links = new List<String>();
MatchCollection matches = Regex.Matches(html, @"(href|src)=""(?<href>\S+?(jpg|gif|exe))""", RegexOptions.IgnoreCase);
foreach(Match match in matches)
{
links.Add(match.Groups["href"].Value);
}
return links;
}
再试试
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询