c# 通过正则表达式提取html里的内容
divclass='1'><h2>啦啦啦</h2><ul><li><ahref="http://"target="_blank">问题</a>类似如此的内容,我想提取<h...
div class='1'>
<h2>啦啦啦</h2>
<ul>
<li><a href="http://" target="_blank">问题</a>
类似如此的内容, 我想提取<h2>的内容以及href的内容。
href的内容我是这么提取的 Regex reg = new Regex(@"(?is)<a[^>]*?href=([‘""]?)(?<url>[^‘""\s>]+)\1[^>]*>(?<text>(?:(?!</?a\b).)*)</a>");
就是还想加上h2的。
求大神帮忙,万分感谢 展开
<h2>啦啦啦</h2>
<ul>
<li><a href="http://" target="_blank">问题</a>
类似如此的内容, 我想提取<h2>的内容以及href的内容。
href的内容我是这么提取的 Regex reg = new Regex(@"(?is)<a[^>]*?href=([‘""]?)(?<url>[^‘""\s>]+)\1[^>]*>(?<text>(?:(?!</?a\b).)*)</a>");
就是还想加上h2的。
求大神帮忙,万分感谢 展开
1个回答
展开全部
var html = @"div class='1'>
<h2>啦啦啦</h2>
<ul>
<li><a href=""http://"" target=""_blank"">问题</a>";
var pattern = @"<h2>(?<title>.*?)</h2>.*(\r\n.*)*<a\shref=""(?<url>.*?)""";
var match = System.Text.RegularExpressions.Regex.Match(html, pattern);
if (match.Success)
{
var title = match.Groups["title"].Value;
var url = match.Groups["url"].Value;
}
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询