c# 通过正则表达式提取html里的内容

divclass='1'><h2>啦啦啦</h2><ul><li><ahref="http://"target="_blank">问题</a>类似如此的内容,我想提取<h... div class='1'>
<h2>啦啦啦</h2>
<ul>
<li><a href="http://" target="_blank">问题</a>
类似如此的内容, 我想提取<h2>的内容以及href的内容。
href的内容我是这么提取的 Regex reg = new Regex(@"(?is)<a[^>]*?href=([‘""]?)(?<url>[^‘""\s>]+)\1[^>]*>(?<text>(?:(?!</?a\b).)*)</a>");
就是还想加上h2的。
求大神帮忙,万分感谢
展开
 我来答
夔穹0HQ
2018-01-13 · TA获得超过523个赞
知道小有建树答主
回答量:218
采纳率:88%
帮助的人:87.7万
展开全部
var html = @"div class='1'>
    <h2>啦啦啦</h2>
    <ul>
    <li><a href=""http://"" target=""_blank"">问题</a>";

var pattern = @"<h2>(?<title>.*?)</h2>.*(\r\n.*)*<a\shref=""(?<url>.*?)""";
var match = System.Text.RegularExpressions.Regex.Match(html, pattern);
if (match.Success)
{
    var title = match.Groups["title"].Value;
    var url = match.Groups["url"].Value;
}
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式