c# 正则表达式抽取网页问题

原网页部分源码：<divclass="blkContainerSblkCon"id="artibody">
<p>　　本报讯据央广新闻报道卫生部公开<a href="http://news.sina.com.cn/c/p/2011-12-14/023323627445.shtml" target="_blank">征集地沟油检测方法</a>于前天截止，共征集到近300种检测方法。相关负责人表示，公众提供的检测方法是否可行，还需要经过严格的专家验证。</p>
<p>　　<strong>检测方法要逐一筛选</strong></p>
<p>　　<strong>■ 他山之石</strong></p>
<div style="margin-right: 0px; margin-left: 0pt; padding-right: 0px;" class="blkComment otherContent_01">
<style>
.blkComment p a:link{text-decoration:none}
.blkComment p a:hover{text-decoration:underline}
</style>。。。。后面省略很多难处理的标签
<div>
我想抽取<div class="blkContainerSblkCon" id="artibody">。。。<div>之间的全文：
content = getRegex.GetRegexGroup(newsCode, @"<div\sclass=""blkContainerSblkCon""\sid=""artibody"">(?<content>[^<]*?)<div\sstyle=""margin-right[^<]*""\s*class=""[^<]*"">", "content");
实在看不出什么问题啊！！！
附GetRegexGroup方法：
public string GetRegexGroup(string inputStr, string pattern, string groupName)
{
// \B 不是字边界任意位置
try
{
string returnStr = "";
MatchCollection mc = Regex.Matches(inputStr, pattern, RegexOptions.IgnoreCase);
foreach (Match m in mc)
{
returnStr += m.Groups[groupName].Value;
}
return returnStr;
}
catch (Exception e)
{
return e.Message;
}
} 展开

 我来答

1个回答

#热议# 普通体检能查出癌症吗？

VanSean
2012-01-04

知道答主

回答量：7

采纳率：0%

帮助的人：11.9万

我也去答题访问个人页

关注

展开全部

把@去掉试试？或者@"<div class="blkContainerSblkCon" id="artibody">...直接输出

本回答由提问者推荐

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

c# 正则表达式抽取网页问题

为你推荐：