c#正则提取html源码内的信息

我想提取<html><body><divclass="modulezoom"><divclass="module-edit"><aonclick="perfectinfo... 我想提取
<html>
<body>
<div class="module zoom">
<div class="module-edit">
<a onclick="perfectinfotempletdata('people')" href="javascript:void(0);">编辑信息模块</a>
</div>
<table><tr>
<td>
<strong>中文名:</strong>
<span>姚明</span>
</td>
<td class="jg"/>
<td>
<strong>英文名:</strong>
<span>YaoMing</span>
</td> </tr> <tr>
。。。。

中的“姚明”两个字不需要“中文名”等其他的字,用正则Regex reg2 = new Regex(@"<strong>中文名:</strong><span>([\S\s]*?)</span>");总是匹配不成功,期望得到解答,谢谢!!
已经得到整个页面源码,这只是页面中的一小段。
展开
 我来答
云上他
2014-04-25 · TA获得超过3551个赞
知道小有建树答主
回答量:1499
采纳率:0%
帮助的人:793万
展开全部

第一种,修改你的,因为</strong>后有回车换行空格等空白字符,需要\s*

正则表达式:<strong>中文名:</strong>\s*<span>([\S\s]*?)</span>


第二种,直接匹配出名字

正则表达式:(?<=中文名:</strong>\s*<span>)[^<]+

cpudotorg
2014-04-25 · TA获得超过282个赞
知道小有建树答主
回答量:380
采纳率:0%
帮助的人:247万
展开全部
<span>(.+?)<
追问
这样的话把“YaoMing”也去出来了呢,如果我只想要“姚明”两个字呢
追答
中.+?(.+?)<
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式