C#正则表达式匹配提取网页内容到数组,求指导
<tr><tdheight="16"width="120"align="center"><fontface="宋体">100432002000001</font></td...
<tr>
<tdheight="16"width="120"align="center"><fontface="宋体">100432002000001</font></td>
<tdclass="xl24"height="16"width="55"align="center"><fontface="宋体"><ahref="02boshi/1.htm"target="_blank">周丽丽</a></font></td>
<tdclass="xl24"height="16"width="42"align="center"><fontface="宋体">女</font></td>
<tdclass="xl24"height="16"width="112"align="center"><fontface="宋体">运动人体科学</font></td>
<tdclass="xl24"height="16"width="69"align="center"><fontface="宋体">杨则宜</font></td>
</tr>
<tr>
<tdheight="16"width="120"align="center"><fontface="宋体">100432002000002</font></td>
<tdclass="xl24"height="16"width="55"align="center"><fontface="宋体"><ahref="02boshi/2.htm"target="_blank">洪长青</a></font></td>
<tdclass="xl24"height="16"width="42"align="center"><fontface="宋体">男</font></td>
<tdclass="xl24"height="16"width="112"align="center"><fontface="宋体">运动人体科学</font></td>
<tdclass="xl24"height="16"width="69"align="center"><fontface="宋体">谢敏豪</font></td>
</tr>
想从这段代码中仅仅提取100432002000001和100432002000002并放入数组,请问该怎么写正则表达式? 展开
<tdheight="16"width="120"align="center"><fontface="宋体">100432002000001</font></td>
<tdclass="xl24"height="16"width="55"align="center"><fontface="宋体"><ahref="02boshi/1.htm"target="_blank">周丽丽</a></font></td>
<tdclass="xl24"height="16"width="42"align="center"><fontface="宋体">女</font></td>
<tdclass="xl24"height="16"width="112"align="center"><fontface="宋体">运动人体科学</font></td>
<tdclass="xl24"height="16"width="69"align="center"><fontface="宋体">杨则宜</font></td>
</tr>
<tr>
<tdheight="16"width="120"align="center"><fontface="宋体">100432002000002</font></td>
<tdclass="xl24"height="16"width="55"align="center"><fontface="宋体"><ahref="02boshi/2.htm"target="_blank">洪长青</a></font></td>
<tdclass="xl24"height="16"width="42"align="center"><fontface="宋体">男</font></td>
<tdclass="xl24"height="16"width="112"align="center"><fontface="宋体">运动人体科学</font></td>
<tdclass="xl24"height="16"width="69"align="center"><fontface="宋体">谢敏豪</font></td>
</tr>
想从这段代码中仅仅提取100432002000001和100432002000002并放入数组,请问该怎么写正则表达式? 展开
3个回答
展开全部
1.先正向匹配,匹配出
<tdheight="16"width="120"align="center"><fontface="宋体">100432002000001</font></td>
<tdheight="16"width="120"align="center"><fontface="宋体">100432002000002</font></td>
表达式为:
<tdheight="16"width="120"align="center"><fontface="宋体">(.*)?</font></td>
2.匹配出数字
表达式为:
[0-9]{15}
<tdheight="16"width="120"align="center"><fontface="宋体">100432002000001</font></td>
<tdheight="16"width="120"align="center"><fontface="宋体">100432002000002</font></td>
表达式为:
<tdheight="16"width="120"align="center"><fontface="宋体">(.*)?</font></td>
2.匹配出数字
表达式为:
[0-9]{15}
追问
其实直接匹配数字就行了,谢谢!
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
呵呵,这个很简单,如果你提取的位数是一定的话
string str= "[0-9]{15}"
string str= "[0-9]{15}"
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
2012-10-31
展开全部
\d{5,}
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询