如何通过C#正则表达式抓取表格标签中的所有HTML代码?
2个回答
展开全部
你是要抓取什么
抓取<td>xxx</td>里面xx部分还是什么
如果是的话
正则匹配
首先获取到这个table的内容
c#正则 "<tbody>.*?</tbody>"
然后用"</td>(.*?)</td>"匹配上个正则匹配到的内容
最后遍历获取的<td>
用字符串函数去掉<td>和</td>就是中间的内容了
抓取<td>xxx</td>里面xx部分还是什么
如果是的话
正则匹配
首先获取到这个table的内容
c#正则 "<tbody>.*?</tbody>"
然后用"</td>(.*?)</td>"匹配上个正则匹配到的内容
最后遍历获取的<td>
用字符串函数去掉<td>和</td>就是中间的内容了
追问
和之间所有的代码
追答
匹配和的话 用 ".*?"就行了
然后得到的字符串包括这些也在里面
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询