C# 正则表达式 获取div里的内容 div内可能嵌套任何html标签
例如这样<divid="test"><div>哈哈</div><div><span>123123213</span></div><p>test1</p><ahref="h...
例如这样
<div id="test">
<div>哈哈</div>
<div><span>123123213</span></div>
<p>test1</p>
<a href="http://www.baidu.com">百度</a>
...............
</div>
我要获取的就是这部分
<div>哈哈</div>
<div><span>123123213</span></div>
<p>test1</p>
<a href="http://www.baidu.com">百度</a>
...............
...............代表任何html标签 展开
<div id="test">
<div>哈哈</div>
<div><span>123123213</span></div>
<p>test1</p>
<a href="http://www.baidu.com">百度</a>
...............
</div>
我要获取的就是这部分
<div>哈哈</div>
<div><span>123123213</span></div>
<p>test1</p>
<a href="http://www.baidu.com">百度</a>
...............
...............代表任何html标签 展开
展开全部
只是用正则的话,又没有任何特殊的特征,很难做的。换一种思路:这个字符串可以看成是xml,那你可以用xmldocumen 加载该字符串,然后通过解析xml来获取里面的字符串。(ps:这个思路够屌吧)
更多追问追答
追问
其实主要是做一个数据采集的 工作,所以获取到的字符串一个页面的所有源码,而我要从中截取这一段出来,关键,就是不知道怎么截取
追答
哦,你要分页网页特点,比如你要获取网页某一块的数据,那这块源代码前面可能会有id,后面也有唯一id,这样就能截取了
展开全部
js不就好了,通过document.getElementById("test").innerHTML。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
如果<a href="http://www.baidu.com">百度</a>是个固定不变的特征码,那就好办了
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询