C#winform 抓取网页数据

新浪网上的网页用webclient.downstrin()下载下来之后发现是<tdstyle="width:105px;"><span>大单总成交量:</span></t... 新浪网上的网页
用webclient.downstrin()下载下来之后发现是
<td style="width:105px;"><span>大单总成交量:</span></td><td><!--@[totalvol]@-->股</td>
而不是
<td style="width:105px;"><span>大单总成交量:</span></td><td>10000000股</td>
导致无法获取数据。。
望懂HTML和JS的指导。。。如何取得数据
现在已经获取到了
<tbody>
<tr><td>收盘价:<h5><span style="color:#008000">13.28</span></h5></td><td>涨跌幅:<h6><span style="color:#008000">-0.82%</span></h6></td></tr>
<tr><td>前收价:13.39</td><td>开盘价:13.20</td></tr>
<tr><td>最高价:13.50</td><td>最低价:13.15</td></tr>
<tr><td>成交量(手):509161.38</td><td>成交额(千元):676441.47</td></tr></tbody>
求正则表达式来区分。希望将尖括号和尖括号里的字符删除。然后用正则表达式来取出数字,虽然可以用XML来操作了但感觉也方便不到哪去。用循环来判断太不专业了感觉,。。
展开
 我来答
xyz136299110
2012-06-17 · 超过60用户采纳过TA的回答
知道小有建树答主
回答量:251
采纳率:100%
帮助的人:145万
展开全部
这个需要你写正则的,一般的爬虫都是先用url从网络中抓取页面内容(包括html标签,广告等等),你需要写一个正则然后通过该正则来作一次匹配,这样才会得到你想要的内容的。
小羊说编程
2012-06-17 · 专注编程模式教学,提升大家实战经验
小羊说编程
采纳数:406 获赞数:1394

向TA提问 私信TA
展开全部
用HttpWebRequest 对象去请求页面 可以获取到网页的源代码内容
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 1条折叠回答
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式