C#提取HTML源码里制定内容问题 5

本人新手,想问下各位大神,如果我想要获取一下HTML源码里的“25日20:00-26日02:00”,“雨”,“19°C,17°C”,“无持续风向微风”这些内容,代码得怎么... 本人新手,想问下各位大神,如果我想要获取一下HTML源码里的“25日20:00-26日02:00”,“雨”,“19°C,17°C”,“无持续风向微风”这些内容,代码得怎么写?希望能有详细代码,谢谢!
下面是代码:
</h1>

<table border="0" cellpadding="0" cellspacing="0">

<tr>

<th>25日20:00-26日02:00</th>

</tr>

<tr>

<td><a target="_blank" href="xxx"> <img src="xxx"> </a></td>

</tr>

<tr>

<td><a class="heis" href="xxx" target="_blank">



</a></td>

</tr>

<tr>

<td><a href="xxxx" target="_blank">

19

℃</a>~<span><a href="xxxx" target="_blank">

17

℃</a></span></td>

</tr>

<tr>

<td><b><a href="xxxx" target="_blank">

无持续风向

微风

</a></b></td>

</tr>
展开
 我来答
暨半兰vd
2014-02-26 · TA获得超过327个赞
知道小有建树答主
回答量:187
采纳率:50%
帮助的人:162万
展开全部

正则表达式:

MatchCollection mc = Regex.Matches(text, @"<tr[^>]*>((?!</?tr)[\s\S])*</tr>", RegexOptions.IgnoreCase);
for (int p = 0; p < mc.Count; p++)
{
if(Regex.Replace(mc[p].Value.Contains("span"))
{
MatchCollection c = Regex.Matches(mc[p].Value, @"<a[^>]*>((?!</?a)[\s\S])*</a>", RegexOptions.IgnoreCase);
for (int n = 0; n < c.Count; n++)
{
Console.WriteLine(Regex.Replace(c[n].Value, @"\<a[^>]*>|<\/a>", "", RegexOptions.IgnoreCase));
}
}
Console.WriteLine(Regex.Replace(mc[p].Value, @"\<(tr|td|b|a|th|img)[^>]*>|<\/(tr|td|b|a|th)>", "", RegexOptions.IgnoreCase));
}
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
llyn23
2014-02-25 · TA获得超过5142个赞
知道大有可为答主
回答量:1831
采纳率:50%
帮助的人:1842万
展开全部

给你提供3种方案:

  1. Xpath

  2. 正则匹配

  3. HtmlAgilityPack的选择器

你要做天气预报吧,建议用WebService做,超简单:

http://webservice.webxml.com.cn/WebServices/WeatherWS.asmx

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式