C#提取HTML源码里制定内容问题 5
本人新手,想问下各位大神,如果我想要获取一下HTML源码里的“25日20:00-26日02:00”,“雨”,“19°C,17°C”,“无持续风向微风”这些内容,代码得怎么...
本人新手,想问下各位大神,如果我想要获取一下HTML源码里的“25日20:00-26日02:00”,“雨”,“19°C,17°C”,“无持续风向微风”这些内容,代码得怎么写?希望能有详细代码,谢谢!
下面是代码:
</h1>
<table border="0" cellpadding="0" cellspacing="0">
<tr>
<th>25日20:00-26日02:00</th>
</tr>
<tr>
<td><a target="_blank" href="xxx"> <img src="xxx"> </a></td>
</tr>
<tr>
<td><a class="heis" href="xxx" target="_blank">
雨
</a></td>
</tr>
<tr>
<td><a href="xxxx" target="_blank">
19
℃</a>~<span><a href="xxxx" target="_blank">
17
℃</a></span></td>
</tr>
<tr>
<td><b><a href="xxxx" target="_blank">
无持续风向
微风
</a></b></td>
</tr> 展开
下面是代码:
</h1>
<table border="0" cellpadding="0" cellspacing="0">
<tr>
<th>25日20:00-26日02:00</th>
</tr>
<tr>
<td><a target="_blank" href="xxx"> <img src="xxx"> </a></td>
</tr>
<tr>
<td><a class="heis" href="xxx" target="_blank">
雨
</a></td>
</tr>
<tr>
<td><a href="xxxx" target="_blank">
19
℃</a>~<span><a href="xxxx" target="_blank">
17
℃</a></span></td>
</tr>
<tr>
<td><b><a href="xxxx" target="_blank">
无持续风向
微风
</a></b></td>
</tr> 展开
展开全部
正则表达式:
MatchCollection mc = Regex.Matches(text, @"<tr[^>]*>((?!</?tr)[\s\S])*</tr>", RegexOptions.IgnoreCase);
for (int p = 0; p < mc.Count; p++)
{
if(Regex.Replace(mc[p].Value.Contains("span"))
{
MatchCollection c = Regex.Matches(mc[p].Value, @"<a[^>]*>((?!</?a)[\s\S])*</a>", RegexOptions.IgnoreCase);
for (int n = 0; n < c.Count; n++)
{
Console.WriteLine(Regex.Replace(c[n].Value, @"\<a[^>]*>|<\/a>", "", RegexOptions.IgnoreCase));
}
}
Console.WriteLine(Regex.Replace(mc[p].Value, @"\<(tr|td|b|a|th|img)[^>]*>|<\/(tr|td|b|a|th)>", "", RegexOptions.IgnoreCase));
}
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
给你提供3种方案:
Xpath
正则匹配
HtmlAgilityPack的选择器
你要做天气预报吧,建议用WebService做,超简单:
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询