最近想用C#做个小程序,然后涉及到利用正则表达式提取网页中的数据,不知道如何读取,内容如图:

我想提取其中第一行的“测绘学概论”,第二行的“1.0”,第三行的“专业必修”和第四行的“92.0”。希望大家能帮我回答下,谢谢啦~... 我想提取其中第一行的“测绘学概论”,第二行的“1.0”,第三行的“专业必修”和第四行的“92.0”。希望大家能帮我回答下,谢谢啦~ 展开
 我来答
Boursin_dm
2013-03-27
知道答主
回答量:7
采纳率:0%
帮助的人:6万
展开全部
你要提取的是字符串<td></td>之间的内容 那我们就可以设置你要比对的正则表达式为为:
"/^\<td [^>]*\>[\w]*\<\/td\>$/"
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
colinye1990
2013-03-26
知道答主
回答量:51
采纳率:0%
帮助的人:10.3万
展开全部
// str = html page

List<string> list = new List<string>();
Regex re = new Regex(@“>\w*<");
MatchCollection matches = re.Matches(str);
System.Collections.IEnumerator enu = matches.GetEnumerator();
while (enu.MoveNext() && enu.Current != null)
{
Match match = (Match)(enu.Current);
list.Add(match.Value.Substring(1, match.Value.Length-1));
}
本回答被网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式