最近想用C#做个小程序,然后涉及到利用正则表达式提取网页中的数据,不知道如何读取,内容如图:
我想提取其中第一行的“测绘学概论”,第二行的“1.0”,第三行的“专业必修”和第四行的“92.0”。希望大家能帮我回答下,谢谢啦~...
我想提取其中第一行的“测绘学概论”,第二行的“1.0”,第三行的“专业必修”和第四行的“92.0”。希望大家能帮我回答下,谢谢啦~
展开
2个回答
展开全部
你要提取的是字符串<td></td>之间的内容 那我们就可以设置你要比对的正则表达式为为:
"/^\<td [^>]*\>[\w]*\<\/td\>$/"
"/^\<td [^>]*\>[\w]*\<\/td\>$/"
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
// str = html page
List<string> list = new List<string>();
Regex re = new Regex(@“>\w*<");
MatchCollection matches = re.Matches(str);
System.Collections.IEnumerator enu = matches.GetEnumerator();
while (enu.MoveNext() && enu.Current != null)
{
Match match = (Match)(enu.Current);
list.Add(match.Value.Substring(1, match.Value.Length-1));
}
List<string> list = new List<string>();
Regex re = new Regex(@“>\w*<");
MatchCollection matches = re.Matches(str);
System.Collections.IEnumerator enu = matches.GetEnumerator();
while (enu.MoveNext() && enu.Current != null)
{
Match match = (Match)(enu.Current);
list.Add(match.Value.Substring(1, match.Value.Length-1));
}
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询