求一个正则表达式取出htm页面中所有标签的id,最好能带C#的解析程序,能完美解决追加分
展开全部
//定义用于匹配的正则表达式.注意:id的前面有个空格
string Pattner = " id=\"(?<value>.*?)\"";
//以下为C#程序
//定义去匹配文本的正则对象
System.Text.RegularExpressions.Regex regex = new System.Text.RegularExpressions.Regex(Pattner);
//你的HTML源码
string htmlSource = "<body id=\"lexunbody\"><div id=\"append_parent\"></div>id=\"4\"<div id=\"ajaxwaitid\"></div><div id=\"box\" class=\"lx2012_lt\">....";
//进行匹配操作
System.Text.RegularExpressions.MatchCollection mc = regex.Matches(htmlSource);
if (mc != null)
{
//循环输出每个ID的值
foreach (System.Text.RegularExpressions.Match m in mc)
{
MessageBox.Show(m.Groups["value"].Value);
}
}
有什么不明白再问
string Pattner = " id=\"(?<value>.*?)\"";
//以下为C#程序
//定义去匹配文本的正则对象
System.Text.RegularExpressions.Regex regex = new System.Text.RegularExpressions.Regex(Pattner);
//你的HTML源码
string htmlSource = "<body id=\"lexunbody\"><div id=\"append_parent\"></div>id=\"4\"<div id=\"ajaxwaitid\"></div><div id=\"box\" class=\"lx2012_lt\">....";
//进行匹配操作
System.Text.RegularExpressions.MatchCollection mc = regex.Matches(htmlSource);
if (mc != null)
{
//循环输出每个ID的值
foreach (System.Text.RegularExpressions.Match m in mc)
{
MessageBox.Show(m.Groups["value"].Value);
}
}
有什么不明白再问
追问
如果我还想取到前面的标签类型呢,怎么做?大哥有QQ么,帮帮忙哈
追答
QQ:307482311
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询