asp.net中如何一起获取多个a里面的内容,比如<a id="g" href="">xxx</a>这个xxx 该怎样获取呢? 5
展开全部
可以使用正则表达式来解决:
using System.Text.RegularExpressions;//使用正则表达式需引用。
调用方法
string aa="你要截取字段内容";
aa= aa.Replace("\n", "");
aa= aa.Replace("\r", "");//先去掉换行符;
aa= aa.Replace(aa, "<a.*?>", "<a>", RegexOptions.IgnoreCase);//去掉<a 中的XXXX>
List<string> mylist=ArrParser(aa,"<a>.*?</a>",".*?");
/// <summary>
/// 一组文字解析
/// </summary>
/// <param name="txt">要解析的内容</param>
/// <param name="pattern">解析的格式</param>
/// <param name="SplitTxt">分隔符默认为.*?</param>
/// <returns></returns>
public static List<string> ArrParser(string txt, string pattern, string SplitTxt = ".*?")
{
List<string> mylist = new List<string>();
MatchCollection mc = Regex.Matches(txt, pattern, RegexOptions.IgnoreCase);
for (int i = 0; i < mc.Count; i++)
{
string itemtxt = mc[i].ToString();
pattern = pattern.Replace(SplitTxt, "‖");
string[] list = pattern.Split('‖');
for (int j = 0; j < list.Length; j++)
{
Regex regex = new Regex(@list[j], RegexOptions.IgnoreCase);
itemtxt = regex.Replace(itemtxt, "");
}
mylist.Add(itemtxt);
}
return mylist;
}
using System.Text.RegularExpressions;//使用正则表达式需引用。
调用方法
string aa="你要截取字段内容";
aa= aa.Replace("\n", "");
aa= aa.Replace("\r", "");//先去掉换行符;
aa= aa.Replace(aa, "<a.*?>", "<a>", RegexOptions.IgnoreCase);//去掉<a 中的XXXX>
List<string> mylist=ArrParser(aa,"<a>.*?</a>",".*?");
/// <summary>
/// 一组文字解析
/// </summary>
/// <param name="txt">要解析的内容</param>
/// <param name="pattern">解析的格式</param>
/// <param name="SplitTxt">分隔符默认为.*?</param>
/// <returns></returns>
public static List<string> ArrParser(string txt, string pattern, string SplitTxt = ".*?")
{
List<string> mylist = new List<string>();
MatchCollection mc = Regex.Matches(txt, pattern, RegexOptions.IgnoreCase);
for (int i = 0; i < mc.Count; i++)
{
string itemtxt = mc[i].ToString();
pattern = pattern.Replace(SplitTxt, "‖");
string[] list = pattern.Split('‖');
for (int j = 0; j < list.Length; j++)
{
Regex regex = new Regex(@list[j], RegexOptions.IgnoreCase);
itemtxt = regex.Replace(itemtxt, "");
}
mylist.Add(itemtxt);
}
return mylist;
}
追问
有没有不用正则表达式和js的做法
追答
js 的没写过,不过原理应该一样。他也支持正则,可能没C#操作方便。
如果那上面的是你网页中的代码就可以不用正则,直接给那批一个有规律的ID循环一下把他的innerHTML/innerText读出来。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询