java正则表达式获取整个class中的内容
java正则表达式获取该class="busBox1"中所有的数据,例如href或者标题,新手求指导。...
java正则表达式获取该class="busBox1"中所有的数据,例如href或者标题,新手求指导。
展开
2017-08-15
展开全部
String reg1 = "(?i)<div[^>]+class[=\"\']+busBox1[\"\']?[^>]*>((?:(?!<\\/div>)[\\s\\S])*<\\/div>){4}";
String reg2 = "(?i)<a[^>]+href[=\"\']+([^\"\']+)[\"\'][^>]*>((?:(?!<\\/a>)[\\s\\S])*)<\\/a>";
String html = "";
Pattern p = Pattern.compile(reg1);
Matcher m = p.matcher(html);
while(m.find()){
String g = m.group();
Pattern px = Pattern.compile(reg2);
Matcher mx = px.matcher(g);
while(mx.find()){
String href = mx.group(1);
String title = mx.group(2);
// TODO
}
}
本回答被提问者和网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
2017-08-15
展开全部
还不如分析HTML的 DOM。。。。。。或者按字符串拆分
~
~
~
~
~
~
追问
字符串拆分?
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询