用正则表达式 取出html文件中的加粗的文字和文件中的超链接
2个回答
推荐于2016-07-29
展开全部
String str = "加粗字一般是在<h1>..</h1>中间的 超链接一般以http://...开头";
String reg1 = "(?i)<h1[^>]*>((?!<\\/h1>)[\\s\\S])*)<\\/h1>";
String reg2 = "(https?:\\/\\/)?([\\da-z\\.-]+)\\.([a-z\\.]{2,6})([\\/\\w\\x20\\.-]*)*\\/?";
Pattern p = Pattern.compile(reg1);// for reg2 else
Matcher m = p.matcher(str);
while(m.find()){
System.out.println(m.group());
}
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询