Java怎么使用正则匹配Jsp页面中的链接资源(包括Jsp、Js、css、图片等)
1个回答
展开全部
这个是需要观察你要匹配的资源的规律
用java里的java.util.regex.Pattern和java.util.regex.Matcher
给你个我写的例子啊
// 抓取文章标题
private String getTitle(String html) {
String patternStrs = "<h1>([^</h1>]*)";//匹配的正则表达式
Pattern pattern = Pattern.compile(patternStrs);
Matcher matcher = pattern.matcher(html);
String str = "";
while (matcher.find()) {
str = matcher.group(1);
}
return str;
}
在这个例子中因为我的所有的文章的标题都是用h1标签的,所以就去检查有没有h1标签就行了
// 抓取文章内容
private String getContent(String html) {
String patternStrs3 = "<P\\s*.*>([^</P>]*)";
Pattern pattern3 = Pattern.compile(patternStrs3);
Matcher matcher3 = pattern3.matcher(html);
StringBuffer str = new StringBuffer("");
while (matcher3.find()) {
// System.out.println(matcher3.group());
str.append(matcher3.group());
}
return str.toString();
}
这个例子里是文章都在<p>标签里,道理跟上面一样
楼主完全可以根据这两个例子写出来,主要还是要找出你的资源的匹配规律,要没规律,就很难匹配了
用java里的java.util.regex.Pattern和java.util.regex.Matcher
给你个我写的例子啊
// 抓取文章标题
private String getTitle(String html) {
String patternStrs = "<h1>([^</h1>]*)";//匹配的正则表达式
Pattern pattern = Pattern.compile(patternStrs);
Matcher matcher = pattern.matcher(html);
String str = "";
while (matcher.find()) {
str = matcher.group(1);
}
return str;
}
在这个例子中因为我的所有的文章的标题都是用h1标签的,所以就去检查有没有h1标签就行了
// 抓取文章内容
private String getContent(String html) {
String patternStrs3 = "<P\\s*.*>([^</P>]*)";
Pattern pattern3 = Pattern.compile(patternStrs3);
Matcher matcher3 = pattern3.matcher(html);
StringBuffer str = new StringBuffer("");
while (matcher3.find()) {
// System.out.println(matcher3.group());
str.append(matcher3.group());
}
return str.toString();
}
这个例子里是文章都在<p>标签里,道理跟上面一样
楼主完全可以根据这两个例子写出来,主要还是要找出你的资源的匹配规律,要没规律,就很难匹配了
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询