url在java中如何用正则匹配?????????????? 5
这是爬取得一些网址,现在我想把含有bbs的网址过滤到??请问有没有方法可以做到,我用的是java编写的程序,如何用正则过滤它呢?...
这是爬取得一些网址,现在我想把含有bbs的网址过滤到??请问有没有方法可以做到,我用的是java编写的程序,如何用正则过滤它呢?
展开
1个回答
展开全部
这需要用到正则吗?直接 url.contains("bbs") 不就行了:
public class Test {
public static void main(String[] args) {
String url = "http://www.xxx.aaa.cn/bbs/topic/xxx";
System.out.println(url.contains("bbs"));
}
}
一定要正则的话可以这样:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class CopyOfTest {
public static void main(String[] args) {
String[] urls = {
"http://www.xxx.aaa.cn/bbs/topic/xxx",
"http://www.xxx.aaa.com/bbs/topic/xxx",
"http://www.yyy.bbb.cn/aas/xxx/xxx/x"
};
String regex = "/bbs";
Pattern p = Pattern.compile(regex);
for(String url : urls) {
Matcher m = p.matcher(url);
if(m.find()) {
System.out.println(url);
}
}
}
}
追问
你太牛了,大神,我能不能请教一下您关于网络爬虫的问题呢,我刚实习,经理让我写爬虫,对我来说庭困难的
追答
私信给qq我加你。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询