java里面利用正则表达式,对匹配到的结果进行操作时,卡死在函数里面了。函数如下: 30

Patternp=Pattern.compile("(?<=(href=\")).*?(?=\")");//匹配规则Matchermyurl=p.matcher(Cont... Pattern p = Pattern.compile("(?<=(href=\")).*?(?=\")");//匹配规则
Matcher myurl = p.matcher(ContentArea);//匹配对象
while(myurl.find())
{
String url=myurl.group();
System.out.println("group:"+url);
if(url.contains("http://"))
{
System.out.println("group2:"+url);
//this.allUrls.add(url);//多了这句就会卡在函数里面,只输出一个结果
}
}
展开
 我来答
匿名用户
2013-01-28
展开全部
出现异常了吗,allUrls可能没有初始化,整个代码贴出来把。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
匿名用户
2013-01-28
展开全部
allUrls 是什么对象。

另外,ContentArea 有什么例子用来测试
追问
allUrls是ArrayList
ContentArea就是抓取网页的body部分。
我自己调试了一下,发现myurl.group();返回的是所有符合规则的结果。直接print出来就是很多个url。但是上述代码一样,输入来的确是:
group+url1
group2+url1
group+url2
group2+url2
...
其实我的目的就是获取网页里面的二级链接而已。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式