java中,如何提取网页的指定内容

比如网页的源代码中出现多次<class>123<br><class>acx<br><class>a12a<br>如何用java能够提取到123、acx、a12a这内容,并... 比如网页的源代码中出现多次
<class>123<br>
<class>acx<br>
<class>a12a<br>
如何用java能够提取到123、acx、a12a这内容,并写入在txt文件中。麻烦大神写个范例吧
展开
 我来答
a19910403
推荐于2016-01-21 · 超过21用户采纳过TA的回答
知道答主
回答量:91
采纳率:0%
帮助的人:74.9万
展开全部
FileReader fr = new FileReader("*.htm"); FileWriter fw = new FileWriter("E:/a.txt");
char[] c = new char[1024];
StringBuffer sb = new StringBuffer();
int n;
while ((n = fr.read(c)) != -1) {
sb.append(c, 0, n);
}
fr.close();

Pattern p = Pattern.compile("<class>.*?<br>");
Matcher m = p.matcher(sb);
while (m.find()) {
String tmp = m.group();
System.out.println(tmp);
System.out.println(tmp.substring(7, tmp.length() - 4));
fw.write(tmp.substring(7, tmp.length() - 4));
}

fw.close();
本回答被提问者采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式