java相关,nutch的问题,nutch爬取回来的结果用java怎么读取呢?谢谢!

爬回来一些东西,但是记事本打开都是乱码。如何把他们抓取回来的数据进行分析呢?至少怎么用java来进行读取呢?请各位有经验的老师赐教,谢谢!... 爬回来一些东西,但是记事本打开都是乱码。如何把他们抓取回来的数据进行分析呢?
至少怎么用java来进行读取呢?请各位有经验的老师赐教,谢谢!
展开
 我来答
zph516
2014-08-07 · 超过21用户采纳过TA的回答
知道答主
回答量:37
采纳率:0%
帮助的人:39.6万
展开全部
nutch 抓取的结果会存储为索引形式,这个索引有两种方式使用
1、可以使用nutch自带的功能进行查询;
2、也可以使用lucene的api包进行通过java程序调用相关的方法传递索引的路径即可使用。
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式