关于nutch的爬取结果,问个菜鸟问题。。
刚刚在本地配置好了Nutch1.4,爬取了一些数据,但这些数据都是以一些数据块(不知具体该怎么叫)存在crawl文件夹里的。那我该怎么去读取这些数据,假定这些数据都是一个...
刚刚在本地配置好了Nutch1.4,爬取了一些数据,但这些数据都是以一些数据块(不知具体该怎么叫)存在crawl文件夹里的。那我该怎么去读取这些数据,假定这些数据都是一个个网页,那我需要读取各个网页的源码,该怎么办?
展开
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询