如何把nutch爬取的网页内容存写到MongoDB 我来答 可选中1个或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个问题。 nutch 网页内容 mongodb 搜索资料 1个回答 #热议# 应届生在签三方时要注意什么? 密密麻麻老味 2016-12-20 · TA获得超过308个赞 知道小有建树答主 回答量:488 采纳率:0% 帮助的人:432万 我也去答题访问个人页 关注 展开全部 进裤指入nutch的安装橡纯搏目录,运行梁祥命令: bin/nutch readseg -dump db/segments/20090525140014 segdb -nocontent -nofetch -nogenerate -noparse -noparsedatadb/segments/20090525140014为一个segments文件夹,segdb为存放转换后的内容的文件夹。 本回答由网友推荐 已赞过 已踩过< 你对这个回答的评价是? 评论 收起 推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询 其他类似问题 2016-09-28 nutch抓取网页中的指定内容存到mysql的方法? 6 2017-04-08 如何利用nutch和hadoop爬取网页数据 2017-10-28 如何把nutch爬取的网页内容存写到MongoDB 2013-07-27 nutch抓取需要登陆的页面,即实现模拟登陆后进行网页数据的抓取 1 2017-05-19 如何查看nutch爬取的文件内容 2017-03-30 nutch爬取网页时发生问题怎么解决 2011-09-28 如何修改nutch的源码,使其爬取的segment里面的内容变成可读文件,现在的文件打开是乱码!QQ:454274992! 1 2012-11-29 有个问题想问问大家,nutch 爬取大量网页以后, gerate 和 updatedb时特别慢。有解决方法吗? 更多类似问题 > 为你推荐: