nutch抓取了好几个工程的页面,现在想在每个工程中只能检索出每个工程的页面,怎么做呢?求思路 50

如题... 如题 展开
 我来答
Oo海之蓝歌oO
2012-11-29 · 喜欢计算机有关的东东
Oo海之蓝歌oO
采纳数:244 获赞数:876

向TA提问 私信TA
展开全部
最好给每个抓取设置任务,已任务编号来划分。
追问
那就要对segments和indexs进行分类了?
追答
自己做一个标签库好了,抓取的结果按照要求可以打上这些标签,只需要对工程和标签建立关系就好
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式