用nutch-1.2抓取腾讯的新闻网页，为什么下载的网页只有部分内容 50

我抓取的内容，用记事本打开查看htm文件，似乎都是在遇到"#cmt_login"时就没有内容了，怎样修改才能将完整的网页抓下来... 我抓取的内容，用记事本打开查看htm文件，似乎都是在遇到"#cmt_login"时就没有内容了，怎样修改才能将完整的网页抓下来展开

 我来答

3个回答

百度网友ac64efc
2013-02-28 · TA获得超过107个赞

知道答主

回答量：77

采纳率：0%

帮助的人：25.2万

关注

展开全部

有些需要模拟登陆在可以抓取的。你要做一下配置。或者对nutch进行二次开发。我都是二次开发之后抓取的。

已赞过 已踩过<

评论收起

914256750
2013-02-26 · TA获得超过261个赞

知道答主

回答量：429

采纳率：0%

帮助的人：126万

关注

展开全部

直接下载网页不就好了

追问

一个容易下，可是有成千上百个，而且还不知道在哪里？

已赞过 已踩过<

评论收起

更多回答（1）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

其他类似问题