基于python的scrapy爬虫,关于增量爬取是怎么处理的 我来答 1个回答 #热议# 不吃早饭真的会得胆结石吗? nonstop525 2017-08-25 · TA获得超过567个赞 知道小有建树答主 回答量:341 采纳率:66% 帮助的人:204万 我也去答题访问个人页 关注 展开全部 对于增量这个问题和爬虫框架没有关系,首先得知道那些是爬取过的,那些是没有爬过的,所以得有一个数据库(不管是内存数据库redis,memcache,Mongo,还是传统数据库mysql,sqlite)保存已经爬取过的网页。具体实现可以通过url或者内容的md5值等判别那些爬过那些没有过; 本回答由提问者推荐 已赞过 已踩过< 你对这个回答的评价是? 评论 收起 推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询 其他类似问题 2017-06-18 基于python的scrapy爬虫,关于增量爬取是怎么处理的 1 2017-11-11 基于python的scrapy爬虫,关于增量爬取是怎么处理的 2016-09-27 基于python的scrapy爬虫,关于增量爬取是怎么处理的 2016-10-04 基于python的scrapy爬虫,关于增量爬取是怎么处理的 2016-02-20 基于python的scrapy爬虫,关于增量爬取是怎么处理的 2017-06-21 基于python的scrapy爬虫,关于增量爬取是怎么处理的 2015-09-28 基于python的scrapy爬虫,关于增量爬取是怎么处理的 2016-10-13 基于python的scrapy爬虫,关于增量爬取是怎么处理的 更多类似问题 > 为你推荐: