如何设置python爬虫的爬取时间
1个回答
2017-07-06
展开全部
黄哥以前是这么干的,将网页page source 保存到数据库(mongodb)中,每次取得新的page source 和数据库中的page source 的hash 值是不是想等,如果不等表示有更新。这个判断有了,爬虫爬取时间策略就好办了。自己动手实现吧。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询