爬虫的数据库选型,redis,leveldb,mongodb,mysql 选哪个
1个回答
展开全部
你最在意查询速度了。
那你知不知道有个东西叫做倒排索引?这个查询速度比正排快的不是一星半点。
不知道的话,就去百度。
然后写个程序,把所有的倒排索引放到内存里面。然后内存放不下所有倒排索引,该如何存放?不过你数据量小,应该不是问题。
当然,如何建立倒排索引,放到内存中,又有很多实现方式。增量和全量如何解决。
这样,查询的时候直接从内存里面读取数据,速度要比你从数据库中读取要快的多得多。
所以你的问题关键点不在数据库上,这个不是影响查询速度的大头,而在如何建立索引上。
挺好的,你这写完索引模块,一个搜索引擎的雏形就出来了。
可以自己参考一些开源的搜索引擎框架。
那你知不知道有个东西叫做倒排索引?这个查询速度比正排快的不是一星半点。
不知道的话,就去百度。
然后写个程序,把所有的倒排索引放到内存里面。然后内存放不下所有倒排索引,该如何存放?不过你数据量小,应该不是问题。
当然,如何建立倒排索引,放到内存中,又有很多实现方式。增量和全量如何解决。
这样,查询的时候直接从内存里面读取数据,速度要比你从数据库中读取要快的多得多。
所以你的问题关键点不在数据库上,这个不是影响查询速度的大头,而在如何建立索引上。
挺好的,你这写完索引模块,一个搜索引擎的雏形就出来了。
可以自己参考一些开源的搜索引擎框架。
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询