3个回答
展开全部
简单来说hive用来批量处理数据,HBase用来快速索引数据。
HBase是一个分布式的基于列存储的非关系型数据库。HBase的查询效率很高,主要由于查询和展示结果。
hive是分布式的关系型数据库。主要用来并行分布式 处理 大量数据。hive中的所有查询除了"select * from table;"都是需要通过Map\Reduce的方式来执行的。由于要走Map\Reduce,即使一个只有1行1列的表,如果不是通过select * from table;方式来查询的,可能也需要8、9秒。但hive比较擅长处理大量数据。当要处理的数据很多,并且Hadoop集群有足够的规模,这时就能体现出它的优势。
通过hive的存储接口,hive和Hbase可以整合使用。参见:http://wenku.baidu.com/view/faec57fb04a1b0717fd5dd00.html?st=1
HBase是一个分布式的基于列存储的非关系型数据库。HBase的查询效率很高,主要由于查询和展示结果。
hive是分布式的关系型数据库。主要用来并行分布式 处理 大量数据。hive中的所有查询除了"select * from table;"都是需要通过Map\Reduce的方式来执行的。由于要走Map\Reduce,即使一个只有1行1列的表,如果不是通过select * from table;方式来查询的,可能也需要8、9秒。但hive比较擅长处理大量数据。当要处理的数据很多,并且Hadoop集群有足够的规模,这时就能体现出它的优势。
通过hive的存储接口,hive和Hbase可以整合使用。参见:http://wenku.baidu.com/view/faec57fb04a1b0717fd5dd00.html?st=1
展开全部
应该是Hadoop在hbase和Hive中的作用吧。 hbase与hive都是架构在hadoop之上的。都是用hadoop作为底层存储。而hbase是作为分布式数据库,而hive是作为分布式数据仓库。当然hive还是借用hadoop的MapReduce来完成一些hive中的命令的执行。而hbase与hive都是单独安装的。你需要哪个安装哪个,所以不存在重复信息。
追问
hadoop作为底层存储是说HDFS吗 HDFS和HBase 还有Hive到底谁担任数据库呢 具体怎么分工?
我的意思是 如果有多个数据库的话 数据库资料不会重复吗?
追答
hdfs作为底层存储,hdfs是存放文件的系统,而Hbase负责组织文件。hive需要用到hdfs存储文件,需要用到MapReduce计算框架。 多个数据库(hbase)的资料,肯定是单独组织的。不会共享。
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
HBase和Hive均是在HDFS上有自己的文件组织格式,两者是互斥的,通常不会同时使用。简单来说,各个系统的查询操作的规模由小到大是:
HBase << Hive < 常规MapReduce作业
HBase << Hive < 常规MapReduce作业
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询