Hbase和Hive在Hadoop中的功能有什么联系?他们怎么分别作业的.两个数据库不会有重复信息导致资源浪费吗?

求工作流程原理示意图... 求工作流程原理示意图展开

 我来答

3个回答

#热议# 上班途中天气原因受伤算工伤吗？

w390445576
2012-05-21 · TA获得超过349个赞

知道小有建树答主

回答量：116

采纳率：100%

帮助的人：91.8万

我也去答题访问个人页

关注

展开全部

简单来说hive用来批量处理数据，HBase用来快速索引数据。
HBase是一个分布式的基于列存储的非关系型数据库。HBase的查询效率很高，主要由于查询和展示结果。
hive是分布式的关系型数据库。主要用来并行分布式处理大量数据。hive中的所有查询除了"select * from table;"都是需要通过Map\Reduce的方式来执行的。由于要走Map\Reduce，即使一个只有1行1列的表，如果不是通过select * from table;方式来查询的，可能也需要8、9秒。但hive比较擅长处理大量数据。当要处理的数据很多，并且Hadoop集群有足够的规模，这时就能体现出它的优势。
通过hive的存储接口，hive和Hbase可以整合使用。参见：http://wenku.baidu.com/view/faec57fb04a1b0717fd5dd00.html?st=1

已赞过 已踩过<

评论收起

jackydai123
2012-05-19 · TA获得超过114个赞

知道答主

回答量：62

采纳率：0%

帮助的人：74.6万

我也去答题访问个人页

关注

展开全部

应该是Hadoop在hbase和Hive中的作用吧。 hbase与hive都是架构在hadoop之上的。都是用hadoop作为底层存储。而hbase是作为分布式数据库，而hive是作为分布式数据仓库。当然hive还是借用hadoop的MapReduce来完成一些hive中的命令的执行。而hbase与hive都是单独安装的。你需要哪个安装哪个，所以不存在重复信息。

追问

hadoop作为底层存储是说HDFS吗 HDFS和HBase 还有Hive到底谁担任数据库呢 具体怎么分工?
我的意思是 如果有多个数据库的话 数据库资料不会重复吗?

追答

hdfs作为底层存储，hdfs是存放文件的系统，而Hbase负责组织文件。hive需要用到hdfs存储文件，需要用到MapReduce计算框架。 多个数据库（hbase）的资料，肯定是单独组织的。不会共享。

本回答被提问者采纳

已赞过 已踩过<

评论收起

luluorta1
2012-05-28 · TA获得超过103个赞

知道答主

回答量：24

采纳率：0%

帮助的人：31.2万

我也去答题访问个人页

关注

展开全部

HBase和Hive均是在HDFS上有自己的文件组织格式，两者是互斥的，通常不会同时使用。简单来说，各个系统的查询操作的规模由小到大是：
HBase << Hive < 常规MapReduce作业

已赞过 已踩过<

评论收起

更多回答（1）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

Hbase和Hive在Hadoop中的功能有什么联系?他们怎么分别作业的.两个数据库不会有重复信息导致资源浪费吗?

其他类似问题

为你推荐：