Hbase和Hive在Hadoop中的功能有什么联系?他们怎么分别作业的.两个数据库不会有重复信息导致资源浪费吗?

求工作流程原理示意图... 求工作流程原理示意图 展开
 我来答
w390445576
2012-05-21 · TA获得超过349个赞
知道小有建树答主
回答量:116
采纳率:100%
帮助的人:91.8万
展开全部
简单来说hive用来批量处理数据,HBase用来快速索引数据。
HBase是一个分布式的基于列存储的非关系型数据库。HBase的查询效率很高,主要由于查询和展示结果。
hive是分布式的关系型数据库。主要用来并行分布式 处理 大量数据。hive中的所有查询除了"select * from table;"都是需要通过Map\Reduce的方式来执行的。由于要走Map\Reduce,即使一个只有1行1列的表,如果不是通过select * from table;方式来查询的,可能也需要8、9秒。但hive比较擅长处理大量数据。当要处理的数据很多,并且Hadoop集群有足够的规模,这时就能体现出它的优势。
通过hive的存储接口,hive和Hbase可以整合使用。参见:http://wenku.baidu.com/view/faec57fb04a1b0717fd5dd00.html?st=1
jackydai123
2012-05-19 · TA获得超过114个赞
知道答主
回答量:62
采纳率:0%
帮助的人:74.6万
展开全部
应该是Hadoop在hbase和Hive中的作用吧。 hbase与hive都是架构在hadoop之上的。都是用hadoop作为底层存储。而hbase是作为分布式数据库,而hive是作为分布式数据仓库。当然hive还是借用hadoop的MapReduce来完成一些hive中的命令的执行。而hbase与hive都是单独安装的。你需要哪个安装哪个,所以不存在重复信息。
追问
hadoop作为底层存储是说HDFS吗 HDFS和HBase 还有Hive到底谁担任数据库呢 具体怎么分工?
我的意思是 如果有多个数据库的话 数据库资料不会重复吗?
追答
hdfs作为底层存储,hdfs是存放文件的系统,而Hbase负责组织文件。hive需要用到hdfs存储文件,需要用到MapReduce计算框架。 多个数据库(hbase)的资料,肯定是单独组织的。不会共享。
本回答被提问者采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
luluorta1
2012-05-28 · TA获得超过103个赞
知道答主
回答量:24
采纳率:0%
帮助的人:31.2万
展开全部
HBase和Hive均是在HDFS上有自己的文件组织格式,两者是互斥的,通常不会同时使用。简单来说,各个系统的查询操作的规模由小到大是:
HBase << Hive < 常规MapReduce作业
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(1)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式