Hadoop,Hive,Spark 之间是什么关系
1个回答
展开全部
hadoop是最开始的大数据的框架,可以说是大数据最开始的代名词, 主要有hdfs 分布式文件系统和 yarn 资源调度系统组成, 编写MapReduce模型执行任务, 基于磁盘运算, 速度较慢不灵活。
hive最开始是基于MapReduce的, 就是将SQL翻译成MapReduce来执行, 之后抛弃了MapReduce, 改成了 Hive on spark, 使用spark 作为执行引擎。
spark是基于内存的分布式计算系统, 在极端的情况下某些运算可以超过hadoop百倍效率之上, 但是比较依赖硬件, 比hadoop更灵活。
hive最开始是基于MapReduce的, 就是将SQL翻译成MapReduce来执行, 之后抛弃了MapReduce, 改成了 Hive on spark, 使用spark 作为执行引擎。
spark是基于内存的分布式计算系统, 在极端的情况下某些运算可以超过hadoop百倍效率之上, 但是比较依赖硬件, 比hadoop更灵活。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询