hadoop主要解决什么问题

 我来答

2个回答

#热议# 生活中有哪些实用的心理学知识？

床前明月儿

高能答主

2019-11-19 · 探索生活中的另一种可能

床前明月儿

采纳数：101 获赞数：171950

向TA提问私信TA

关注

展开全部

Hadoop实现了一个分布式文件系统，设计用来部署在低廉的硬件上；而且提供高吞吐量来访问应用程序的数据，适合那些有着超大数据集的应用程序。

Hadoop得以在大数据处理应用中广泛应用得益于其自身在数据提取、变形和加载(ETL)方面上的天然优势。Hadoop的分布式架构，将大数据处理引擎尽可能的靠近存储，对例如像ETL这样的批处理操作相对合适，因为类似这样操作的批处理结果可以直接走向存储。

Hadoop的MapReduce功能实现了将单个任务打碎，并将碎片任务(Map)发送到多个节点上，之后再以单个数据集的形式加载(Reduce)到数据仓库里。

扩展资料

Hadoop 由许多元素构成。其最底部是 HDFS，存储 Hadoop 集群中所有存储节点上的文件。HDFS的上一层是MapReduce 引擎，该引擎由 JobTrackers 和 TaskTrackers 组成。

通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程，以及数据仓库工具Hive和分布式数据库Hbase的介绍，基本涵盖了Hadoop分布式平台的所有技术核心。

对外部客户机而言，HDFS就像一个传统的分级文件系统。可以创建、删除、移动或重命名文件，等等。但是 HDFS 的架构是基于一组特定的节点构建的，这是由它自身的特点决定的。

这些节点包括 NameNode（仅一个），它在 HDFS 内部提供元数据服务；DataNode，它为 HDFS 提供存储块。

参考资料来源：百度百科-Hadoop

已赞过 已踩过<

评论收起

linuxhadoop
推荐于2018-03-14 · TA获得超过325个赞

知道小有建树答主

回答量：311

采纳率：56%

帮助的人：99.5万

我也去答题访问个人页

关注

展开全部

主要解决了海量数据的存储、分析和学习问题，因为随着数据的爆炸式增长，一味地靠硬件提高数据处理效率及增加存储量，不仅成本高，处理高维数据的效率也不会提高很多，遇到了瓶颈了，hadoop的搭建只需要普通的pc机，它的hdfs提供了分布式文件系统，mapreduce是一个并行编程模型，为程序员提供了编程接口，两者都屏蔽了分布式及并行底层的细节问题，用户使用起来简单方便。

本回答被网友采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

腾讯元宝-写万字小说、文章、知识问答、绘图立即体验

AI工具智能ai写作，写报告，写方案，一键高效生成口语陪练，超能翻译;1个AI分身，玩转50+爆款模版

yuanbao.tencent.com广告

hadoop主要解决什么问题

您可能关注的内容

其他类似问题

为你推荐：