大数据中hadoop核心技术是什么

 我来答

1个回答

#热议# 空调使用不当可能引发哪些疾病？

成都加米谷大数据
2020-12-23 · 超过82用户采纳过TA的回答

知道小有建树答主

回答量：278

采纳率：83%

帮助的人：8.9万

我也去答题访问个人页

关注

展开全部

Hadoop项目是以可靠、可扩展和分布式计算为目的而发展而来的开源软件。
可靠：有备份，数据不易丢失。hdfs可以备份数据。
可扩展：存储不够，加磁盘，加机器挂磁盘分析CPU内存资源不够，加机器加内存
分布式计算：多个机器同时计算一个任务的一部分，然后，把每个计算的结果进行汇总。
hadoop核心组件用于解决两个核心问题：存储和计算核心组件：
1）Hadoop Common：一组分布式文件系统和通用I/O的组件与接口（序列化、Java RPC 和持久化数据结构）。
2）Hadoop Distributed FileSystem（Hadoop分布式文件系统HDFS） HDFS是存储数据的地方，就像我们电脑的硬盘一样文件都存储在这个上面。
3）Hadoop MapReduce（分布式计算框架）MapReduce是对数据进行处理计算的，它有个特点就是不管多大的数据只要给它时间它就能把数据跑完，但是时间可能不是很快所以它叫数据的批处理。
4）Hadoop YARN（分布式资源管理器）YARN是体现Hadoop平台概念的重要组件，有了它大数据生态体系的其它软件就能在hadoop上运行了，这样就能更好的利用HDFS大存储的优势和节省更多的资源。

已赞过 已踩过<

评论收起

万山数据
2024-11-14 广告

作为北京万山数据科技有限公司的工作人员，对于数据反向治理有一定的了解。数据反向治理可以理解为对数据治理流程的逆向操作，旨在确保数据的准确性、一致性和安全性。在数据治理过程中，如果发现数据问题或异常，可以通过反向治理进行追溯和修正。我们公司拥... 点击进入详情页

本回答由万山数据提供

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

hadoop项目实战—慕课网

coding.imooc.com

2025海量大数据Hadoop面试题+笔试题&附答案~超级码客

超级码客涵盖hadoop面试&海量大数据含Hadoop，HDFS，MapReduce，数仓，Flink，Hbase，Hive，Spark..Yarn，Kafka，Zookeeper等各类分布式大数据中间件面试题超2500道hadoop面试

www.chaojimake.cn广告

大数据中hadoop核心技术是什么

您可能关注的内容

其他类似问题

为你推荐：