hadoop单机模式和伪分布式模式的异同

 我来答

3个回答

#热议# 什么是淋病？哪些行为会感染淋病？

八哥说科技

高粉答主

2019-08-10 · 分享科技资讯，共享科技生活

八哥说科技

采纳数：111 获赞数：78618

向TA提问私信TA

关注

展开全部

1、运行模式不同：

单机模式是Hadoop的默认模式。这种模式在一台单机上运行，没有分布式文件系统，而是直接读写本地操作系统的文件系统。

伪分布模式这种模式也是在一台单机上运行，但用不同的Java进程模仿分布式运行中的各类结点。

2、配置不同：

单机模式（standalone）首次解压Hadoop的源码包时，Hadoop无法了解硬件安装环境，便保守地选择了最小配置。在这种默认模式下所有3个XML文件均为空。当配置文件为空时，Hadoop会完全运行在本地。

伪分布模式在“单节点集群”上运行Hadoop，其中所有的守护进程都运行在同一台机器上。

3、节点交互不同：

单机模式因为不需要与其他节点交互，单机模式就不使用HDFS，也不加载任何Hadoop的守护进程。该模式主要用于开发调试MapReduce程序的应用逻辑。

伪分布模式在单机模式之上增加了代码调试功能，允许你检查内存使用情况，HDFS输入输出，以及其他的守护进程交互。

扩展资料：

核心架构:

1、HDFS：

HDFS对外部客户机而言，HDFS就像一个传统的分级文件系统。可以创建、删除、移动或重命名文件，等等。存储在 HDFS 中的文件被分成块，然后将这些块复制到多个计算机中（DataNode）。这与传统的 RAID 架构大不相同。块的大小和复制的块数量在创建文件时由客户机决定。

2、NameNode

NameNode 是一个通常在 HDFS 实例中的单独机器上运行的软件。它负责管理文件系统名称空间和控制外部客户机的访问。NameNode 决定是否将文件映射到 DataNode 上的复制块上。

3、DataNode

DataNode 也是在 HDFS实例中的单独机器上运行的软件。Hadoop 集群包含一个 NameNode 和大量 DataNode。DataNode 通常以机架的形式组织，机架通过一个交换机将所有系统连接起来。Hadoop 的一个假设是：机架内部节点之间的传输速度快于机架间节点的传输速度。

参考资料来源：百度百科-Hadoop

已赞过 已踩过<

评论收起

万山数据
2024-11-14 广告

作为北京万山数据科技有限公司的工作人员，对于数据反向治理有一定的了解。数据反向治理可以理解为对数据治理流程的逆向操作，旨在确保数据的准确性、一致性和安全性。在数据治理过程中，如果发现数据问题或异常，可以通过反向治理进行追溯和修正。我们公司拥... 点击进入详情页

本回答由万山数据提供

freechan10
2020-01-02 · TA获得超过2.9万个赞

知道小有建树答主

回答量：263

采纳率：68%

帮助的人：12.6万

我也去答题访问个人页

关注

展开全部

一、相同点：

1、运行机器数相同

单机(非分布式)模式与伪分布式都是在一台单机上运行。

二、不同点：

1、分布式文件系统不同

1）、单机(非分布式)模式，没有分布式文件系统，而是直接读写本地操作系统的文件系统。

2）、伪分布式用不同的Java进程模仿分布式运行中的各类结点: (NameNode,DataNode,JobTracker,TaskTracker,SecondaryNameNode)。

2、启动进程不同

1）、单机(非分布式)模式下，Hadoop不会启动NameNode、DataNode、JobTracker、TaskTracker等守护进程，Map()和Reduce()任务作为同一个进程的不同部分来执行的。

2）、伪分布式模式下，Hadoop启动NameNode、DataNode、JobTracker、TaskTracker这些守护进程都在同一台机器上运行，是相互独立的Java进程。

3、配置文件处理方式不同

1）、单机(非分布式)模式下，不对配置文件进行修改。

2）、伪分布式模式下，修改3个配置文件：core-site.xml（Hadoop集群的特性，作用于全部进程及客户端）、hdfs-site.xml（配置HDFS集群的工作属性）、mapred-site.xml（配置MapReduce集群的属性）。

参考资料

百度百科-Hadoop

本回答被网友采纳

已赞过 已踩过<

评论收起

di...2@sohu.com
2017-03-23 · 超过20用户采纳过TA的回答

知道答主

回答量：78

采纳率：77%

帮助的人：12.5万

我也去答题访问个人页

关注

展开全部

可以，hadoop安装分为单机模式，伪分布式模式，完全分布式模式。你装成单机模式或者伪分布式模式就可以了。 单机模式：Hadoop会完全运行在本地。因为不需要与其他节点交互，单机模式就不使用HDFS，也不加载任何Hadoop的守护进程

本回答被提问者采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

更多回答（1）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

hadoop单机模式和伪分布式模式的异同

其他类似问题

为你推荐：