Hadoop 中 map任务数，reduce任务数和机器节点数之间是什么关系

 我来答

1个回答

#热议# 为什么有人显老，有人显年轻？

抗倭捷报频传7
2017-02-06 · 超过292用户采纳过TA的回答

知道小有建树答主

回答量：391

采纳率：0%

帮助的人：407万

我也去答题访问个人页

关注

展开全部

一般情况下，在输入源是文件的时候，一个task的map数量由splitSize来决定的，那么splitSize是由以下几个来决定的
goalSize = totalSize / mapred.map.tasks
inSize = max {mapred.min.split.size, minSplitSize}
splitSize = max (minSize, min(goalSize, dfs.block.size))
一个task的reduce数量，由partition决定。

本回答由提问者推荐

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

hadoop2024 版 - 企业级实战，领跑高薪职业

class.imooc.com

NVIDIA与Apache Spark 3，共铸数据科学新辉煌

探索NVIDIA深度学习解决方案与Apache Spark 3的完美融合，助力数据科学领域实现新突破注册获取电子书，了解如何提升数据处理与大数据分析性能，加速机器学习进程。

www.nvidia.cn广告

Hadoop 中 map任务数，reduce任务数 和机器节点数之间是什么关系

您可能关注的内容

其他类似问题

为你推荐：

Hadoop 中 map任务数，reduce任务数和机器节点数之间是什么关系