如何查看hadoop集群中可用的map数目

 我来答

2个回答

#热议# 海关有哪些禁运商品？查到后怎么办？

光环国际PMP培训中心
2016-06-20 · TA获得超过9902个赞

知道大有可为答主

回答量：1850

采纳率：95%

帮助的人：492万

我也去答题访问个人页

关注

展开全部

　　2.0版本之前可以通过hadoop自带的web管理界面查看，端口是50030;2.0之后没有map和reduce
slot的概念，所以也就没有map数量一说，改成了直接对资源进行管理。

　　释义：

　　map的数量

　　map的数量通常是由hadoop集群的DFS块大小确定的，也就是输入文件的总块数，正常的map数量的并行规模大致是每一个Node是10~100个，对于CPU消耗较小的作业可以设置Map数量为300个左右，但是由于hadoop没一个任务在初始化时需要一定的时间，因此比较合理的情况是每个map执行的时间至少超过1分钟。具体的数据分片是这样的：

　　InputFormat在默认情况下会根据hadoop集群的DFS块大小进行分片，每一个分片会由一个map任务来进行处理，当然用户还是可以通过参数mapred.min.split.size参数在作业提交客户端进行自定义设置。还有一个重要参数就是mapred.map.tasks，这个参数设置的map数量仅仅是一个提示，只有当InputFormat
决定了map任务的个数比mapred.map.tasks值小时才起作用。

　　同样，Map任务的个数也能通过使用JobConf 的conf.setNumMapTasks(int
num)方法来手动地设置。这个方法能够用来增加map任务的个数，但是不能设定任务的个数小于Hadoop系统通过分割输入数据得到的值。

　　当然，为了提高集群的并发效率，可以设置一个默认的map数量，当用户的map数量较小或者比本身自动分割的值还小时可以使用一个相对交大的默认值，从而提高整体hadoop集群的效率。

已赞过 已踩过<

评论收起

TapTap发现好游戏

广告2024-12-23

星火编辑器是一款面向普通用户的游戏创作工具，致力于让个人开发者也能轻松做游戏。点击了解，如何从0开始掌握星火编辑器。

sce.taptap.cn

龙佐天下
2014-08-31 · TA获得超过1567个赞

知道小有建树答主

回答量：1379

采纳率：60%

帮助的人：1253万

我也去答题访问个人页

关注

展开全部

2.0版本之前可以通过hadoop自带的web管理界面可以查看，端口是50030，2.0之后没有map和reduce slot的概念，所以也就没有map数量一说了，改成了直接对资源进行管理

本回答被提问者和网友采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

星火编辑器-与千万TapTap用户，分享你的作品

星火编辑器是一款面向普通用户的游戏创作工具，致力于让个人开发者也能轻松做游戏。点击了解，如何从0开始掌握星火编辑器。

sce.taptap.cn广告

如何查看hadoop集群中可用的map数目

您可能关注的内容

其他类似问题

为你推荐：