如何查看hadoop集群中可用的map数目

 我来答
光环国际PMP培训中心
2016-06-20 · TA获得超过9902个赞
知道大有可为答主
回答量:1850
采纳率:95%
帮助的人:492万
展开全部
  2.0版本之前可以通过hadoop自带的web管理界面查看,端口是50030;2.0之后没有map和reduce
slot的概念,所以也就没有map数量一说,改成了直接对资源进行管理。

  释义:

  map的数量

  map的数量通常是由hadoop集群的DFS块大小确定的,也就是输入文件的总块数,正常的map数量的并行规模大致是每一个Node是10~100个,对于CPU消耗较小的作业可以设置Map数量为300个左右,但是由于hadoop没一个任务在初始化时需要一定的时间,因此比较合理的情况是每个map执行的时间至少超过1分钟。具体的数据分片是这样的:

  InputFormat在默认情况下会根据hadoop集群的DFS块大小进行分片,每一个分片会由一个map任务来进行处理,当然用户还是可以通过参数mapred.min.split.size参数在作业提交客户端进行自定义设置。还有一个重要参数就是mapred.map.tasks,这个参数设置的map数量仅仅是一个提示,只有当InputFormat
决定了map任务的个数比mapred.map.tasks值小时才起作用。

  同样,Map任务的个数也能通过使用JobConf 的conf.setNumMapTasks(int
num)方法来手动地设置。这个方法能够用来增加map任务的个数,但是不能设定任务的个数小于Hadoop系统通过分割输入数据得到的值。

  当然,为了提高集群的并发效率,可以设置一个默认的map数量,当用户的map数量较小或者比本身自动分割的值还小时可以使用一个相对交大的默认值,从而提高整体hadoop集群的效率。
龙佐天下
2014-08-31 · TA获得超过1567个赞
知道小有建树答主
回答量:1379
采纳率:60%
帮助的人:1253万
展开全部
2.0版本之前可以通过hadoop自带的web管理界面可以查看,端口是50030,2.0之后没有map和reduce slot的概念,所以也就没有map数量一说了,改成了直接对资源进行管理
本回答被提问者和网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式