hadoop文件存放问题

假设我有一个200MB的文件，我将其存在HDFS上，那么hadoop是将文件分块后是怎样选择datanode来存放这些block的呢？（不是问副本的存放机制，是问文件所分... 假设我有一个200MB的文件，我将其存在HDFS上，那么hadoop是将文件分块后是怎样选择datanode来存放这些block的呢？（不是问副本的存放机制，是问文件所分的几个块是怎样存的）展开

 我来答

2个回答

#热议# 为什么说不要把裤子提到肚脐眼？

一个人的小站
推荐于2016-10-16 · 知道合伙人人力资源行家

一个人的小站
知道合伙人人力资源行家

采纳数：2243 获赞数：32882

专注高端人才获取与企业人才管理

向TA提问私信TA

关注

展开全部

（1）文件分割后，会有一个文件 --> block的映射，这个映射是持久化到硬盘中的，具体的映射关系表是在FSNamesystem.java中构建的（该部分的构建使用的是FSDirectory.java的功能，filename - blockset）；
有了文件到块的映射表就可以通过文件找到blocklist；
（2）datanode的选取，hadoop有它本身的机制，一般来说，datanode默认是三个，选取的是不同机架的datanode，同机架里选一台，另一个机架里选取两台（安全性等考虑）；
（3）block写入datanodes，选取的三个datanode，比如说是A、B、C，先写给A，A再写给B，B再写给C；然后B收到C的写入成功，A收到B的写入成功，然后告诉namenode 和 client写入成功；
（4）真正写的并不是block，而是比block更小的好像是chunk ，还包括有各种校验。

追问

你的第一点正是我要找的！不过我在FSDirectory中没找到HDFS将文件映射block的机制。请问是哪个或哪几个函数做到这个功能的呢？
我现在在思考的问题是：
 比如说我在北京和西安各有一堆计算机，两地都用同一个hadoop建立联系，namenode设在北京，现在我在西安这的某台电脑上上传一个比较大的文件，那这个文件会被namenode写在哪呢？
是随机选的呢？还是就近存在西安的节点上？

已赞过 已踩过<

评论收起

观湿阴520
2013-04-12

知道答主

回答量：31

采纳率：0%

帮助的人：14万

我也去答题访问个人页

关注

展开全部

可以的没问题

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

hadoop文件存放问题

其他类似问题

为你推荐：