hadoop 中一个大文件 在hdfs中是如何存储的
例如,我有一个5GB的大文件,我写到hdfs中,我看权威指南的意思,分成多个数据包,形成一个数据队列,然后依次写入datanode列表。如果有三个datanode,先传给...
例如,我有一个5GB的大文件,我写到hdfs中,我看权威指南的意思,分成多个数据包,形成一个数据队列,然后依次写入datanode列表。如果有三个datanode,先传给第一个datanode,然后由第一个传给第二个,第二个传给第三个,如果是这样不是每个节点都有5GB的文件了吗?
如果是这样,我一个客户端在读取hdfs的时候,namenode找到一个最优的datanode,那我要读取的文件不是只能在其中一个datanode上去读取了吗,除非文件特别大,超过datanode的存储。那这个分布式的效果如何体现出来呢?有点没有弄懂,请大侠给讲解一下。 展开
如果是这样,我一个客户端在读取hdfs的时候,namenode找到一个最优的datanode,那我要读取的文件不是只能在其中一个datanode上去读取了吗,除非文件特别大,超过datanode的存储。那这个分布式的效果如何体现出来呢?有点没有弄懂,请大侠给讲解一下。 展开
1个回答
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询