学习 HDFS(一):概览

栏目: 服务器 · 发布时间: 7年前

内容简介:HDFS 是 Hadoop Distributed File System (Hadoop 分布式文件系统)的缩写,是 Hadoop 核心项目之一(另外两个分别是 YARN 和 MapReduce)。HDFS 提供了高容错、高吞吐、易扩展、高可用的文件系统。HDFS 是一个主从(Master/Slave)架构的分布式系统,由主节点 NameNode 和从节点 DataNode 构成。

HDFS 是 Hadoop Distributed File System (Hadoop 分布式文件系统)的缩写,是 Hadoop 核心项目之一(另外两个分别是 YARN 和 MapReduce)。HDFS 提供了高容错、高吞吐、易扩展、高可用的文件系统。

架构

HDFS 是一个主从(Master/Slave)架构的分布式系统,由主节点 NameNode 和从节点 DataNode 构成。

学习 HDFS(一):概览

Data Block

HDFS 上的文件是以数据块(Data Block)的形式存储的,数据块是 HDFS 文件处理的最小单元。数据块会以文件的形式存储在 DataNode 节点的磁盘上。数据块默认大小是 128 MB,可以通过属性 dfs.blocksize 进行配置。

在 HDFS 上,文件会被切分为一个或多个数据块分布在 DataNode 节点上存储。同一个数据块会冗余存储在不同的 DataNode 节点上,默认副本数是 3,可以通过属性 dfs.replication 进行配置。

NameNode

NameNode 是 HDFS 的主节点,管理这文件系统的命名空间,包括:

  • 文件系统目录树
  • 文件/目录信息
  • 文件的数据块索引

这些信息以文件的形式保存在 NameNode 节点的磁盘上,即空间镜像文件 fsimage 文件和编辑日志文件 edits

DataNode

DataNode 是 HDFS 的从节点,根据客户端或 NameNode 写入数据块到本地存储,或读取本地存储上的数据块。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

失控

失控

[美]凯文·凯利(Kevin Kelly) / 张行舟 等 / 译言·东西文库/电子工业出版社 / 2016-1 / 89.00元

《失控:全人类的最终命运和结局》(全新修订本)是一部思考人类社会(或更一般意义上的复杂系统)进化的“大部头”著作,对于那些不惧于“头脑体操”的读者来说,必然会开卷有益。 “大众智慧、云计算、物联网、虚拟现实、网络社区、网络经济、协作双赢、电子货币……我们今天所知的,绝大多数是我们二十年前就已知的,并且都在这本书中提及了。”——凯文·凯利 《失控》成书于1994年,2010年中文版首次面......一起来看看 《失控》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

随机密码生成器
随机密码生成器

多种字符组合密码

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具