Hadoop 添加和删除节点

内容简介：Hadoop 集群的添加和删除节点比较容易，这里也就做个记录。目前我使用的虚拟机搭建，共有 1 个

Hadoop 集群的添加和删除节点比较容易，这里也就做个记录。

环境介绍

目前我使用的虚拟机搭建，共有 1 个 NameNode 和另外 2 个 DataNode

master NameNode/DataNode
slave1 DataNode
slave2 DataNode

hdfs-site.xml 中的 dfs.replication 使用的默认值 3

关键配置

因为我之前在部署环境的时候没有设置 dfs.hosts 和 dfs.hosts.exclude 。先简单介绍一下。

dfs.hosts 是在 hdfs-site.xml 中的一项配置，它定义了允许连接到 NameNode 的主机列表。在默认情况下(不配置该项)就会允许所有主机。

dfs.hosts.exclude 是在 hdfs-site.xml 中的一项配置，它的功能正好与 dfs.hosts 相反，它是用于定义不允许连接到 NameNode 的主机列表。在默认情况下(不配置该项)就不会排除任何主机。

类似的，资源管理器配置文件 yarn-site.xml 中也拥有与 HDFS 这两项功能相似的配置，分别为 yarn.resourcemanager.nodes.include-path 和 yarn.resourcemanager.nodes.exclude-path

一般情况下，我们会将 yarn.resourcemanager.nodes.include-path 和 dfs.hosts 指向同一个文件，将 yarn.resourcemanager.nodes.exclude-path 和 dfs.hosts.exclude 指向同一文件。但是他们在特殊情况下，具体的实现会细微的差别，后面再提。

准备工作

首先为了操作方便我们先创建好 include 和 exclude 文件，并往 include 中写入已存在的集群信息并测试一下是否运行正常

vi $HADOOP_HOME/etc/hadoop/include
master
slave1
slave2

exclude 先不写入信息，准备好就行了

touch $HADOOP_HOME/etc/hadoop/exclude

停止服务修改配置文件

stop-all.sh
vi $HADOOP_HOME/etc/hadoop/hdfs-site.xml

写入以下信息

<configuration>

 <property>
  <name>dfs.replication</name>
  <!-- 因为这里要把拥有3个DataNode的集群删除一个节点,所以要把备份数调为2以免出错 -->
  <value>2</value>
 </property>

  <property>
    <name>dfs.hosts</name>
    <!-- 允许连接到HDFS的主机列表 -->
    <value>/usr/local/hadoop-2.6.0/etc/hadoop/include</value>
  </property>

  <property>
    <name>dfs.hosts.exclude</name>
    <!-- 阻止连接到HDFS的主机列表 -->
    <value>/usr/local/hadoop-2.6.0/etc/hadoop/exclude</value>
  </property>

</configuration>

vi $HADOOP_HOME/etc/hadoop/yarn-site.xml

添加以下信息

<property>
  <name>yarn.resourcemanager.nodes.include-path</name>
  <!-- 允许连接列表 -->
  <value>/usr/local/hadoop-2.6.0/etc/hadoop/include</value>
</property>

<property>
  <name>yarn.resourcemanager.nodes.exclude-path</name>
  <!-- 阻止连接列表 -->
  <value>/usr/local/hadoop-2.6.0/etc/hadoop/exclude</value>
</property>

启动服务

start-dfs.sh
start-yarn.sh

用 hdfs dfs -ls / 和 get/put 之类的试试 HDFS 工作正常不,然后也可以用 hive 的 select count(*) 之类的语句一下 MapReduce 工作正常不，如果正常的话就可以走下一步了。

删除节点

判断一个节点能否连接到 资源管理器 非常简单。仅当节点出现在 include 文件且不出现在 exclude 文件中时，才能够连接到资源管理器。注意，如果未指定 include 文件或为空的话，则意味着所有节点都可以连接到 资源管理器 。

对于 HDFS 来说， include 和 exclude 文件稍有不同，如果一个 DataNode 在 include 文件中出现同时也在 exlude 中那么说明该节点即将被删除添加。下表总结了 DataNode 的不同组合方式。

是否在 include 中	是否在 exclude 中	状态
否	否	无法连接
否	是	无法连接
是	否	可连接
是	是	可连接,将被删除

需要注意的是 dfs.hosts 和 yarn.resourcemanager.nodes.include-path 属性指定的文件( include 和 exclude )不同于 slaves 文件，前者供 NameNode 和资源管理器使用，用于决定可以连接那些节点。Hadoop 控制脚本使用 slaves 文件执行面向整个集群范围的操作，例如重启集群等。Hadoop 守护进程从不使用 slaves 文件。

进入 exclude 配置，写入即将删除的节点

vi $HADOOP_HOME/etc/hadoop/exclude

slave2

运行以下指令，将节点信息更新至 NameNode 和 资源管理器

hdfs dfsadmin -refreshNodes
yarn rmadmin -refreshNodes

你可以在 WEB 端看到 Datanode 的 Admin State 变化如下 In Service > Decommission In Progress > Decommissioned

Hadoop 添加和删除节点

如果在 Decommission In Progress 卡了很久，可能是你没有吧 dfs.replication 调低。我之前遇到了这个问题。

同时我在删除了1个节点后 HDFS 会疯狂报错，一直找不到解决方案。但是它也不影响 HDFS 的正常运行就直接无视了 WARN org.apache.hadoop.hdfs.server.blockmanagement.BlockPlacementPolicy: Failed to place enough replicas, still in need of 1 to reach 3 (unavailableStorages=[DISK, ARCHIVE], storagePolicy=BlockStoragePolicy{HOT:7, storageTypes=[DISK], creationFallbacks=[], replicationFallbacks=[ARCHIVE]}, newBlock=false) All required storage types are unavailable: unavailableStorages=[DISK, ARCHIVE], storagePolicy=BlockStoragePolicy{HOT:7, storageTypes=[DISK], creationFallbacks=[], replicationFallbacks=[ARCHIVE]}

资源管理器状态如下

Hadoop 添加和删除节点

接下来你就可以将该节点从 include 文件中完全移除了

vi $HADOOP_HOME/etc/hadoop/include
master
slave1

更新一下节点信息

hdfs dfsadmin -refreshNodes

Hadoop 添加和删除节点

如图，节点已经被完全删除了

添加节点

添加一个刚刚被删除的节点，会让它感到懵逼。所以这里我们先重启一下。

stop-yarn.sh
stop-dfs.sh
start-dfs.sh
start-yarn.sh

直接将节点信息添加进 include ,同时把它从 exclude 中删除

vi $HADOOP_HOME/etc/hadoop/include
master
slave1
slave2

vi $HADOOP_HOME/etc/hadoop/exclude
dd

更新一下节点信息

hdfs dfsadmin -refreshNodes
yarn rmadmin -refreshNodes

添加节点成功

Hadoop 添加和删除节点

其他大数据系列文章请看这里

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

老二非死不可

方三文 / 机械工业出版社 / 2013-12 / 39.00

关于投资价值投资者为啥都买茅台？怎样识别好公司与坏公司？做空者真的罪大恶极吗？国际板对A股会有什么影响？波段操作，止损割肉到底靠不靠谱？ IPO真的是A股萎靡不振的罪魁祸首吗？关于商业搜狐的再造战略有戏吗？新浪如何焕发第二春？百度的敌人为什么是它自己？我为什么比巴菲特早两年投资比亚迪？民族品牌这张牌还靠谱......一起来看看《老二非死不可》这本书的介绍吧!

码农工具

MD5 加密

MD5 加密工具

HEX CMYK 转换工具

HEX CMYK 互转工具