CentOS 7 下搭建Hadoop 2.9 分布式集群

栏目: 编程工具 · 发布时间: 6年前

内容简介：首先说明，本文记录的是搭建的3节点的完全分布式Hadoop集群的过程，环境是CentOS 7，1个nameNode，2个dataNode，如下：1、首先，创建好3个CentOS 7的虚拟机.2、完成虚拟机的Java环境的搭建，可以参考 https://www.linuxidc.com/Linux/2018-11/155296.htm

首先说明，本文记录的是搭建的3节点的完全分布式Hadoop集群的过程，环境是CentOS 7，1个nameNode，2个dataNode，如下：

1、首先，创建好3个CentOS 7的虚拟机.

2、完成虚拟机的 Java 环境的搭建，可以参考 https://www.linuxidc.com/Linux/2018-11/155296.htm

3、关闭或者禁用防火墙， systemctl stop firewalld.service 关闭防火墙；systemctl disable firewalld.service 关闭防火墙

firewall-cmd --state 查看状态

CentOS 7 下搭建Hadoop 2.9 分布式集群

4、修改hosts文件，vim /etc/hosts ，注释原有的内容，加入如下内容，ip地址为你自己的虚拟机的IP地址：

192.168.10.128 master.hadoop

192.168.10.129 slave1.hadoop

192.168.10.130 slave2.hadoop

more /etc/hosts查看是否正确，需要重启后方能生效。重启命令 reboot now

此处可以添加ssh key，创建无密码的公钥

a、在master机器上输入 ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa 创建一个无密码的公钥，-t是类型的意思，dsa是生成的密钥类型，-P是密码，’’表示无密码，-f后是秘钥生成后保存的位置

b、在master机器上输入 cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys 将公钥id_dsa.pub添加进keys，这样就可以实现无密登陆ssh

c、在master机器上输入 ssh master 测试免密码登陆

d、在slave1.hadoop主机上执行 mkdir ~/.ssh

e、在slave2.hadoop主机上执行 mkdir ~/.ssh

f、在master机器上输入 scp ~/.ssh/authorized_keys root@slave1.hadoop:~/.ssh/authorized_keys 将主节点的公钥信息导入slave1.hadoop节点，导入时要输入一下slave1.hadoop机器的登陆密码

g、在master机器上输入 scp ~/.ssh/authorized_keys root@slave2.hadoop:~/.ssh/authorized_keys 将主节点的公钥信息导入slave2.hadoop节点，导入时要输入一下slave2.hadoop机器的登陆密码

h、在三台机器上分别执行 chmod 600 ~/.ssh/authorized_keys 赋予密钥文件权限

i、在master节点上分别输入 ssh slave1.hadoop和 ssh slave2.hadoop测试是否配置ssh成功

5、进入home目录，mkdir hadoop 创建一个hadoop的文件夹。上传下载好的hadoop包到该目录，hadoop2.9下载地址；

http://hadoop.apache.org/->左边点Releases->点mirror site->点http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common->下载hadoop-2.9.0.tar.gz；

tar -zxvf hadoop-2.9.0.tar.gz 解压tar包

6、配置hadoop，此节点可暂时先配置128master，然后通过scp的方式复制到两个从节点

a、vim /home/hadoop/hadoop-2.9.0/etc/hadoop/core-site.xml，在<configuration>节点中增加如下内容：

<name>fs.default.name</name>

<value>hdfs://master.hadoop:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/home/hadoop/tmp</value>

</property>

<name>io.file.buffer.size</name>

</property>

b、vim /home/hadoop/hadoop-2.9.0/etc/hadoop/hdfs-site.xml

<name>dfs.namenode.name.dir</name>

<value>file:///home/hadoop/dfs/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>file:///home/hadoop/dfs/data</value>

</property>

<name>dfs.replication</name>

</property>

<name>dfs.namenode.secondary.http-address</name>

<value>master.hadoop:50090</value>

</property>

<name>dfs.webhdfs.enabled</name>

</property>

</configuration>

c、cp /home/hadoop/hadoop-2.9.0/etc/hadoop/mapred-site.xml.template /home/hadoop/hadoop-2.9.0/etc/hadoop/mapred-site.xml

vim /home/hadoop/hadoop-2.9.0/etc/hadoop/mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

<name>mapreduce.jobtracker.http.address</name>

<value>master.hadoop:50030</value>

</property>

<name>mapreduce.jobhistory.address</name>

<value>master.hadoop:10020</value>

</property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>master.hadoop:19888</value>

</property>

<name>mapred.job.tracker</name>

<value>http://master.hadoop:9001</value>

</property>

</configuration>

d、vim /home/hadoop/hadoop-2.9.0/etc/hadoop/yarn-site.xml

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property> <name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<name>yarn.resourcemanager.address</name>

<value>master.hadoop:8032</value>

</property>

<name>yarn.resourcemanager.scheduler.address</name>

<value>master.hadoop:8030</value>

</property>

<name>yarn.resourcemanager.resource-tracker.address</name>

<value>master.hadoop:8031</value>

</property>

<name>yarn.resourcemanager.admin.address</name>

<value>master.hadoop:8033</value>

</property>

<name>yarn.resourcemanager.webapp.address</name>

<value>master.hadoop:8088</value>

</property>

<name>yarn.resourcemanager.hostname</name>

<value>master.hadoop</value>

</property>

<name>yarn.nodemanager.resource.memory-mb</name>

</property>

</configuration>

7、配置/home/hadoop/hadoop-2.9.0/etc/hadoop目录下hadoop.env.sh、yarn-env.sh的JAVA_HOME

取消JAVA_HOME的注释，设置为 export JAVA_HOME=/home/java/jdk1.8.0_11

8、配置/home/hadoop/hadoop-2.9.0/etc/hadoop目录下的slaves，删除默认的localhost，添加2个slave节点：

slave1.hadoop

slave2.hadoop

9、将master服务器上配置好的Hadoop复制到各个节点对应位置上，通过scp传送：

scp -r /home/hadoop 192.168.10.129:/home/

scp -r /home/hadoop 192.168.10.130:/home/

10、启动hadoop。在master节点启动hadoop服务，各个从节点会自动启动，进入/home/hadoop/hadoop-2.9.0/sbin/目录，hadoop的启动和停止都在master上进行；

a、初始化，输入命令：hdfs namenode -format

b、启动命令：start-all.sh

CentOS 7 下搭建Hadoop 2.9 分布式集群

c、输入jps命令查看相关信息，master上截图如下：

CentOS 7 下搭建Hadoop 2.9 分布式集群

d、slave节点上输入jps查看：

CentOS 7 下搭建Hadoop 2.9 分布式集群

e、停止命令：stop-all.sh

11、访问，输入http://192.168.10.128:50070，看到如下界面：

CentOS 7 下搭建Hadoop 2.9 分布式集群

输入http://192.168.10.128:8088，看到如下界面：

CentOS 7 下搭建Hadoop 2.9 分布式集群

好了。如果以上都成功，那么基本上完成了hadoop集群的搭建。

更多Hadoop相关信息见 Hadoop 专题页面 https://www.linuxidc.com/topicnews.aspx?tid=13

Linux公社的RSS地址： https://www.linuxidc.com/rssFeed.aspx

本文永久更新链接地址： https://www.linuxidc.com/Linux/2018-11/155328.htm

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

Head First Python

Paul Barry / O'Reilly Media / 2010-11-30 / USD 49.99

Are you keen to add Python to your programming skills? Learn quickly and have some fun at the same time with Head First Python. This book takes you beyond typical how-to manuals with engaging images, ......一起来看看《Head First Python》这本书的介绍吧!

码农工具

CentOS 7 下搭建Hadoop 2.9 分布式集群

Head First Python

RGB转16进制工具

Markdown 在线编辑器

RGB CMYK 转换工具