世界杯项目案例:HDFS分布式文件系统

栏目: 服务器 · 发布时间: 7年前

项目案例: HDFS 分布式文件系统

H adoop 的简介
H adoop apache 软件基金会的开源分布式计算平台 hadoop 集群包括两种角色 Mater Slave 。一个 HDFS 集群由一个运行于 Master 上的 Name Node 和若干个运行于 Slave 节点的 Data N ode 组成。 Name Node 负责管理文件系统命名空间和客户端对文件系统的访问操作; Data N ode 管理存储的数据。 文件以块形式在 DataNode 中存储,假如一个块大小设置为 50MB ,块的副本数为 3 (通过设置块的副本数来达到冗余效果,防止单个 Data N o de 磁盘故障后数据丢失),一个 40MB 的文件将被存储在一个块中,然后将相同的 3 个块存储在 3 Da taNode 中实现冗余。大文件将被切成小块存储。

本实验的目的

搭建 hadoop HDFS ,通过 Data N ode 节点的添加与删除实现 HDFS 空间动态增加与减少,以及 HDFS 文件系统的基本管理。

需要挂载 hadoop 光盘 hadoop.iso

世界杯项目案例:HDFS分布式文件系统  

将文件复制到脚本里的指定路径

世界杯项目案例:HDFS分布式文件系统  

脚本解释

世界杯项目案例:HDFS分布式文件系统  

安装完成,重启生效

世界杯项目案例:HDFS分布式文件系统  

验证

世界杯项目案例:HDFS分布式文件系统  

其他主机操作类似,需修改脚本的 IP 地址和主机名

slave-1 配置

世界杯项目案例:HDFS分布式文件系统  

验证

世界杯项目案例:HDFS分布式文件系统  

slave-3 配置

世界杯项目案例:HDFS分布式文件系统  

验证

世界杯项目案例:HDFS分布式文件系统  

slave-3 配置

世界杯项目案例:HDFS分布式文件系统  

验证

世界杯项目案例:HDFS分布式文件系统  

master 配置 SSH 密钥对 要求 master 免密码登录各 slave ,用于开启相应服务。

M aster 无密码连接 slave ,先切换 hadoop 用户,用 ssh -keygen 按照默认配置直接按 Enter 键生成密钥对

通过 ssh -copy-id 将公钥复制至 3 slave 主机中,复制过程需要输入 slave 主机的 hadoop 用户密码,作用是 master 远程启动 slave

世界杯项目案例:HDFS分布式文件系统  

世界杯项目案例:HDFS分布式文件系统

确定 hadoop 用户对文件的属主和属组权限

世界杯项目案例:HDFS分布式文件系统  

配置 hadoop

世界杯项目案例:HDFS分布式文件系统  

复制文件,并给权限

世界杯项目案例:HDFS分布式文件系统  

如果是手动修改需要修改以下地方

世界杯项目案例:HDFS分布式文件系统  

世界杯项目案例:HDFS分布式文件系统  

世界杯项目案例:HDFS分布式文件系统 世界杯项目案例:HDFS分布式文件系统  

世界杯项目案例:HDFS分布式文件系统  

世界杯项目案例:HDFS分布式文件系统  

master 通过 SSH 安全通道把刚才配置的 6 个文件复制给每个 slave

世界杯项目案例:HDFS分布式文件系统  

slave 需要对文件有 755 权限

世界杯项目案例:HDFS分布式文件系统  

世界杯项目案例:HDFS分布式文件系统  

初始化 master

世界杯项目案例:HDFS分布式文件系统  

检查新生成的目录

世界杯项目案例:HDFS分布式文件系统

启动 hadoop 群集(开机 hadoop 的冗余功能)

启停 hadoop de 的管理命令位于 @ HADOOP _HOME/sbin 下,以 start -* stop -* 开头;单独启动 HDFS 分布式文件系统可使用 start-dfs .sh, 也可以使用以下命令启动整个 hadoop 集群。

世界杯项目案例:HDFS分布式文件系统  

通过 jps 查看各节点上的进程是否正常

世界杯项目案例:HDFS分布式文件系统  

验证访问

世界杯项目案例:HDFS分布式文件系统  

世界杯项目案例:HDFS分布式文件系统  

hadoop 基本命令

使用 hadoopfs ”命令可以结合普通的文件管理命令实现很多操作,如查看、修改权限、统计、获取帮助、创建、删除、上传下载文件等,更多的用法可使用“ hadoop fs -help ”或“ hadoop  fs -usage ”命令查看。

世界杯项目案例:HDFS分布式文件系统  

查看节点状态

世界杯项目案例:HDFS分布式文件系统  

HDFS 高级命令

开机安全模式

世界杯项目案例:HDFS分布式文件系统  

将本地文件复制到 HDFS

世界杯项目案例:HDFS分布式文件系统  

HDFS 上的文件复制到本地

世界杯项目案例:HDFS分布式文件系统  

修改属组

世界杯项目案例:HDFS分布式文件系统  

修改权限

世界杯项目案例:HDFS分布式文件系统  

修改所有者

世界杯项目案例:HDFS分布式文件系统  

统计显示目录中文件大小

世界杯项目案例:HDFS分布式文件系统  

合并文件

世界杯项目案例:HDFS分布式文件系统  

世界杯项目案例:HDFS分布式文件系统  

HDFS 集群添加节点

slave4 节点安装 jdk hadoop ,配置环境变量

世界杯项目案例:HDFS分布式文件系统  

复制 hosts 文件到每台服务器

世界杯项目案例:HDFS分布式文件系统  

配置 ssh 无密码连接

世界杯项目案例:HDFS分布式文件系统  

master 上修改 hadoop 后,复制到其他节点

世界杯项目案例:HDFS分布式文件系统  

新节点上启动并平衡节点以及存储的数据

世界杯项目案例:HDFS分布式文件系统  

查看集群信息

世界杯项目案例:HDFS分布式文件系统  

世界杯项目案例:HDFS分布式文件系统  

世界杯项目案例:HDFS分布式文件系统  

删除 DataNode 节点

世界杯项目案例:HDFS分布式文件系统  

添加要删除的节点

世界杯项目案例:HDFS分布式文件系统  

刷新配置

世界杯项目案例:HDFS分布式文件系统  

查看集群信息

世界杯项目案例:HDFS分布式文件系统  

世界杯项目案例:HDFS分布式文件系统  

世界杯项目案例:HDFS分布式文件系统

hadoop集群搭建完成!

总结:需要懂得原理加强自身不断完善自己!


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Introduction to Tornado

Introduction to Tornado

Michael Dory、Adam Parrish、Brendan Berg / O'Reilly Media / 2012-3-28 / USD 23.99

Tornado is a scalable, non-blocking web server and web application framework written in Python. It is also light-weight to deploy, fun to write for, and incredibly powerful. Tornado was written with p......一起来看看 《Introduction to Tornado》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具