内容简介:Hive 跨集群备份主要备份两类:也就是说,跨集群备份就是从一个集群把元数据和数据文件拷贝到另一个集群中Hive 提供了 IMPORT/EXPORT 导入导出元数据和数据文件功能,HDFS 提供了 distcp 跨集群数据拷贝功能,结合这两个工具,就可以实现跨集群备份功能
Hive 跨集群备份主要备份两类:
- 存储在 MySQL 中的元数据
- 存储在 HDFS 中的数据文件
也就是说,跨集群备份就是从一个集群把元数据和数据文件拷贝到另一个集群中
Hive 提供了 IMPORT/EXPORT 导入导出元数据和数据文件功能,HDFS 提供了 distcp 跨集群数据拷贝功能,结合这两个工具,就可以实现跨集群备份功能
全量备份
在主集群,导出全量数据到临时目录:
hive -e "EXPORT TABLE ods.users TO '/tmp/data/users'"
跨集群拷贝文件:
hadoop distcp /tmp/data/users hdfs://BACKUP_CLUSTER_NAMENODE:8082/tmp/data/users
在备份集群,从临时目录导入全量数据:
hive -e "IMPORT TABLE ods.users FROM '/tmp/data/users'"
分区备份
在主集群,导出分区数据到临时目录:
hive -e "EXPORT TABLE ods.sales PARTITION (ods_date='2018-06-04') TO '/tmp/data/sales/2018-06-04'"
跨集群拷贝文件:
hadoop distcp /tmp/data/sales/2018-06-04 hdfs://BACKUP_CLUSTER_NAMENODE:8082/tmp/data/sales/2018-06-04
在备份集群,从临时目录导入分区数据:
hive -e "IMPORT TABLE ods.users PARTITION (ods_date='2018-06-04') FROM '/tmp/data/sales/2018-06-04'"
参考
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- 你的 Kubernetes/Openshift 集群备份了吗?
- Elasitcsearch 7.X 集群/索引备份与恢复实战
- 如何做到 10T 集群数据安全备份、1GB/s 快速恢复?
- PostgreSQL基础备份_增量备份与任意点恢复
- 深度备份还原工具 V1.0 正式发布 — 备份还原,安全可靠
- dba+工具:MongoDB热备份工具,解决官方版备份缺陷
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
TCP/IP网络管理
亨特 / 电子工业 / 2006年3月1日 / 79.00元
本书是一本架设与维护TCP/IP网络的完整指南,无论你是在职的系统管理员,还是需要访问Internet的家用系统用户,都可从本书获得帮助。本书还讨论了高级路由协议(RIPv2、OSPF、BGP),以及实现这些协议的gated软件。对于各种重要的网络服务,如DNS,Apache,sendmail,Samba,PPP和DHCP,本书都提供了配置范例,以及相关的软件包与工具的语法参考。一起来看看 《TCP/IP网络管理》 这本书的介绍吧!