HashData云端数据湖解决方案

栏目: 编程工具 · 发布时间: 6年前

内容简介:数字化转型的浪潮已经席卷各行各业,企业在数字化的过程中会积累大量数据,特别是IoT设备、移动应用程序和社交媒体产生的数据呈现井喷之势。根据Boeing公司的报道,1个发动机引擎每3分钟就会产生1TB数据,787机型每飞行6个小时会产生240TB数据。如何更好地存储这些海量数据、并利用这些数据提升企业智能化水平以及数字化服务能力,成为了新的挑战。除了来自事务系统和业务线应用程序的结构化数据外,企业中来自IoT 设备、移动应用程序和社交媒体产生的数据多为半结构化、非结构化数据。在捕获数据时,未定义数据结构 (

数字化转型的浪潮已经席卷各行各业,企业在数字化的过程中会积累大量数据,特别是IoT设备、移动应用程序和社交媒体产生的数据呈现井喷之势。根据Boeing公司的报道,1个发动机引擎每3分钟就会产生1TB数据,787机型每飞行6个小时会产生240TB数据。如何更好地存储这些海量数据、并利用这些数据提升企业智能化水平以及数字化服务能力,成为了新的挑战。

数据湖

HashData云端数据湖解决方案

为什么需要数据湖?

除了来自事务系统和业务线应用程序的结构化数据外,企业中来自IoT 设备、移动应用程序和社交媒体产生的数据多为半结构化、非结构化数据。在捕获数据时,未定义数据结构 (Schema),传统处理海量数据的数据仓库软件无法对没有数据结构(Sechma)的数据入库,这是需要一种新的处理方法快速处理这些数据。业界采用了一个集中式存储库,支持任意规模存储、可以按原样存储数据(包括结构化、半结构化和非结构化数据),无需事先将非结构化数据转成结构化数据,并可以运行不同类型的分析(包括 SQL 查询、可视化、机器学习等)以指导做出更好的决策,这种方法我们称之为数据湖。

数据湖与数据仓库的区别

HashData云端数据湖解决方案

典型的企业将会同时需要数据仓库和数据湖,因为它们可满足不同的应用场景。

HashData云端数据湖解决方案

HashData云端数据湖解决方案是一套基于云计算构建的数据湖解决方案。在QingCloud中,它采用QingStore作为数据湖存储,HashData作为数据湖的计算引擎。

HashData云端数据湖解决方案

相比传统的基于Hadoop构建的数据湖解决方案,该方案具有如下特点:

计算存储分离

HashData云端数据湖解决方案

HashData Cloud v2采用了计算存储分离的架构,数据存放到对象存储上面,计算层采用基于Greenplum内核的MPP计算引擎。当需要少量计算时,用户可以启动小集群。当计算量增加时,用户可以在几分钟内对集群进行扩容,而不需要搬移数据。相对于计算存储绑定的架构,新架构在保证查询需求的同时,减少了服务器资源成本。在PB级的数据量下,可以节省上百万的服务器采购成本。

多级存储

传统方案采用磁盘来存储数据,HashData数据湖采用对象存储作为持久数据存储。对象存储的成本是磁盘的1/5左右,是SSD的1/10左右,有明显价格优势。

HashData云端数据湖解决方案

但是,对象存储的IO速度相比块存储要低,HashData Cloud v2新架构采用了多级存储架构,持久层数据采用对象存储,Cahce层采用少量的磁盘或者SSD,通过HashData自带的冷热数据管理功能保证了数据查询性能。

客户价值

由于HashData云端数据湖解决方案采用了“计算存储分离”和“多级存储”的技术特点,可以在保证查询性能保持不变前提下,大大减少客户的整体拥有成本,无论是服务器成本还是存储成本。在PB级数据量下,可以减少为原来解决方案的1/10。

成功案例

HashData云端数据湖解决方案可广泛应用于工业数据湖、用户行为分析和医疗数据湖。

中国电信下属分公司采用HashData数据湖解决方案替代了传统的Hadoop解决方案,从原来的100多Nodes的Hadoop集群,减少到近20多Nodes的HashData集群,大大减少了服务器成本,为客户节省了近百万的成本。

中国移动下属分公司也在采用HashData数据湖解决方案,采用了新的方案后,服务器数量减少了几十台,除了成本的大幅削减外,数据中心的管理也变得更加简单了。

HashData云端数据湖解决方案 HashData云端数据湖解决方案


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

程序设计语言

程序设计语言

斯科特 / 裘宗燕 / 电子工业出版社 / 2005-1 / 88.00元

这是一本很有特色的教材,其核心是讨论程序设计语言的工作原理和技术。本书融合了传统的程序设计语言教科书和编译教科书的有关知识,并增加了一些有关汇编层体系结构的材料,以满足没学过计算机组织的学生们的需要。书中通过各种语言的例子,阐释了程序设计语言的重要基础概念,讨论了各种概念之间的关系,解释了语言中许多结构的形成和发展过程,以及它们演化为今天这种形式的根源。书中还详细讨论了编译器的工作方式和工作过程,......一起来看看 《程序设计语言》 这本书的介绍吧!

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具