自从Hadoop的出现,大数据的主要技术是什么?

栏目: 服务器 · 发布时间: 7年前

内容简介:自从Hadoop的出现,引领大数据的浪潮越来越热。大数据存储的主要技术路线有几种:1.Hadoop

自从Hadoop的出现,大数据的主要技术是什么?

自从Hadoop的出现,引领大数据的浪潮越来越热。大数据存储的主要技术路线有几种:

1.Hadoop

2.Cassandra

3.MongoDB

Hadoop是Apache的开源项目,同时有很多商业公司对Hadoop进行版本发行和商业支持,参见:http://wiki.apache.org/hadoop/Distributions%20and%20Commercial%20Support

其中在最有名为人所知的三家:

1.Cloudera

自从Hadoop的出现,大数据的主要技术是什么?

2.Hortonwork

自从Hadoop的出现,大数据的主要技术是什么?

3.MapR

自从Hadoop的出现,大数据的主要技术是什么?

这三个厂商之中,MapR最为封闭;Hortonworks最为开放,产品线全开源,在线文档比较丰富。国内使用Cloudera CDH和Hortonworks的应该是最多的。

准实时计算框架/即席查询

1.CDH的框架有:Impala + Spark;

2.HDP的框架有:Tez + Spark;

3.MapR的框架有:Drill + Tez + Spark。

关于Spark:

2014年大数据最热门的技术路线就是算是Spark了,而且得力于Spark不遗余力的推广和快速成长。Cloudera是最早支持Spark,也是最激进的。下图即是Spark在Cloudera产品线中的定位:

自从Hadoop的出现,大数据的主要技术是什么?

实际上快速计算框架的发展才刚刚开始,社区中已经有如下几种:

1.Spark/Shark

2.Hortonworks Tez/Stinger

3.Cloudera Impala

4.Apache Drill

5.Apache Flink

6.Apache Nifi

7.Facebook Presto


以上所述就是小编给大家介绍的《自从Hadoop的出现,大数据的主要技术是什么?》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

SQL完全手册

SQL完全手册

格罗夫 / 电子工业 / 2006-6 / 68.00元

本书为专业和非专业用户、程序员、数据处理方面的专业人士和希望理解sQL在今天计算机产业中的影响的经理们提供了关于SQL语言的全面深入的介绍。本书为理解和使用SQL提供了一个概念上的框架,描述了SQL的历史和SQL的标准,解释了SQL在各种计算机产业领域(如企业级数据处理、数据仓库、Web站点体系结构)中的作用。这一版包含一些新的章节,专门讲述SQL在应用服务器体系结构中的作用、sQL与xML的集成......一起来看看 《SQL完全手册》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换