一文看懂大数据领域的六年巨变

栏目: 编程工具 · 发布时间: 7年前

内容简介：今年，打算将分析 Data Eng 的归档内容(这些归档可追溯到 2013 年 1 月)作为其个人项目，来析过去 6 年中的大数据的趋势和变化。为此，作者抓取并清理了 290 多期内容(使用了 Python 爬虫)，保留了与技术、新闻和发布公告相关的文章片段。接下来，他对文章片段进行了一些基本的自然语言处理并应用了一些基本的过滤，最后生成关键字和下下列表。

今年，打算将分析 Data Eng 的归档内容(这些归档可追溯到 2013 年 1 月)作为其个人项目，来析过去 6 年中的大数据的趋势和变化。

为此，作者抓取并清理了 290 多期内容(使用了 Python 爬虫)，保留了与技术、新闻和发布公告相关的文章片段。接下来，他对文章片段进行了一些基本的自然语言处理并应用了一些基本的过滤，最后生成关键字和下下列表。

一文看懂大数据领域的六年巨变

过去六年的主要趋势

作者绘制了特定关键词被提及次数的月滚动平均值，并将它们绘制在同一个图表上。下面的图表说明了这些技术大约在什么时间点变得越来越流行。

Hadoop 与 Spark

一文看懂大数据领域的六年巨变

从 2013 年 Spark 开始接管 Hadoop 的那一刻起，Hadoop 就开始稳步下滑。

Hadoop 与 Kafka

一文看懂大数据领域的六年巨变

Kafka 成为所有大数据技术栈的主要构建块。

Hadoop 与 Kubernetes

一文看懂大数据领域的六年巨变

Kubernestes 的崛起，尽管 Data Eng Weekly 并不十分关注 DevOps，但却也见证了从 2017 年开始围绕 Kubernetes 在各个领域的全面炒作。

年度热门关键词

我只是简单地画出在给定年份中被提及次数最多的 10 个关键词。

2013 年：Hadoop 的黄金时期!

一文看懂大数据领域的六年巨变

所有原始的 Hadoop 项目都在这里：HDFS、YARN、MR、PIG……以及两大主流发行版 CDH 和 HDP，除此之外别无其他!

2014 年：Spark 的崛起!

一文看懂大数据领域的六年巨变

Hadoop 总体上延续了它的统治地位，但 Spark 在这一年推出的第一个版本成为 2014 年最热门的话题!

2015 年：Kafka 来了!

一文看懂大数据领域的六年巨变

Spark 取代 Hadoop 的一名位的置，Kafka 进入前三。大多数旧项目(HDFS、YARN、MR、PIG……)都没有进入前十。

2016 年：流式处理火热!

一文看懂大数据领域的六年巨变

2016 年是流式处理年，Kafka 取代了 Hadoop 第二名的位置，Spark(流式处理)继续占据主导地位。

2017：一切向流式处理看齐!

一文看懂大数据领域的六年巨变

与 2016 年的阵容相同，只是加入了 Flink。

2018 年：回到基础!

一文看懂大数据领域的六年巨变

Kubernetes 首次亮相，我们回到了基础，试图找出如何管理(K8S)、调度(airflow)和运行(Spark、Kafka、存储……)我们的流。

2019 年：......

一文看懂大数据领域的六年巨变

现在对 2019 年给出任何结论还为时过早，但看起来 K8s 将在 2019 年成为主流!

以上所述就是小编给大家介绍的《一文看懂大数据领域的六年巨变》，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对码农网的支持！

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

数字化崇拜

[加] 文森特·莫斯可 / 黄典林 / 北京大学出版社 / 2010-1 / 26.00元

与此前的许多技术发展一样，以互联网为标志的数字化时代同样为人们提供了社会根本性变革的许诺：通过电脑，我们可以超越时空和政治。在本书中，文森特·莫斯可透过技术发展和经济泡沫的迷雾，试图探明围绕数字化新技术出现了哪些迷思，以及为何人们对这些迷思坚信不疑。他认为互联网时代投资者如此狂热的动因并不是他们对经济规则的无知，而是对赛博空间开启了一个新世界这样的迷思的坚定信念。莫斯可指出，迷思并不是一些......一起来看看《数字化崇拜》这本书的介绍吧!

码农工具

一文看懂大数据领域的六年巨变

过去六年的主要趋势

Hadoop 与 Spark

Hadoop 与 Kafka

Hadoop 与 Kubernetes

年度热门关键词

2013 年：Hadoop 的黄金时期!

2014 年：Spark 的崛起!

2015 年：Kafka 来了!

2016 年：流式处理火热!

2017：一切向流式处理看齐!

2018 年：回到基础!

2019 年：......

数字化崇拜

CSS 压缩/解压工具

Markdown 在线编辑器

HEX CMYK 转换工具