Apache Spark 3.1 发布

栏目: 软件资讯 · 发布时间: 4年前

内容简介:Apache Spark 3.1 作为 Databricks Runtime 8.0 的一部分已正式发布,这也是 Apache Spark 3.x 系列的第二个 release。开发团队表示,为了让 Spark 更快、更方便使用以及更智能,Spark 3.1 对以下特性进行了扩展:...

Apache Spark 3.1 作为 Databricks Runtime 8.0 的一部分已正式发布,这也是 Apache Spark 3.x 系列的第二个 release。开发团队表示,为了让 Spark 更快、更方便使用以及更智能,Spark 3.1 对以下特性进行了扩展:

  • Python 可用性
  • ANSI SQL 合规性
  • 查询优化增强
  • 改进 Shuffle hash join
  • History Server 对结构化流数据的支持

下面简单介绍部分高级的新功能和改进。

Project Zen

Project Zen 启动于此版本,主要从以下三个方面改进了 PySpark 的可用性。

  • 更加 Python
  • 在 PySpark 中提供更好和更易用的可用性
  • 提供与其他 Python 库更好的互操作性

ANSI SQL 合规性

该版本增加了针对 ANSI SQL 合规性的额外改进,有助于简化从传统数据仓库系统到 Spark 的工作负载迁移。

性能

Catalyst 是用于优化大多数 Spark 应用的查询编译器。在 Databricks 中,每天有数十亿次查询被优化和执行。此版本增强了查询优化 (query optimization),以及提升查询处理 (query processing) 的速度。

流处理

Spark 是构建分布式流处理应用程序的最佳平台。每天有超过 10 万亿条记录在 Databricks 上使用 structured streaming 进行处理。此版本增强了 structured streaming 的监控能力、可用性和功能。

Spark 3.1 其他更新

除了上述这些新功能,此版本还关注可用性、稳定性和完善性,处理了约 1500 个工单。

Apache Spark 3.1 发布

更多内容查看 release 公告

下载地址:https://spark.apache.org/downloads.html


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

驾驭未来:抓住奇点冲击下的商机

驾驭未来:抓住奇点冲击下的商机

[日]斋藤和纪 / 南浩洁 / 中国友谊出版公司 / 2018-9 / 52.00元

2020年左右,AI(人工智能)将超越人类的智力水平。2045年,人类将迎来“奇点”——科技进步的速度达到无限大。 所有技术都在以空前的速度向前发展。同时,以往带来巨大财富的众多技术将走向“非货币化”。当下,人类正面临着被AI夺去工作的危机。许多传统行业(例如汽车制造业)将被彻底颠覆,但新的机会也在酝酿,技术的进步使得带宽成本、计算成本、存储成本等创新成本趋近于0,创业不再是资本、技术或信息......一起来看看 《驾驭未来:抓住奇点冲击下的商机》 这本书的介绍吧!

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

html转js在线工具
html转js在线工具

html转js在线工具

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具