Spark 2.4.0 发布了

栏目: 编程工具 · 发布时间: 6年前

内容简介:Spark2.4.0 今天官网发布,这是一个大好消息。Spark 2.4.0http://spark.apache.org/releases/spark-release-2-4-0.html

Spark2.4.0 今天官网发布,这是一个大好消息。

Spark 2.4.0 2.x 的第五个发型版本。官方发布消息链接如下:

http://spark.apache.org/releases/spark-release-2-4-0.html

此版本继续关注可用性,稳定性和优化,浪尖在这里摘要翻译一下, 主要的关注点:

SparkCore SQL

  • 增加了 Barrier ExecutionMode ,可以更好的和深度学习的框架整合

  • 同时引入了 30+ 内置函数和 higher-order 函数可以处理更复杂的数据类型

  • 改善了与 k8s 的整合

Spark 2.4.0 发布了

  • 支持 scala 2.12

  • 内置支持了 Avro格式 数据源,这个感情好,后面浪尖给出测试案例,以后有 pb 的支持那就更好了。

性能和稳定性

这个优化比较多,值得关注

  • Connector 优化

这个优化主要是 Parquet orc csv avro 等的优化升级

Spark 2.4.0 发布了

MLlib

  • MLlib 支持了图像格式的数据源

StructuredStreaming

  • 使用 foreachBatch (支持 Python Scala Java )将每个微批的输出行暴露为 DataFrame

  • Python API 增加了 foreach 和 ForeachWriter

  • 支持使用“ kafka.isolation.level ”读取使用事务的生产者生产到 kafka topic 的已提交消息。

Spark SQL 的升级页面里也有对 Spark 2.4 SQL 方面的调整优化,大家有兴趣也可以看看,有没有自己关注的 bug 被修复了。

http://spark.apache.org/docs/latest/sql-migration-guide-upgrade.html#upgrading-from-spark-sql-23-to-24

细心的同学注意到了, Spark Streaming 已经稳定到不用更新了,,,还是说 Spark Streaming 已经凉凉了。

推荐阅读:

spark源码导读一

解惑:这个SPARK任务是数据倾斜了吗?

Spark 2.4.0 发布了

欢迎转发,点赞


以上所述就是小编给大家介绍的《Spark 2.4.0 发布了》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

新媒体文案创作与传播

新媒体文案创作与传播

秋叶、叶小鱼、勾俊伟 / 人民邮电出版社 / 2017-4 / 39.80元

《新媒体文案创作与传播》共分三篇。第1篇是新媒体文案基础篇,主要讲述了新媒体文案的基本概念、新媒体文案的岗位要求和职业能力素养;第二篇是新媒体文案创意实务篇,主要讲述了新媒体文案的创作思路、新媒体文案的写作技巧、爆款新媒体文案的打造、新媒体销售文案的写作、新媒体对文案传播的新要求、新媒体品-牌文案的写作,以及不同媒介的特征及发布形式;第三篇为新媒体文案相关技能补充,主要讲述的是策划能力。 《新媒体......一起来看看 《新媒体文案创作与传播》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具