Apache Spark 2.4.4 发布, 开源集群计算环境

栏目: 软件资讯 · 发布时间: 6年前

内容简介:Apache Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交...

Apache Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。

Apache Spark 2.4.4 发布, 开源集群计算环境Apache Spark 2.4.4 发布, 开源集群计算环境

2.4.4 版本包含稳定性修复的维护版本,内容如下:

  • 修复十进制 toScalaBigInt/toJavaBigInteger 表示不适合长的十进制的问题
  • 修复 PushProjectionThroughUnion 可空性问题
  • 修复 From_Avro 在本地模式下不修改其他行中的变量
  • Spark 2.4.3 当 HiveUDAF 遇到 0 行时意外抛出 NPE。与其他版本一样,修复后返回 NULL
  • 修复 PySparkSocket 服务器与 JVM 连接线程的同步
  • KafkaOffsetRangeCalculator.getRange 可能会减少偏移量
  • 缓存一个不确定的 RDD 会导致在重新运行阶段时出现不正确的结果
  • Spark 2.2 引入了 LinearSVCModel.setWeightCol 方法,这种方法是不正确的。它在 2.4.4 中被弃用,在 3.0.0 中将被删除

详情见说明:

https://spark.apache.org/releases/spark-release-2-4-4.html


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

艾伦•图灵传

艾伦•图灵传

(英)安德鲁·霍奇斯 / 孙天齐 / 湖南科学技术出版社 / 2012-8-1 / 68.00元

《艾伦·图灵传:如谜的解谜者》是图灵诞辰100周年纪念版,印制工艺更为精美。本书是世界共认的最权威的图灵传记。艾伦?图灵是现代人工智能的鼻祖,在24岁时奠定了计算机的理论基础。二战期间,他为盟军破译密码,为结束战争做出巨大贡献。战后,他开创性地提出人工智能的概念,并做了大量的前期工作。因同性恋问题事发,被迫注射激素,后来吃毒苹果而死。作者是一名数学家,也是一名同性恋者。他对图灵的生平有切身的体会,......一起来看看 《艾伦•图灵传》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换