Spring Batch 4.2.0.RC1 发布,改进性能

栏目: 软件资讯 · 发布时间: 6年前

内容简介:Spring Batch 4.2.0.RC1 已发布,这是一个使用 Spring 和 Java 编写离线和批处理应用程序的框架。本次更新主要针对核心框架的性能方面进行了改进。 接下来了解一下具体的改进内容,总共包括四个方面: 增强 Step...

Spring Batch 4.2.0.RC1 已发布,这是一个使用 Spring 和 Java 编写离线和批处理应用程序的框架。本次更新主要针对核心框架的性能方面进行了改进。

接下来了解一下具体的改进内容,总共包括四个方面:

增强 Step Partitioning 功能

一直以来,Spring Batch 框架都没有对启动 partitioned step 进行过良好的优化。在该版本中,团队深入研究了分区过程,以找出导致此性能问题的根本原因。分区过程的主要步骤之一是找到最后执行的 step(以查看当前执行是否为重新启动的 partitioned step)。团队由此发现了最后执行的 step 在给定的内存实例中会从所有任务执行中加载所有的 step 执行,这明显会降低效率。

为此,团队使用一个 SQL 查询(数据库级别的查询)替换了这些代码,仅返回最后执行的 step。最后的结果也非常不错,根据 partitioned-step-benchmark 基准测试的结果,使用此方法将 step 执行划分为 5000 个分区最终将速度提升了将近 10 倍:

Spring Batch 4.2.0.RC1 发布,改进性能

改进 Job Stop 功能

这个功能的改进思路和上面的类似,也是通过改用 SQL 查询来提升执行效率,最终结果如下

Spring Batch 4.2.0.RC1 发布,改进性能

使用 JpaItemWritershi 实现更快的写入

JpaItemWritershi 使用 javax.persistence.EntityManager#merge 函数在 JPA 持久化的上下文中写入条目。当条目的状态未知或已知为更新状态时,这是有意义的。但在许多已知数据是新数据并应视为插入数据的文件提取任务中,使用 javax.persistence.EntityManager#merge 的效率并不高。

在此版本中,团队在 JpaItemWriter 中引入了一个新的可选项,以在上述的场景中使用 persist 而非 merge。通过这个可选项,根据 jpa-writer-benchmark 基准测试,文件提取任务使用 JpaItemWriter 在数据库插入 100 万个条目的速度比之前快了 2 倍。

Spring Batch 4.2.0.RC1 发布,改进性能

使用 BeanWrapperFieldSetMapper 对 Bean Mapping 进行优化

BeanWrapperFieldSetMapper 提供了一个十分实用的特性,它可以让我们用一个给定的 JavaBean (驼峰命名、嵌套属性等)的字段名进行模糊匹配。当字段名与列的名称匹配时,可通过将 distanceLimit 的参数设置为 0 来启用完全匹配。

此版本修复了 BeanWrapperFieldSetMapper 的性能问题,根据 bean-mapping-benchmark 基准测试的结果,条目的映射速度比之前快了 1.5 倍。

Spring Batch 4.2.0.RC1 发布,改进性能

最后,所有基准测试均在 Macbook Pro(16GB RAM, 2.9 GHz Intel Core i7 CPU, MacOS Mojave 10.14.5, Oracle JDK 1.8.0_201)设备中进行。相关的测试基准源码如下:

下一个版本是 Spring Batch 4.2.0 的候选版,将于 9 月 30 日发布。


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

深入理解并行编程

深入理解并行编程

[美] Paul E.Mckenney(保罗·E·麦肯尼) / 谢宝友 鲁阳 / 电子工业出版社 / 2017-7-1 / 129

《深入理解并行编程》首先以霍金提出的两个理论物理限制为引子,解释了多核并行计算兴起的原因,并从硬件的角度阐述并行编程的难题。接着,《深入理解并行编程》以常见的计数器为例,探讨其不同的实现方法及适用场景。在这些实现方法中,除了介绍常见的锁以外,《深入理解并行编程》还重点介绍了RCU的使用及其原理,以及实现RCU的基础:内存屏障。最后,《深入理解并行编程》还介绍了并行软件的验证,以及并行实时计算等内容......一起来看看 《深入理解并行编程》 这本书的介绍吧!

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具