如何在Hibernate中通过saveAll或EntityManager实现批量插入?

栏目: Hibernate · 发布时间: 5年前

内容简介:默认情况下,100个插入将导致100个SQL INSERT语句,这很糟糕,因为它导致100次数据库往返。批处理机制能够使用分组的机制INSERTs,UPDATEs,并DELETEs,作为一个结果,它显著减少数据库往返次数。实现批量插入的一种方法是使用SimpleJpaRepository#saveAll(Iterable< S> entities)方法。在这里,我们用MySQL做到这一点。关键点:

默认情况下,100个插入将导致100个SQL INSERT语句,这很糟糕,因为它导致100次数据库往返。

批处理机制能够使用分组的机制INSERTs,UPDATEs,并DELETEs,作为一个结果,它显著减少数据库往返次数。实现批量插入的一种方法是使用SimpleJpaRepository#saveAll(Iterable< S> entities)方法。在这里,我们用 MySQL 做到这一点。

关键点:

  • 在application.properties中设置spring.jpa.properties.hibernate.jdbc.batch_size
  • 在application.properties中设置spring.jpa.properties.hibernate.generate_statistics(只是为了检查批处理是否正常)
  • 在application.properties,设置JDBC URL中rewriteBatchedStatements=true (特定于MySQL的优化)
  • 在application.properties设置 JDBC URL使用cachePrepStmts=true(启用缓存,如果您决定设置prepStmtCacheSize,  则也很有用prepStmtCacheSqlLimit;等等;如果没有此设置,则禁用缓存)
  • 在application.properties设置 JDBC URL中useServerPrepStmts=true(通过这种方式切换到服务器端预处理语句(可能会显着提升性能))
  • 在实体中,使用 指定的生成器, 因为MySQL IDENTITY将导致批处理被禁用
  • 在实体中,添加@ Version类型的属性Long以避免SELECT在批处理之前额外触发 (还防止在多请求事务中丢失更新)。额外的SELECTs是使用merge()而不是使用的效果persist()。在幕后,saveAll()使用save(),在非新实体(具有ID)的情况下将调用merge(),其指示Hibernate触发SELECT语句以确保数据库中没有具有相同标识符的记录。
  • 注意传递给的插入数量saveAll()不要“压倒”持久化上下文。通常情况下,EntityManager应该不时地刷新和清除,但是在saveAll()执行期间,你根本无法做到这一点,所以如果saveAll()有一个包含大量数据的列表,那么所有数据都将达到持久化上下文(第一级缓存)并且在内存中直到到达flush时间。使用相对少量的数据应该没问题。对于大量数据,请查看下一个示例。

源代码可以在 这里 找到  。

通过MySQL(或其他RDBMS)中的JpaContext/EntityManager批量插入

使用批处理应该会提高性能,但在flush之前要注意持久化上下文中存储的数据量。在内存中存储大量数据可能会再次导致性能下降。上面一阶非常适合相对少量的数据。

EntityManager在MySQL(或其他RDBMS)中实现批量插入。这样您就可以轻松控制flush()和clear()持久化上下文(第一级缓存)。这不可能通过Spring Boot,saveAll(Iterable< S>entities)来实现。另一个优点是你可以调用persist()而不是merge(),Spring Boot在saveAll(Iterable< S> entities)和save(S entity)背后使用的方法。

关键点:

  • 在application.properties,设置spring.jpa.properties.hibernate.jdbc.batch_size
  • 在application.properties,设置spring.jpa.properties.hibernate.generate_statistics(只是为了检查批处理是否正常)
  • 在application.properties设置JDBC URL中rewriteBatchedStatements=true (特定于MySQL的优化)
  • 在application.properties设置 JDBC URL中使用cachePrepStmts=true(启用缓存,如果您决定设置prepStmtCacheSize,  则也很有用  prepStmtCacheSqlLimit;等等;如果没有此设置,则禁用缓存)
  • 在application.properties设置 JDBC URL中useServerPrepStmts=true(通过这种方式切换到服务器端预处理语句(可能会显着提升性能))
  • 在实体中,使用 指定的生成器,   因为MySQL IDENTITY将导致批处理被禁用
  • 在DAO中,不时刷新并清除持久性上下文。这样,您就可以避免“压跨”持久化上下文。

如何在Hibernate中通过saveAll或EntityManager实现批量插入?

源代码可以在 这里 找到  。

MySQL中的会话级批处理(Hibernate 5.2或更高版本)

通过MySQL中的Hibernate会话级批处理(Hibernate 5.2或更高版本)批量插入。

关键点:

- 在application.properties中设置spring.jpa.properties.hibernate.generate_statistics(只是为了检查批处理是否正常)

- 在application.properties中设置JDBC URL rewriteBatchedStatements=true(MySQL的优化)

- 在application.properties中设置JDBC URL cachePrepStmts=true(启用缓存,如果你决定则很有用)设置prepStmtCacheSize,prepStmtCacheSqlLimit等等;没有这个设置,缓存被禁用)

- 在application.properties中设置JDBC URL useServerPrepStmts=true(这样你切换到服务器端预处理语句(可能会导致显着的性能提升))

- 如果使用具有级联持久性的父子关系(例如,一对多,多对多)然后考虑spring.jpa.properties.hibernate.order_inserts=true通过 排序 插入来设置优化批处理

- 在实体中,使用分配生成器,因为MySQL IDENTITY将导致批处理被禁用

- Hibernate Session是通过解包来获得的EntityManager#unwrap(Session.class)

- 批处理大小是通过 DAO 设置Session#setJdbcBatchSize(Integer size)并通过Session#getJdbcBatchSize()

- 在DAO中,不时刷新并清除持久化上下文。这样就可以避免“压倒”持久化上下文。

源码案例这里


以上所述就是小编给大家介绍的《如何在Hibernate中通过saveAll或EntityManager实现批量插入?》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

风吹江南之互联网金融

风吹江南之互联网金融

陈宇(江南愤青) / 东方出版社 / 2014-6-1 / 55元

随着中国互联网金融浪潮高涨,P2P、众筹、余额宝、微信支付等新生事物层出不穷,加之大数据等时髦概念助阵,简直是乱花渐欲迷人眼,令媒体兴奋,公众狂热。那么,互联网金融真的能“颠覆”传统金融吗?当互联网思维对撞传统金融观念,是互联网金融的一统天下,还是传统金融业的自我革新?究竟是谁动了金融业的奶酪? 本书作者早期试水创立具有互联网金融雏形的网站,后来成为互联网金融的资深投资人,基于其多年在该领域......一起来看看 《风吹江南之互联网金融》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换