PostgreSQL 批量插入, 更新和合并操作
栏目: 数据库 · PostgreSQL · 发布时间: 5年前
内容简介:就在 2019 年 1 月份微软收购了 PostgreSQL 数据库的初创公司而 PostgreSQL 跳出了普通关系型数据库的类型约束,它灵活的支持 JSON, JSONB, XML, 数组等类型。比如说字段类型可以是各种形式的数组,一维或多维。上面只是认识了一下 PostgreSQL 这一亮眼的特性,本篇重点不在如何定义操作数组类型的字段,而是对于普通的非数组字段类型如何用与数组相关的
就在 2019 年 1 月份微软收购了 PostgreSQL 数据库的初创公司 CitusData , 在云数据库方面可以增强与 AWS 的竟争。AWS 的 RDS 两大开源数据库就是 MySQL(Aurora 和 MariaDB 是它的变种) 和 PostgreSQL。
而 PostgreSQL 跳出了普通关系型数据库的类型约束,它灵活的支持 JSON, JSONB, XML, 数组等类型。比如说字段类型可以是各种形式的数组,一维或多维。
create table t1( address varchar(5)[3], counter integer[3][3], schedule text[][] )
上面只是认识了一下 PostgreSQL 这一亮眼的特性,本篇重点不在如何定义操作数组类型的字段,而是对于普通的非数组字段类型如何用与数组相关的 unnest
关键字进行记录的批量插入,更新以及合并操作。
在正式使用介入 unnest
之前先熟悉一下 PostgreSQL 的 upsert(update insert) 操作。受其他数据库的影响,总以后 PostgreSQL 也应该支持 merge into
语句,而且竟然 PostgreSQL 官方也有文档介绍 MERGE 有模有样的,然而试了一下根本就不支持 merge into
操作。
普通的 insert upsert 操作
不过 PostgreSQL 有另一种 upsert
的语法,或称之为 insert on conflict
,也就是 PostgreSQL 加强版的 insert
语句。如下
INSERT INTO users (id, level) VALUES (1, 0) ON CONFLICT (id) DO UPDATE SET level = users.level + 1;
即插入记录时存在相同的主键可对原记录的某些列进行更新,否则插入该记录。更详细的 insert
语法请参考官方文档 PostgreSQL INSERT 。
注意到上面的 upsert
只是应用于处理单条记录,而本文将要讨论到的是批量的处理。我们知道 insert 时可以同时插入多行记录,那么这个 upsert
语法是否也能同时操作多行记录呢?我们大胆假设,小心求证,那就动手一试吧
create table users( id int primary key, level int )
创建一个表 users
, 然后插入一条记录
INSERT INTO users (id, level) VALUES (1, 0)
查询 select * from users
表的内容如下
执行批量的 insert
INSERT INTO users (id, level) VALUES (1, 3), (2, 1) ON CONFLICT (id) DO UPDATE SET level = excluded.level;
理看看 users
表中的内容
我们看到已存在行(id=1) 的 level 更新为新的值 3, 并且插入新行。
这里注意到我们用到一个关键字 excluded
用于引用 INSERT
语句中 VALUES
提供的值,相应的表名 users
用于引用表中原有的值。
基于 unnest 的 upsert 操作
前面仍然是写作此文的意外收获,实际上想要总结的是 unnest
关键字在批量操作中的作用。下面来进行演示
create table testunnest( id int primary key, col1 int, col2 varchar(50) )
创建一个表并用 unnest
提供并行数组来进行批量插入
insert into testunnest(id, col1, col2) values (unnest(array[1,2]), unnest(array[30,40]), unnest(array['val1', 'val2']));
这时候表中的内容为
从执行效果来看,它与下面的 insert 语句是等效的
insert into testunnest(id, col1, col2) values (1, 30, 'val1') (2, 40, 'val2')
换成成 unnest(array[..])
的形式有一种行转列的行为。
用 unnest
加上 unsert
再执行一次插入
insert into testunnest(id, col1, col2) values (unnest(array[2,3]), unnest(array[80,90]), unnest(array['valupdated', 'val3'])) on conflict (id) do update set col1 = excluded.col1, col2 = excluded.col2
再查看表的内容如下
unnest 与 JDBC 操作
insert into users values (?, ?) on conflict....
的 SQL 语句的单条记录或批量操作(addBatch(), executeBatch()) 就不多说了,主要看下用 JDBC 怎么对 unnest
进行赋值操作。
PreparedStatement pstmt = conn.prepareStatement( "INSERT INTO testunnest(id, col1, col2) " + " VALUES (unnest(?), unnest(?), unnest(?))" + " ON CONFLICT (id) DO UPDATE" + " SET col1 = excluded.col1, col2 = excluded.col2" ); pstmt.setArray(1, conn.createArrayOf("int", new Integer[]{2, 3})); pstmt.setArray(2, conn.createArrayOf(JDBCType.INTEGER.getName(), new Integer[]{80, 90})); pstmt.setArray(3, conn.createArrayOf("varchar", new String[]{"val1", "val2"})); int update = pstmt.executeUpdate(); System.out.println(update); //影响的记录数是 2
点位符要用 unnest(?)
,设置参数时要用 setArray()
, 参数用 conn.createArrayOf(type, array)
来指定。需要指明数组中的元素类型,这么普通的 setInt()
, setString()
是一个意思。
用不着转换为 PostgreSQL 特定的 PreparedStatement
来操作,用 JDBC 通用的 PreparedStatement
接口就能支持对数组类型的赋值,难道是其他类型的数据库也能支持类似的数组操作?
链接:
以上所述就是小编给大家介绍的《PostgreSQL 批量插入, 更新和合并操作》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- R语言ETL工程:插入与合并(add/bind)
- HashMap为何从头插入改为尾插入
- C++拾趣——STL容器的插入、删除、遍历和查找操作性能对比(Windows VirtualStudio)——插入
- 分组字符合并SQL语句 按某字段合并字符串之一(简单合并)
- HashMap之元素插入
- 插入排序
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。