Is this generic MERGE/UPSERT function for PostgreSQL safe?
我创建了一个"合并"函数,它应该执行UPDATE或INSERT查询,具体取决于现有数据。此函数不是为每个表编写upsert-wrapper(如大多数可用示例中所示),而是采用整个SQL字符串。这两个SQL字符串都是由我们的应用程序自动生成的。
计划是这样调用函数:
1 2 3 4 5 6 | -- hypothetical"settings" table, with a primary key of (user_id, setting): SELECT MERGE( $$UPDATE settings SET VALUE = 'x' WHERE user_id = 42 AND setting = 'foo'$$, $$INSERT INTO settings (user_id, setting, VALUE) VALUES (42, 'foo', 'x')$$ ); |
这是merge()函数的完整代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 | CREATE OR REPLACE FUNCTION MERGE (update_sql TEXT, insert_sql TEXT) RETURNS TEXT AS $func$ DECLARE max_iterations INTEGER := 10; i INTEGER := 0; num_updated INTEGER; BEGIN -- usually returns before re-entering the loop LOOP -- first try the update EXECUTE update_sql; GET DIAGNOSTICS num_updated = ROW_COUNT; IF num_updated > 0 THEN RETURN 'UPDATE'; END IF; -- nothing was updated: try the insert, watching out for concurrent inserts BEGIN EXECUTE insert_sql; RETURN 'INSERT'; EXCEPTION WHEN unique_violation THEN -- nop; just loop and try again from the top END; -- emergency brake i := i + 1; IF i >= max_iterations THEN RAISE EXCEPTION 'merge(): tried looping % times, giving up now.', i; EXIT; END IF; END LOOP; END; $func$ LANGUAGE plpgsql; |
它似乎在我的测试中运行良好,但我不确定我是否没有错过任何关键的内容,特别是关于并发UPDATE / INSERT / DELETE查询,可以在不使用此函数的情况下发出。我忽略了什么重要的事吗?
我为此功能咨询的资源包括:
- PostgreSQL手册中的UPDATE / INSERT示例40.2
- 为什么UPSERT如此复杂?
- SO:插入,重复更新(postgresql)
(编辑:其中一个目标是避免锁定目标表。)
您的问题的答案取决于您的应用程序将如何访问数据库的上下文。 有很多方法可以解决这个问题,正如您自己引用的depesz的帖子中所讨论的那样。 此外,您可能还想考虑使用可写CTE,请参阅此处。 还有[问题]插入,在PostgreSQL中重复更新? 为您的决策过程进行了一些有趣的讨论。