Aggregate JSON arrays with column values as keys
我有一个场景,我正在尝试聚合数据并将聚合数据插入到另一个表中,所有这些都来自函数内部。 数据作为数组和JSON插入到另一个表中。 我已经能够很好地聚合到数组中,但是我在尝试按照我想要的方式将数据聚合成JSON时遇到了一些麻烦。
基本上这里是我正在聚合的数据样本:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 | id_1 | id_2 | cat_ids_array ------+------+--------------- 201 | 4232 | {9,10,11,13} 201 | 4236 | {11} 201 | 4249 | {12} 201 | 4251 | {9,10} 202 | 4245 | {11} 202 | 4249 | {12} 202 | 4251 | {9,10} 202 | 4259 | {9} 203 | 4232 | {9,10,11,13} 203 | 4236 | {11} 203 | 4249 | {12} 203 | 4251 | {9,10} 203 | 4377 | {14} 204 | 4232 | {15,108} 204 | 4236 | {15} 205 | 4232 | {17,109} 205 | 4245 | {17} 205 | 4377 | {18} 206 | 4253 | {20} |
当我使用
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 | id_1 | json_agg ------+---------------------------------- 201 | [{"f1":4232,"f2":[9,10,11,13]}, + | {"f1":4236,"f2":[11]}, + | {"f1":4249,"f2":[12]}, + | {"f1":4251,"f2":[9,10]}] 202 | [{"f1":4245,"f2":[11]}, + | {"f1":4249,"f2":[12]}, + | {"f1":4251,"f2":[9,10]}, + | {"f1":4259,"f2":[9]}] 203 | [{"f1":4232,"f2":[9,10,11,13]}, + | {"f1":4236,"f2":[11]}, + | {"f1":4249,"f2":[12]}, + | {"f1":4251,"f2":[9,10]} + | {"f1":4377,"f2":[14]}] 204 | [{"f1":4232,"f2":[15,108]}, + | {"f1":4236,"f2":[15]}] 205 | [{"f1":4232,"f2":[17,109]}, + | {"f1":4245,"f2":[17]}, + | {"f1":4377,"f2":[18]}] 206 | [{"f1":4253,"f2":[20]}] |
这是我想要得到的:
1 2 3 4 5 6 7 8 | id_1 | json_agg ------+------------------------------------------------------------- 201 | [{"4232":[9,10,11,13],"4236":[11],"4249":[12],"4251":[9,10]}] 202 | [{"4245":[11],"4249":[12],"4251":[9,10],"4259":[9]}] 203 | [{"4232":[9,10,11,13],"4236":[11],"4249":[12],"4251":[9,10],"4377":[14]}] 204 | [{"4232":[15,108],"4236":[15]}] 205 | [{"4232":[17,109],"4245":[17],"4377":[18]}] 206 | [{"4253":[20]}] |
我想我将不得不做一些字符串连接,但我不完全确定最好的方法来解决这个问题。 如前所述,我是从函数内部执行此操作,因此我可以灵活处理我可以做的事情,因为我不仅限于SELECT语法魔法。
同样相关,我正在运行PostgreSQL 9.3.4,并且在不久的将来无法升级到9.4。
遗憾的是你无法升级,Postgres 9.4有
- 在SQL中返回JSON对象数组(Postgres)
几乎,但不完全
在使用Postgres 9.3时,您可以从
1 | hstore(id_2::text, cat_ids_array::text) |
要么:
1 | hstore(id_2::text, array_to_json(cat_ids_array)::text) |
然后:
1 | json_agg(hstore(id_2::text, array_to_json(cat_ids_array)::text)) |
但是数组不被识别为数组。一旦转换为
解
所以我最终得到了你预测的字符串操作。有各种方法来构造json字符串。每个都或多或少快速/优雅:
1 2 3 | format('{"%s":[%s]}', id_2::text, translate(cat_ids_array::text, '{}',''))::json format('{"%s":%s}', id_2::text, to_json(cat_ids_array))::json REPLACE(REPLACE(to_json((id_2, cat_ids_array))::text, 'f1":',''),',"f2', '')::json |
我选择了第二个变体,似乎是最可靠的,适用于其他数组类型,而不是简单的
1 2 3 4 5 | SELECT id_1 , json_agg(format('{"%s":%s}', id_2::text, to_json(cat_ids_array))::json) FROM tbl GROUP BY 1 ORDER BY 1; |
结果符合要求。
SQL Fiddle演示了所有。