How do I make a simple day dimension table for data warehousing star schema with postgresql?
我将如何在 postgreSQL 中为星型模式创建和填充简单的 DAY 维度表?
这是一个数据仓库的入门课程,所以它只有几个字段,但大多数在线示例都非常复杂,对于初学者来说似乎非常复杂。这不是为了作业 - 这是为了学习,因为我正在尝试使用事实表制作我自己的简单星型模式,以便我可以开始熟悉它。
谁能给我一个简单的例子,说明我如何用几个字段创建表(day_key 作为代理键,一个描述日期的字符串,以及一些表示天或月的整数值)所以我至少可以开始理解?
一个非常简单的 DAY 维度表,应该适用于大多数版本的 PostgreSQL(我使用的是 10.5)。这只是应该帮助刚接触数据仓库的人制定一个基本的日常维度,以便在刚开始时使用。
创建日表
1 2 3 4 5 6 7 8 | CREATE TABLE DAY ( day_key SERIAL PRIMARY KEY, -- SERIAL is an integer that will auto-increment as new rows added description VARCHAR(40), -- a 'string' for a description full_date DATE, -- an actual date type month_number INTEGER, month_name VARCHAR(40), YEAR INTEGER ); |
在 Day 维度中插入行
1 2 3 4 5 6 7 8 9 10 11 12 13 | INSERT INTO DAY(description, full_date, month_number, month_name, YEAR) SELECT to_char(days.d, 'FMMonth DD, YYYY'), days.d::DATE, to_char(days.d, 'MM')::INTEGER, to_char(days.d, 'FMMonth'), to_char(days.d, 'YYYY')::INTEGER FROM ( SELECT generate_series( ('2019-01-01')::DATE, -- 'start' date ('2019-12-31')::DATE, -- 'end' date INTERVAL '1 day' -- one for each day between the start and day )) AS days(d); |
结果
注意事项:
-
基本上,您只是使用嵌套
SELECT generate_series(... 生成的行插入到 Day 表中。 -
我使用上面的
FM 两次来删除在某些日期格式中自动生成的一些空白填充。 -
我建议您在第一次执行此操作时删除
INSERT INTO day(...) 行,以确保每列的格式是您在将其插入表格之前所追求的格式。
这只是我所看到的常用方法——查看 PostgreSQL 文档有一些更全面和更好的示例,这些示例说明了格式化日期类型和获取各种有用维度的更多方法。