- 星型模型优先
- 尽量使用雪花模型
- 维度粒度要合理
- 维度表设计简洁
- 使用事实表驱动分析
上周,我那个朋友在培训课上说了,维度建模有这几个基本原则:
1. 星型模式:中心是一个事实表,四周是维度表,形成一个“星”形状。 2. 维度表粒度:维度表的粒度要适合分析需求,通常比事实表的粒度要细。 3. 维度表规范化:维度表可以适当规范化,但不要过度,以免影响性能。 4. 实体化度量:度量值最好是实体化的,比如销售额、数量等。 5. 明确度量类型:度量值要区分计数、货币、比率等类型。 6. 维度命名:维度命名要清晰、简洁、易于理解。 7. 维度层级:维度要有层级关系,方便钻取和切片。 8. 维度关联:维度表之间要有明确的关联关系,便于数据查询和分析。
2023年,你看着办,这些原则很重要,做维度建模的时候要牢记。
维度建模,啊,,其实挺有意思的。嗯,首先啊,得说个原则,就是星型模式,啊,这个是核心。然后,数据仓库啊,它得简单明了,对吧,用户一看就能懂,这就要求简单性。再来,数据粒度要合适,太粗了看不清,太细了又累,所以得粒度合适。
嗯,还有啊,要一致性,不同维度表里的数据要一致,不能自相矛盾。然后,啊,得考虑性能,查询要快,对吧,这就涉及到索引啊,分区啊这些技术。
,对了,还有个原则,就是历史性,数据仓库啊,它是要记录历史的,所以得能支持时间变化,对吧。然后,啊,还有个完整性,不能有缺失的数据,这很重要。
啊,最后啊,我觉得,维度建模啊,它还得可扩展,随着业务的发展,模型能方便地调整和扩展。嗯,就这样吧,这些都是我当年在做数据仓库项目时,啊,慢慢总结出来的。