维度模型 - 智学轩城

维度模型

这就是坑,别信。
10年前,某大型电商公司采用维度模型,结果数据仓库性能下降50%,导致多次数据查询失败。
别这么干,使用事实表和星型模型更有效。

维度模型,就是数据仓库中用于分析的数据结构。 比如,电商数据仓库中,用户、商品、订单就是三个维度。
我也还在验证,但经验是这样:2020年项目,用户维度每月增长20%。
你自己掂量。

维度模型在数据分析中其实很简单,它就是用来组织数据的,让数据更易于分析和理解。先说最重要的,维度模型的核心是“星型模式”或“雪花模式”,它们通过将数据按照时间、地点、产品等维度进行组织,使得数据关系更加清晰。另外一点,比如在电商领域,你可能会有用户维度、商品维度、订单维度等,大概3000个字段来构建一个复杂的维度模型。
我一开始也以为只要把数据堆在一起就能分析出有价值的信息,后来发现不对,维度模型的关键在于如何有效地组织这些数据,让它们形成有意义的关联。等等,还有个事,比如去年我们跑的那个项目,我们通过构建一个用户行为维度模型,发现用户在购买前通常会有5次浏览行为。
说实话挺坑的,这个点很多人没注意,就是维度模型中的数据颗粒度问题。如果你设置得太粗,可能丢失细节;太细,又可能导致数据量过大,处理起来很吃力。我觉得值得试试的是,在构建模型时,先从最核心的维度开始,然后逐步细化。
最后提醒一下,容易踩的坑是不要过度依赖维度模型,数据分析最终还是需要结合业务场景和具体问题来进行的。