定义事实表和维度表分为四个阶段:
- 1、选择业务流程
- 2、确定颗粒度
- 3、确定维度
- 4、识别事实
是不是看起来很简单呢?接下来,将使用以下步骤分解流程:
- 将详细的原子数据加载到维度结构中
- 围绕业务流程构建维度模型
- 确保每个事实表都有一个关联的日期维度表
- 确保单个事实表中的所有事实具有相同的粒度或详细程度
- 解析事实表中的多对多关系
- 解析维度表中的多对一关系
- 在维度表中存储报表标签和筛选值
- 确保维度表使用代理键
- 创建一致的维度以在整个企业中集成数据
- 提供DW/BI解决方案
- 支持业务用户的决策
数据模型⽆法复⽤,归根结底还是设计问题
Hive窗口函数详解