SAP HANA - 数据仓库中的架构

架构是数据仓库中表的逻辑描述.通过连接多个事实和维度表来创建模式以满足某些业务逻辑.

数据库使用关系模型来存储数据.但是,数据仓库使用连接维度和事实表的模式来满足业务逻辑.数据仓库中使用了三种类型的模式 :

  • Star Schema

  • 雪花架构

  • Galaxy架构

星型架构

在Star Schema中,每个Dimension都连接到一个Fact表.每个维度仅由一个维度表示,不会进一步标准化.

维度表包含用于分析数据的属性集.

示例 : 在下面给出的示例中,我们有一个事实表FactSales,其中包含所有Dim表的主键和度量unit_sold和$ _ sold以进行分析.

我们有四个Dimension表 :  DimTime,DimItem,DimBranch,DimLocation

Star Schema

每个维度表连接到Fact表,因为Fact表具有用于连接两个表的每个Dimension Tables的主键.

事实表中的事实/度量用于分析目的以及Dimension中的属性表格.

雪花模式

在Snowflakes模式中,一些Dimension表进一步标准化,Dim表连接到单个Fact Table.规范化用于组织数据库的属性和表,以最小化数据冗余.

规范化涉及将表分成较少冗余的较小表而不丢失任何信息,较小的表连接到Dimension表.

Snowflakes Schema

在上面的例子中,DimItem和DimLocation Dimension表规范化而不会丢失任何信息.这称为Snowflakes模式,其中维度表进一步标准化为较小的表.

Galaxy模式

在Galaxy模式中,有多个Fact表和Dimension表.每个Fact表存储少量Dimension表和度量/事实的主键以进行分析.

Galaxy Schema

在上面的示例中,有两个Fact表FactSales,FactShipping和多个Dimension表连接到Fact表.每个Fact表包含已连接Dim表的主键和执行分析的度量/事实.