架构是数据仓库中表的逻辑描述.通过连接多个事实和维度表来创建模式以满足某些业务逻辑.
数据库使用关系模型来存储数据.但是,数据仓库使用连接维度和事实表的模式来满足业务逻辑.数据仓库中使用了三种类型的模式 :
Star Schema
雪花架构
Galaxy架构
在Star Schema中,每个Dimension都连接到一个Fact表.每个维度仅由一个维度表示,不会进一步标准化.
维度表包含用于分析数据的属性集.
示例 : 在下面给出的示例中,我们有一个事实表FactSales,其中包含所有Dim表的主键和度量unit_sold和$ _ sold以进行分析.
我们有四个Dimension表 : DimTime,DimItem,DimBranch,DimLocation
每个维度表连接到Fact表,因为Fact表具有用于连接两个表的每个Dimension Tables的主键.
事实表中的事实/度量用于分析目的以及Dimension中的属性表格.
在Snowflakes模式中,一些Dimension表进一步标准化,Dim表连接到单个Fact Table.规范化用于组织数据库的属性和表,以最小化数据冗余.
规范化涉及将表分成较少冗余的较小表而不丢失任何信息,较小的表连接到Dimension表.
在上面的例子中,DimItem和DimLocation Dimension表规范化而不会丢失任何信息.这称为Snowflakes模式,其中维度表进一步标准化为较小的表.
在Galaxy模式中,有多个Fact表和Dimension表.每个Fact表存储少量Dimension表和度量/事实的主键以进行分析.
在上面的示例中,有两个Fact表FactSales,FactShipping和多个Dimension表连接到Fact表.每个Fact表包含已连接Dim表的主键和执行分析的度量/事实.