3.2.4 微观上的数据仓库设计
微观上的数据仓库设计实际上指的是数据仓库数据库的设计,亦即宏观上设计仓库设计的第1个部分。在这个层面上主要任务是进行数据建模,确定数据仓库中数据的内容及其构成关系。
在数据库的世界里面,数据建模任务通常基于3种不同的视角:概念模型、逻辑模型和物理模型。其中概念模型用来表示真实世界的情况,逻辑模型是从真实世界到数据的物理存放细节的媒介,而物理模型即表示信息存放于硬件中的细节。
数据仓库数据库的设计也不例外。在数据仓库的3级数据模型中,概念模型表示现实世界的“业务信息”构成关系,用业务数据库设计中的“实体-关系”方法(E-R方法)来设计这一级的数据模型,但需要用分析主题代替传统E-R方法中的实体。在传统业务数据库设计中的逻辑模型一般采用范式规范的表及其关系,数据仓库设计中的逻辑模型也采用表来存储数据,因此也数据仓库中使用的也是关系模型,不过表与表之间不再通过3大范式的规范,而是以星形结构、雪花形结构和星座型结构等方式组成。物理模型则属于这些表的物理存储结构,比如表的索引设计等。
数据仓库的设计就是在概念模型、逻辑模型和物理模型的依次转换过程中实现的。作为数据仓库的灵魂——元数据模型则自始至终伴随着数据仓库的开发、实施与使用。数据粒度和聚合模型也在数据仓库的创建中发挥着指导的作用,指导着数据仓库的具体实现。图3-17表达了微观数据仓库设计中各种概念之间的关系。
|
图3-17 微观数据仓库设计中各种概念之间的关系
错误!
|
图3-18 数据仓库数据库设计的步骤
在图3-17的关系图中,元数据是在对企业商业智能需求分析和概念模型设计阶段就应该设计好并且一直贯穿于数据仓库应用全程的重要部分,而数据粒度和聚合的设计则是在逻辑模型的设计过程中完成的,物理模型则需要做一些存储优化方面的工作。具体而言,这3级数据模型设计的每1个阶段都有相应的详细设计步骤,图3-18即是对这些步骤的一个总结。
| 回书目 上一节 下一节 |