|
|
|
|
移动端

1.3 维度建模简介

《数据仓库工具箱(第3版)--维度建模权威指南》第1章数据仓库、商业智能及维度建模初步,本章将详细考察数据仓库及商业智能的主要目标,辨析DW/BI管理者与杂志出版商各自责任中存在的不可思议的相似之处。本节为维度建模简介。

作者:王念滨/周连科/韦正现 译来源:清华大学出版社|2015-12-10 16:25

有奖调研 | 1TB硬盘等你拿 AI+区块链的发展趋势及应用调研


1.3  维度建模简介

基于前述对DW/BI系统目标的介绍,本节开始介绍维度建模的基本概念。维度建模是展现分析数据的首选技术,这一观点之所以被广泛接受,主要基于以下两个需要同时满足的需求:

以商业用户可理解的方式发布数据。

提供高效的查询性能。

维度建模并不是一种新技术,早期主要用于简化数据库。50多年来,经过大量案例的考验,IT组织、行业顾问和商业用户自然而然地被这种以单一维度结构满足人们基本需求的简单性所吸引。简单性至关重要,因为它能够确保用户方便地理解数据,以及确保软件能够快速、有效地发现及发布结果。

假设某个业务经理描述其业务为:"我们在各种各样的市场销售产品,并不断地对我们的表现进行度量。"维度设计者通过仔细倾听和分析,知道其业务强调的是产品、市场、时间。多数人发现其业务包含三维数据,即将其业务数据标识为产品、市场和时间。设想沿着上述三维进行切片和切块操作。多维数据库中的点表示度量结果,例如,销售额或利润,这一结果是满足特定产品、市场和时间的结果。将某些事情以具体、有形的方式抽象成数据集展示出来的能力是解决可理解能力的法宝。如果上述场景表现太简单,这正是我们的所需!从简单的数据模型开始是保持设计简单性的基础。如果从复杂的数据模型起步,那么最终会导致模型过度复杂,从而导致查询性能低下,最终使商业用户反感。爱因斯坦曾经说过"凡事应该尽量简单,直到不能再简单为止。"

尽管维度模型通常应用在关系数据库管理系统之上,但并不要求维度模型必须满足第3范式(3NF)。数据库中强调的3NF主要是为消除冗余。规范化的3NF将数据划分为多个不同的实体,每个实体构成一个关系表。一个销售订单数据库开始可能是每个订单中的一行表示一条记录,到后来为满足3NF变成蜘蛛网状图,也许会包含上百个规范化的表。

业界有时将3NF模型称为实体-关系模型。实体-关系图(ER图或ERD)表示了表间的交互关系。3NF模型及维度模型都可以用ERD表示,因为它们都包含可连接的关系表。主要差别在于规范化程度。因为两种模型都可以用ERD表示,我们强调不要将ER模型当成3NF模型,将3NF模型称为规范化模型以消除混淆。

规范化的3NF模型主要应用于操作型过程中,因为对事务的更新与插入仅触及数据库的单一地方。然而,对BI查询来说,规范化模型太复杂。用户难以理解、检索,难以记住类似洛杉矶地铁系统那样具有复杂网络的模型。而且,多数关系数据库管理系统不能有效地查询规范化模型,用户查询难以预测的复杂性将耗尽数据库优化器,产生灾难性的查询性能。在DW/BI这样的展现系统中使用规范化建模方法难以满足对数据的高性能检索需求。幸运的是,维度建模解决了模式过分复杂的问题。

注意:

维度模型包含的信息与规范化模型包含的信息相同,但将数据以一种用户可理解的、满足查询性能要求的、灵活多变的方式进行了包装。

喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:342347198

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

Linux服务器安全策略详解

Linux主要用于架设网络服务器。如今关于服务器和网站被黑客攻击的报告几乎每天都可以见到,而且随着网络应用的丰富多样,攻击的形式和方法...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊