|
|
|
|
移动端

1.5.2 辐射状企业信息工厂Inmon架构

《数据仓库工具箱(第3版)--维度建模权威指南》第1章数据仓库、商业智能及维度建模初步,本章将详细考察数据仓库及商业智能的主要目标,辨析DW/BI管理者与杂志出版商各自责任中存在的不可思议的相似之处。本节为大家介绍辐射状企业信息工厂Inmon架构。

作者:王念滨/周连科/韦正现 译来源:清华大学出版社|2015-12-10 16:41

技术沙龙 | 6月30日与多位专家探讨技术高速发展下如何应对运维新挑战!


1.5.2  辐射状企业信息工厂Inmon架构

辐射状企业信息工厂(Corporate Information Factory,CIF)方法由Bill Inmon及业界人士倡导。图1-9描述了关注核心元素和展开讨论有关的概念的简化版CIF。

在CIF环境下,数据从操作型数据源中获取,在ETL系统中进行处理,有时将这一过程称为数据获取。从这一过程中获得的原子数据保存在满足第3范式的数据库中,这种规范化的、原子数据的仓库被称为CIF架构下的企业数据仓库(Enterprise Data Warehouse,EDW)。尽管Kimball架构也可以选择使用规范化以支持ETL处理,规范化的EDW是CIF中强制性的构件。与Kimball方法类似,CIF提倡企业数据协调和集成。但CIF认为要利用规范化的EDW承担这一角色,而Kimball架构强调具有一致性维度的企业总线的重要作用。

注意:

规范化过程并未能够从技术上支持集成。规范化仅建立能够实现多对一关系的物理表。从另一方面看,集成需要解决由于多源所造成的不一致性。不兼容的数据库源可以完全被规范化,但并未解决集成的问题。基于一致性维度的Kimball架构颠覆了这一逻辑,关注解决数据不一致性,但并未明确提出需要规范化。

采用CIF方法的企业通常允许业务用户根据数据细节程度和数据可用性要求访问EDW仓库。然而,产生的ETL数据的发布过程包含下游的报表和分析环境以支持业务用户。虽然也采用维度结构,但结果分析数据库通常与Kimball架构的展现区存在差别,分析数据库通常以部门为中心(而不是围绕业务过程来组织),而且包含聚集数据(不是原子级细节数据)。如果ETL过程中数据所应用的业务规则超越了基本概要,如部门重命名了列或其他类似计算,要将分析数据库与EDW原子数据联系起来将变得非常困难。

注意:

我们认为,纯CIF架构最极端的形式是不能实现数据仓库的功能。这样的架构将原子数据固定为难以查询的规范化结构,而将部门级的不兼容的数据集市发布到不同的业务用户组。有关这一观点的详细解释,请看1.5.3小节。

喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:342347198

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

Linux安全体系分析与编程

本书选择经典的开放源代码,全面系统地分析了Linux安全机制。本书共有17章,前10章着重介绍了Linux操作系统的安全机制及实现方法,阐述了公...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊