|
|
|
|
移动端

1.7 考虑使用维度模型的更多理由

《数据仓库工具箱(第3版)--维度建模权威指南》第1章数据仓库、商业智能及维度建模初步,本章将详细考察数据仓库及商业智能的主要目标,辨析DW/BI管理者与杂志出版商各自责任中存在的不可思议的相似之处。本节为大家介绍考虑使用维度模型的更多理由。

作者:王念滨/周连科/韦正现 译来源:清华大学出版社|2015-12-10 16:48

年前最后一场技术盛宴 | 1月27日与京东、日志易技术大咖畅聊智能化运维发展趋势!


1.7  考虑使用维度模型的更多理由

本书主要关注在DW/BI展现区设计数据库的维度建模。但是维度建模概念超越了简单和快速的数据结构的设计。应该考虑DW/BI项目其他构建连接的维度。

当开始考虑DW/BI需求时,需要倾听并综合所发现的业务过程。有时小组关注一系列需要的报表和控制面板的度量。此时,您应该不断询问自己产生这些报表和控制面板度量的业务过程度量是什么?当确定项目的范围后,重点关注每个项目的单一业务过程,不要试图在一个迭代中就将多个业务过程覆盖。

尽管DW/BI小组将注意力放在业务过程是至关重要的,但同等重要的事情是同时开展IT和业务管理。从传统的IT基础策略来看,一般认为业务可能与部门数据部署更相似。需要改变他们有关DW/BI面向过程的思维方式。在确定优先级别和开发DW/BI路标时,业务过程是基本工作单元。幸运的是,业务管理通常采纳该方法,因为此方法反映了其对关键性能指标的思考。此外,小组还需要考虑不一致性问题,无休止的争论,以及由部门方法所带来的连绵不断的协调,因此,应该考虑采用新的策略方法。与企业领导层的合作者一起开展工作,按照业务价值和可行性排序业务过程,然后优先处理具有最大影响和可行性最高的业务过程。尽管优先级是业务的联合活动,但对组织业务过程的彻底理解是提高效率和随后的可执行性的基础。

开展规划DW/BI系统数据结构的工作,需要考虑组织的所有过程,以及相关的主要的描述维度数据。这一活动的主要成果是企业数据仓库总线矩阵,在第4章中会有详细的介绍。矩阵也可以作为一种有用工具,其潜在的好处是灵活且更加严谨的主数据管理平台。

数据管理或治理项目首先应该关注主维度集。处于不同的行业,可能包括数据、客户、产品、雇员、设施、提供商、学生、教员、账目等。考虑描述业务的中心名词,将其放入由来自业务团体的主题业务专家领导的数据管理项目列表中。建立针对这些主要名词的数据管理责任是最终开发出具有一致性,能够满足业务分析过滤、分组、标识等需求的维度的关键。健壮的维度是建立健壮的DW/BI系统的基础。

如您所见,维度建模的考虑应早于设计星型模式或OLAP多维数据库。同样,维度模型在后续的ETL系统和BI应用设计时也处于显著位置。维度建模概念将业务和技术团队联系到一起。第17章和第18章将详细讲解上述概念。希望这里的简述能够播下种子,以便能生根发芽。

敏捷性考虑

当前,DW/BI行业内非常青睐敏捷开发实践。敏捷方法存在过度简化的风险,这种方法关注构建大小可管理的工作增量,这些工作增量可在合理时间框架下完成,例如,以周来度量,而不是跨越更大的范围(造成的风险也越大),项目及发布物保证在数月或数年内完成,听起来很好,的确如此吗?

多数敏捷方法的核心原则与Kimball最佳实践契合,包括:

关注发布业务值。这是多年来Kimball广受赞誉的原则之一。

开发小组与业务相关方之间的值合作。类似敏捷小组,应该与业务构成紧密合作关系。

强调与业务相关方开展面对面的沟通、反馈、优化。

快速适应不可避免的需求变化。

以迭代、增量方式处理开发过程。

虽然上述方式引人注目,但对敏捷开发的主要批评在于该方法缺乏集合和结构,伴随持续的管理挑战。企业数据仓库总线矩阵是解决上述困难的强有力工具。总线矩阵为敏捷开发提供框架和主生产计划,对可用公共描述维度的标识,提供数据一致性并减少市场发布时间。采用正确的合作方法,业务及IT参与方共处,企业数据仓库总线矩阵可以在较短时间内建立。增量式方法工作可以不断地建立框架的部件,直到其具有足够的可用功能,并发布给业务团体。

一些客户和初学者痛苦地发现,尽管他们想要在其DW/BI环境中发布具有一致性定义的一致性维度,但往往是无法实现的。他们解释说,尽管总是希望这样做,但是由于敏捷开发技术的原因,他们不可能有足够的时间获得组织的一致意见建立一致性维度。我们认为,一致性维度能够确保敏捷DW/BI开发,以及敏捷性决策的制定。当具体化主一致性维度的多样性时,开发曲柄将调整得越来越快。当开发者重用已有的一致性维度时,新业务过程数据源的上市时间缩短。最后,新ETL开发几乎只关注分发更多的事实表,因为关联的维度表已经设置好。

如果没有类似企业数据仓库总线矩阵这样的框架,一些DW/BI开发小组将陷入凭空使用敏捷技术建立分析或报表方案的陷阱中。多数情况下,小组与少量用户合作获取有限数据源,并将其用于解决其特定的问题。输出往往成为独立的烟筒式数据系统,其他人不能利用。或者更糟的是,发布的数据不能与组织其他分析信息关联。我们鼓励适当情况下,采用敏捷性。然而,应该避免建立孤立的数据集合。与生活中多数情况一样,在极端情况下寻找适度和平衡总是明智之举。

喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:342347198

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

《ASP.NET AJAX Web 应用开发秘诀(VB版)》

本书详细介绍了AJAX在Web开发上的应用。主要内容包括:ASP.NET AJAX技术概述、实现异步局部更新页面、UpdatePanel编程功能、PageRequestMan...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊