|
|
|
|
移动端

前言(1)

《数据仓库工具箱(第3版)--维度建模权威指南》本书汇集了到目前为止最全面的维度建模技术。本书采用新的思路和最佳实践对上一版本进行了全面修订,给出了设计维度模型的全面指南,既适合数据仓库新手,也适合经验丰富的专业人员。本节为前言。

作者:王念滨/周连科/韦正现 译来源:清华大学出版社|2015-12-10 16:13

年前最后一场技术盛宴 | 1月27日与京东、日志易技术大咖畅聊智能化运维发展趋势!


前言(1)

自Ralph Kimball于1996年首次出版The Data Warehouse Toolkit(Wiley)一书以来,数据仓库和商业智能(Data Warehousing and Business Intelligence,DW/BI)行业渐趋成熟。尽管初期仅有部分大型公司采用,但从那时起,DW/BI逐渐为各种规模的公司所青睐。业界已建立了数以千计的DW/BI系统。随着数据仓库原子数据的不断增加以及更新越来越频繁,数据容量不断增长。在我们的职业生涯中,我们见证了数据库容量从MB到GB再到TB甚至PB的发展过程,但是,DW/BI系统面临的基本挑战并未发生重大变化。我们的工作就是管理组织中的数据并将其用于业务用户的决策制定过程中。总的来说,您必须实现这一目标,确保商务人士制定更好的决策,并从他们的DW/BI投资中获得回报。

自The Data Warehouse Toolkit第1版出版以来,维度建模作为一种主要的DW/BI展现技术受到广泛认可。从业者与学者都认识到数据展现要获得成功,就必须建立在简单性的基础之上。简单性是使用户能够方便地理解数据库,使软件能够方便地访问数据库的基础性的关键要素。许多情况下,维度建模就是时刻考虑如何能够提供简单性。坚定不移地回到业务驱动的场景,坚持以用户的可理解性和查询性能为目标,才能建立始终如一地服务于组织的分析需求的设计。维度建模框架将成为BI的平台。基于我们多年来积累的经验以及大量实践者的反馈,我们相信维度建模是DW/BI项目成功的关键。

维度建模还是建立集成化的DW/BI系统的主导结构。当您使用维度模型的一致性维度和一致性事实时,可以增量式地建立具有可实践的、可预测的、分布式的复杂DW/BI系统的框架。

尽管业界的一切始终在变化,但Ralph Kimball于17年前提出的核心维度建模技术经受住了时间的考验。诸如一致性维度、缓慢变化维度、异构产品、无事实的事实表以及企业数据仓库总线矩阵等概念仍然是全球范围内设计论坛所讨论的问题。最初的概念通过新的和互补的技术被逐渐完善并强化。我们决定对Kimball的书籍发行第3版,因为我们感到有必要将我们所收集到的维度建模经验汇集到一本书中。我们每个人都具有30年以上的关注决策支持、数据仓库和业务智能的经历。我们希望分享在职业生涯中反复利用的维度建模模式。本书还包含基于现实场景的特定的实践性的设计建议。

本书的目标是提供维度建模技术的一站式商店。正如书名所体现的那样,本书是一本维度设计原则和技术的工具箱。本书既能满足那些刚刚进入维度DW/BI行业的新手的需要,也描述了许多高级概念以满足那些长期战斗在这一行业的老手的需要。我们相信本书在维度建模主题方面所涵盖内容的深度是独一无二的。本书是权威性的指南。

预期读者

本书面向数据仓库和商业智能设计人员、实践人员和管理人员。此外,积极参与DW/BI项目的业务分析人员和数据管理者也会发现本书内容对他们来说是非常有益的。

即使您并未直接负责维度模型的开发工作,但我们相信熟悉维度建模的概念对项目组所有成员都是非常重要的。维度模型对DW/BI实现的许多方面都有影响,从业务需求的转换开始,通过获取、转换和加载(ETL)过程,最后到通过商业智能应用发布数据仓库的整个过程。由于涉及内容的广泛性,无论您是主要负责项目管理、业务分析、数据结构、数据库设计、ETL和BI应用,还是教育和支持,都需要熟悉维度建模。本书适合于方方面面的读者。

对那些已经阅读过本书前期版本的读者来说,在本书中将发现一些熟悉的案例研究,然而,这些案例都被更新了,增加了更丰富的内容,几乎每个案例都包括样例企业数据仓库总线矩阵。我们为新的主题区域(包括大数据分析)提供了相应内容。

本书内容偏向对技术的讨论。主要从关系数据库环境出发讨论维度建模,这一环境与联机分析处理(OLAP)存在的细微差别在适当之处都进行了说明。本书假定读者对关系数据库概念有一定的了解,例如表、行、键和连接等。鉴于我们在讨论维度模型时不采用某一特定的方法,所以不会就某一特定数据库管理系统具体的物理设计和调整指导展开深入的讨论。

各章预览

本书将围绕一系列商业场景或案例研究进行组织。我们相信通过实例来研究设计技术是最有效的方法,因为这样做可以使我们分享非常实际的指导以及现实世界的适用经验。尽管未提供完整的应用或业界解决方案,但这些案例可用来讨论出现在维度建模中的模式。据我们的经验来看,通过远离自己所熟悉的复杂问题,更容易抓住设计技术的要素。阅读过本书以前各版本的读者对这一方法的反应非常积极。

请注意我们在第2章未采用案例研究方法。鉴于Kimball集团所发明的维度建模技术得到行业的广泛认可,我们整理出了这些技术,并简短地进行了描述。尽管并不指望读者会像阅读其他章节那样从头到尾仔细阅读,但我们觉得这一以技术为中心的章节对读者来说是一种有益的参考。

除第2章以外,本书其他章节相互关联。我们以基本概念开始,随着内容的展开,介绍了更高级的内容。读者应该顺序阅读各章。例如,除非您阅读了第16章之前有关零售、采购、订单管理和客户关系管理的那几章的内容,否则很难理解第16章的相关内容。

对那些已经阅读过本书以前版本的读者来说,可能会忽略前面几章。尽管对前面的事实和维度比较熟悉,但不希望读者跳过太多的章节,否则可能会错过一些已经更新的基本概念。

第1章:数据仓库、商业智能及维度建模初步

本书以数据仓库、商业智能及维度建模入门开始,探讨了整个DW/BI结构的所有组件并建立了本书其他章节所用到的核心词汇。消除了一些有关维度建模的神化和误解。

第2章:Kimball维度建模技术概述

本章描述了超过75个维度建模技术以及模式。

第3章:零售业务

零售是用于描述维度建模的经典实例。我们之所以从该行业开始讨论是因为该行业为大众所熟悉。并不需要大家都对该行业有非常深入的了解,因为我们主要是希望通过该章的学习使大家能够关注核心的维度建模概念。该章以设计维度模型常用的4步过程开始,对维度表开展了深入的研究,包括贯穿全书反复使用的日期维度。同时,我们还讨论了退化维度、雪花维度以及代理键。即使您并不从事零售行业的工作,也需要仔细阅读这一章,因为该章是其他各章的基础。

第4章:库存

该章是对第3章零售业讨论的延伸,讨论了零售业的另一个案例,但请将注意力转移到零售业的另一个业务过程上。该章介绍了企业数据仓库总线架构以及具有一致性维度的总线矩阵。这些概念对那些希望建立集成的、可扩展的DW/BI架构的人来说是非常关键的一章。我们还讨论了三种基础类型的事实表:事务、周期快照和累积快照。

第5章:采购

该章强调了在构思DW/BI环境时,企业组织的价值链的重要性。我们还探讨了用于处理缓慢变化维度属性的一系列基础的和高级的技术;讨论了基本的类型1(重写)、类型2(增加行)和类型3(增加列),并在此基础上介绍了类型0,以及类型4~类型7。

第6章:订单管理

在研究该案例时,我们考察了在DW/BI系统中常常需要首先考虑实现的业务过程,因为这些过程支持核心业务性能度量--我们将哪些商品以何种价格卖给哪些顾客?讨论了在模式中扮演多种角色的维度。还讨论了在处理订单管理信息时,建模人员将会面对的常见挑战,例如,表头/列表项考虑、多币种或多种度量单位,以及五花八门的事务标识符的杂项维度等。

第7章:会计

该章主要讨论了建模数据仓库中的总账信息。描述了处理年度-日期(year-to-date)事实和多种财政日历,以及将多个业务过程中的数据合并到事实表的适当方法。还对维度属性层次提供了详细的指导,从简单的规范的固定深度层次到包含参差不齐的可变深度层次的桥接表。

喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:342347198

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

实时UML与Rational Rose RealTime建模案例剖析

本书将实时系统、实时统一建模语言、实时系统的统一开发过程和Rational Rose RealTime建模环境有机地结合起来,以案例为基础,系统地介绍了...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊