3.9.3 分离非分析数据
为了提供OLAP分析的性能,应当让维表和事实表尽量“精练”,也就是只包含分析需要的数据,而对于分析不需要或者很少使用的数据,应当将它们从维表分离出去。如果维表占据的空间比较小,维表就可以存放在一个磁盘块中,在该磁盘块被读取后,维表能够始终放在高速缓存中,从而提高多维查询的速度。
对于数据是否是非分析性数据,必须具体问题具体分析。就拿姓名来说,很少问题会分析它,客户的姓名只是客户的一种标识,在维表和事实表中使用客户标识号比使用客户姓名要方便得多。但是如果是人口普查部门调查姓氏的构成情况和重名情况,此时姓名就成为非常关键的分析变量。因此,数据仓库设计时应当对维表和事实表中的各个字段都进行推敲,尽可能地将不必要的数据从维表中分离出去。
数据仓库的数据内容、结构、粒度、分割及其他物理设计需要根据用户所返回的信息不断地调整和完善,而且数据仓库需要通过不断地理解用户的分析需求,向用户提供更准确和更有用的决策信息,所以数据仓库对灵活性和扩展性有较高的要求,它的建立是一个动态、循环和反馈的过程,数据仓库的设
| 回书目 上一节 下一节 |