存档在 ‘网站数据仓库’ 分类

数据仓库元数据管理

2010年12月14日
数据仓库元数据管理   元数据管理是整个数据仓库架构中很重要的一块(关于数据仓库的架构,请参考这篇文章——数据仓库的基本架构),但发其实现很多书里面都没有对元数据下一个详细的定义,或者没有系统地介绍到底数据仓库的元数据应该包括哪些。下面是我个人整理的一些对元数据管理的看法,主要来自Inmon的《数据仓库》的两本书、Oracle的文档及个人在数据仓库的应用中认为应该记录的一些元数据。 元数据的定义   元数据(Meta Data),从字面来看好像无法看出......

» 阅读更多: 数据仓库元数据管理

OLAP的基本特征

2010年11月16日
OLAP的基本特征   又是一篇关于商务智能(BI)方面的文章,前面有几篇文章介绍了数据仓库、多维模型和OLAP方面的知识。这篇文章主要总结了OLAP具备的一些基本特征,以及其在数据的处理、展示和分析中体现的优势。   其实我们大部分时间是在模仿,参考书本或者他人的范例,而当我们去实现这些东西的时候,我们又会有自己的体验,我们需要将这些体验记录下来,当我们能够自己去总结整个实现过程的时候,其实可以认为我们已经掌握了这个知识或技能。而正是......

» 阅读更多: OLAP的基本特征

维(Dimension)和立方(Cube)

2010年10月27日
维(Dimension)和立方(Cube)     博客之前的两篇文章:数据仓库的多维模型和数据立方体与OLAP中分别对多维模型和OLAP的一些基本概念进行了介绍,这篇文章是基于那两篇文章的深入扩展,主要介绍的是多维OLAP中两个重要构成元素——维和立方的结构和组成。可能内容会偏向于模型构建方面,对那方面不太感兴趣的同学可以直接跳过。 ;-) 维(Dimension)   维是用于从不同角度描述事物特征的,一般维都会有多层(Level),每个Level都会包含一些共有的或特......

» 阅读更多: 维(Dimension)和立方(Cube)

数据立方体与OLAP

2010年8月29日
数据立方体与OLAP   前面的一篇文章——数据仓库的多维数据模型中已经简单介绍过多维模型的定义和结构,以及事实表(Fact Table)和维表(Dimension Table)的概念。多维数据模型作为一种新的逻辑模型赋予了数据新的组织和存储形式,而真正体现其在分析上的优势还需要基于模型的有效的操作和处理,也就是OLAP(On-line Analytical Processing,联机分析处理)。 数据立方体   关于数据立方体(Data Cube),这里必须注意的是数据立方体只是多维模型的一......

» 阅读更多: 数据立方体与OLAP

数据仓库的多维数据模型

2010年8月17日
数据仓库的多维数据模型   可能很多人理解的数据仓库就是基于多维数据模型构建,用于OLAP的数据平台,通过上一篇文章——数据仓库的基本架构,我们已经看到数据仓库的应用可能远不止这些。但不得不承认多维数据模型是数据仓库的一大特点,也是数据仓库应用和实现的一个重要的方面,通过在数据的组织和存储上的优化,使其更适用于分析型的数据查询和获取。 多维数据模型的定义和作用   多维数据模型是为了满足用户从多角度多层次进行数据查询和......

» 阅读更多: 数据仓库的多维数据模型

数据仓库的基本架构

2010年8月1日
数据仓库的基本架构   数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。其实数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。因此数据仓库的基本架构主要包含的是数据流入流出的过程,可以分为三层——源数据、数据仓库、数据应用:   从图中可以看出数据仓库的数据来源于不同的源数据,并提供多样的数......

» 阅读更多: 数据仓库的基本架构

数据仓库的源数据类型

2010年7月20日
数据仓库的源数据类型   数据仓库中集成了企业几乎所有的可以获取到的数据以用于数据分析和决策支持,当然也包括了我在网站分析的数据来源一文中所提到的所有数据。这些进入到数据仓库中的数据无外乎三种类型:结构化数据、半结构化数据和非结构化数据,它们经过转化后以某种形式统一地储存在数据仓库中,即通常说的ETL(Extract, Transform, Load,抽取、转换、装载)的过程。下面主要说一下这三种数据类型的区别,它们分别包括哪些源数据以及这......

» 阅读更多: 数据仓库的源数据类型

数据仓库的价值

2010年2月25日
数据仓库的价值   相信大家都了解数据仓库的4个基本特征:面向主题的、集成的、相对稳定的、记录历史的,而数据仓库的价值正是基于这4个特征体现的: 1、高效的数据组织形式   面向主题的特性决定了数据仓库拥有业务数据库所无法拥有的高效的数据组织形式,更加完整的数据体系,清晰的数据分类和分层机制。因为所有数据在进入数据仓库之前都经过清洗和过滤,使原始数据不再杂乱无章,基于优化查询的组织形式,有效提高数据获取、统计和分析的效率......

» 阅读更多: 数据仓库的价值