数仓系统

  • 业务需求
  • 逻辑设计
  • 物理设计

数据仓库:一个整体上着手,逐步解决细节问题的体系结构

决策支持系统:Decision Support System, DSS

定义

数据集合

面向主题

主题域

集成的

一致性编码
一致性处理

ETL系统

抽取(extract)

给定一些参数,在数据源中搜索满足参数条件的数据,然后将这些数据拖到别处。
自然演化式体系结构——蜘蛛网,直接抽取、间接抽取。缺乏集成性。

交互转换(transform)
加载(load)

非易失的

随时间变化胡

信息的目的

  • 操作型 记录的保存
  • 分析型 决策的制定

体系结构

操作层 原子层 部门层 个体层
业务系统 数据仓库 数据集市
当前数据 历史数据 汇总数据 暂时数据
领域狭隘 启发式分析
为特定目的的
非重复的
-

操作层

面向应用的原始数据,当前状态。

用户:确保组织正常运转
优化:更快的处理事务
通常不维护历史数据,只须修改数据以反映最新的状态

原子层/数据仓库

不可更新的集成的原始历史数据

数据仓库

用户: 研究分析企业的运转,对其性能进行评估。
优化:高性能的完成用户的查询

数据集成

当数据从操作型环境传向数据仓库环境时,需要对数据进行集成。
所谓数据集成,就是把一个实体所有种类的相关信息关联在一起。

部门层/数据集市

个体层

文档更新时间: 2019-06-20 14:54