文章目录
前言
#博学谷IT学习技术支持#
一、数据仓库介绍
(一) 数据仓库的基本概念
数据仓库,简称数仓,是一个很大的数据存储集合,出于企业的分析性报告和决策支持目的而创建,对多样的业务数据进行筛选与整合。它为企业提供一定的商业智能能力,指导业务流程改进、监视时间、成本、质量以及控制,数据仓库的输入方是各种各样的数据源,最终的输出用于企业的数据分析、数据挖掘、数据报表等方向
(二)数据仓库的主要特征
数仓的特性主要有以下四种:
- 主题性,数据仓库根据使用者实际需求,将不同数据源的数据在一个较高的抽象层次上做整合,所有数据都围绕某一主题来组织
- 集成性,数仓中存储的数据是来源于多个数据源的集成,原始数据来自不同的数据源,存储方式各不相同
- 稳定性,数仓中保存的数据是一系列历史数据,不允许被修改
- 时变性,数仓会定期接收新的集成数据,反应出最新的数据变化
(三)数据仓库与数据库的区别
两者的区别主要有以下几点:
- 数据库是面向事务的设计,数据仓库是面向主题设计的。
- 数据库一般存储业务数据,数据仓库存储的一般是历史