数据仓库的英文是Data Warehouse,通常被简写为Dw。数据仓库概念创始人W.H.Inmon对数据仓库的定义是:数据仓库就是面向主题的、集成的、相对稳定的、随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程。
数据仓库中的数据一定是按照主题域进行组织的。每一个主题对应一个宏观的分析领域,比如,在银行业实施的数据仓库的主题可以是客户、账号、汇率等等:数据仓库的集成特性是指将来自多个数据源的,可能存在编码、属性或者命名不一致的数据按照某种规则进行重组后,在加载到数据仓库中,对于数据仓库来讲,这也是最关键的步骤。数据仓库的稳定性是指数据仓库反映的是长期积累下来的历史数据,是经过ETL的(抽取,转换,加载),因此,这写数据极少或根本不修改的;数据仓库中的数据时随时间变化的体现在这些数据是不同时间的数据集合,其中保存着大量的历史和现阶段产生的数据,时间元素在数据仓库中是必不可少的,以便进行趋势分析等。
数据仓库重要的作用是通过查询分析数据(包括报表、OLAP、挖掘),把隐藏在海量数据中的信息找出来,为领导正确决策提供技术支持。