主页 > 新闻资讯 > 讲讲大数据的两个概念:数据库与数据仓库

讲讲大数据的两个概念:数据库与数据仓库

作者:张老师 浏览次数: 2020-09-17 17:50
在大数据的学习当中,我们常常会听到两个概念:数据库、数据仓库。看起来一字之差的两个专业词汇,常常引起很多的误会,尤其是刚开始学习的新手,对于这两个概念常常认识不清。今天我们就来讲讲这两个概念,数据库与数据仓库。

首先,从比较浅显的层面来说,数据库有很多选择,在企业当中,数据库是实现数据管理的工具,企业当中,不同来源的数据,可能存在不同的数据库当中,比如说MySQL、MangoDB、Oracle等。

而数据仓库,则是针对于这些不同来源的数据进行整合,它可以对多种业务数据进行筛选和整合,用于支持下一步的分析处理。

数据库与数据仓库

理解了数据库与数据仓库各自要做的事,接下来我们来谈谈这两者的区别。

1、概念上的区别

数据库是一种逻辑概念,而数据仓库是数据库概念的升级。

从逻辑上理解,数据库和数据仓库没有区别,都是通过数据库软件实现存放数据的地方。只不过从数据量来说,数据仓库要比数据库更庞大的多。数据仓库主要用于数据挖掘和数据分析,辅助领导做决策。

2、数据存储与应用

数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用。

数据库存放的是当前值,数据是动态变化的,且访问量少但访问频率高;而数据仓库存放静态的历史数据,只能定期添加、刷新,访问频率低但访问量却很高。

此外,数据库中的数据结构比较复杂,有各种结构以适合业务处理系统的需要,面向业务处理人员的,为业务处理人员提供信息处理的支持;而数据仓库中的数据结构则相对简单,面向高层管理人员,为其提供决策支持。

3、技术上的区别

数据库与数据仓库的区别,实际讲的是OLTP与OLAP的区别。

OLTP:操作型处理,也称联机事务处理,表示事务多,但执行大多较短,并发量大的数据库,如日常的进销存操作等;系统强调数据库内存效率,强调内存各种指标的命令率,强调绑定变量,强调并发操作。

OLAP:分析型处理,也称联机分析处理,表示事务较少,但执行大多较长,并发量较小的数据库,如基于数据仓库的操作;系统强调数据分析,强调SQL执行市场,强调磁盘I/O,强调分区等。

4、模型上的区别

数据库:主要遵从范式模型(1NF,2NF,3NF,等等),从而尽可能减少数据冗余,保证数据引用的完整性。

数据仓库:强调数据分析的效率,复杂查询的速度,数据之间的相关性分析。数据仓库多使用多维模型,提高数据分析的效率。

对于大数据当中常常涉及到的两个概念,数据库与数据仓库,以上就为大家做了简单的介绍了。大数据学习,对于数据库和数据仓库的理解,需要区分开来,尤其是做开发,一定要理解到位才行。成都加米谷大数据,专业大数据培训机构,大数据开发、数据分析与挖掘,零基础入门班,本月正在招生中,现已开放试听,详情可联系客服预约!
热点排行
推荐文章
立即申请>>