数据仓库与数据库的主要区别有
1、数据库:是一种逻辑概念,用来存放数据的仓库,通过数据库软件来实现。数据库由很多表组成,表是二维的,一张表里面有很多字段。字段一字排开,对数据就一行一行的写入表中。数据库的表,在于能够用二维表现多维的关系。如:oracle、DB2、MySQL、Sybase、MSSQL Server等。
2、数据仓库:是数据库概念的升级。从逻辑上理解,数据库和数据仓库没有区别,都是通过数据库软件实现存放数据的地方,只不过从数据量来说,数据仓库要比数据库更庞大德多。数据仓库主要用于数据挖掘和数据分析,辅助领导做决策;
区别主要总结为以下几点:
1.数据库只存放在当前值,数据仓库存放历史值;
2.数据库内数据是动态变化的,只要有业务发生,数据就会被更新,而数据仓库则是静态的历史数据,只能定期添加、刷新;
3.数据库中的数据结构比较复杂,有各种结构以适合业务处理系统的需要,而数据仓库中的数据结构则相对简单;
4.数据库中数据访问频率较高,但访问量较少,而数据仓库的访问频率低但访问量却很高;
5.数据库中数据的目标是面向业务处理人员的,为业务处理人员提供信息处理的支持,而数据仓库则是面向高层管理人员的,为其提供决策支持;
6.数据库在访问数据时要求响应速度快,其响应时间一般在几秒内,而数据仓库的响应时间则可长达数几小时
通俗一些的理解:
数据仓库:就好比给我们建一所房子,可以住人了。数据仓库系统的作用能实现跨业务条线、跨系统的数据整合,为管理分析和业务决策提供统一的数据支持。数据仓库能够从根本上帮助你把公司的运营数据转化成为高价值的可以获取的信息(或知识),并且在恰当的时候通过恰当的方式把恰当的信息传递给恰当的人。
数据中台,不光是卖给你房子,还会有全方位的配套服务,根据不同客户提供不同的户型、不同的装修。数据中台不是一套软件,也不是一个信息系统,而是一系列数据组件的集合,企业基于自身的信息化建设基础、数据基础以及业务特点对数据中台的能力进行定义,基于能力定义利用数据组件搭建自己的数据中台。
我们来看看客户分对数据仓库、大数据平台、还是数据中台有哪些问题:
这是现在数据行业经常讨论的问题。那么,数据仓库、数据中台究竟有哪些区别,企业应该怎么选?
两者有哪些区别?
数据仓库和数据中台的区别是什么?下面用一张图来说明。(里面加入了数据平台的对比)
1、概念上的区别:
数据中台:企业级的逻辑概念,体现企业 D2V(Data to Value)的能力。
数据仓库:一个相对具体的功能概念,是存储和管理一个或多个主题数据的集合。
2、应用上的区别:
数据中台:距离业务更近,通过将数据服务化之后提供给业务系统,为业务提供速度更快的服务,不仅限于分析型场景,也适用于交易型场景,强调共享和复用;
数据仓库:支持管理决策分析,主要应用于BI;
3、价值上的区别:
数据中台:建立在数据仓库和大数据平台上,是加速企业从数据到业务价值过程的中间层。数据中台将数据生产为一个个数据 API 服务,以更高效的方式为业务提供服务。
数据仓库:存储的数据大多是根据需求有针对性抽取的结构化历史数据,能够生成各类报表,但这些报表都无法实时产生,因此,尽管能提供部分业务价值,但不能直接影响业务。
数据仓库算产品,数据中台的精髓在于其机制,数据中台不是一个产品,而是一套体系,是一种组织架构,数据中台的开发和建设既可以建立企业数据仓库基础上,也可以建立在企业大数据平台基础上,区别就在于企业的数据应用场景是否多元化。
2 数据中台承载的对象
数据中台不是一个简单的系统应用, 数据对于一个企业来说是推动业务的核心。数据中台承载的对象是能力,包括业务能力、技术能力、计算能力、数据能力、AI能力等等,所有企业从组织层面可沉淀、可复用的各种能力。数据中台所做的不仅仅只是整合数据,找到数据,他将沉淀的各种能力共享给前台各种应用,从缩减时间、降低成本、规避风险、提高效率等各个方面全方位提升企业数字化敏捷力。
3 数据中台能解决哪些问题?
1、效率问题
为什么应用开发增加一个报表,就要十几天时间?为什么不能实时获得用户推荐清单?当业务人员对数据产生一点疑问的时候,需要花费很长的时间,结果发现是数据源的数据变了,最终影响上线时间。
2、协作问题
当业务应用开发的时候,虽然和别的项目需求大致差不多,但因为是别的项目组维护的,所以数据还是要自己再开发一遍。
3、能力问题
数据的处理和维护是一个相对独立的技术,需要相当专业的人来完成,但是很多时候,我们有一大把的应用开发人员,而数据开发人员很少。
这三类问题都会导致应用开发团队变慢。这就是中台的关键——让前台开发团队的开发速度不受后台数据开发的影响。
所以企业无论数据量大小,只要有业务场景需求,降低开发成本,快速灵活的开发业务应用产品,就应该把数据中台的建设提上议程,在具体技术选型上,可以根据数据量的大小和场景的复杂度来选择。
数据仓库:为企业所有级别的决策制定过程,提供所有类型数据支持的战略(数据)集合。
大数据:所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
传统数据库:一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。
数据仓库与传统数据库应用的区别,有下面几点:
用途:传统数据库主要用于OLTP(on-line transaction processing)翻译为联机事务处理,即即时的系统交互,数据仓库主要用于OLAP(On-Line Analytical Processing)翻译为联机分析处理,从字面上来看OLTP是做事务处理,OLAP是做分析处理。从对数据库操作来看,OLTP主要是对数据的增删改,OLAP是对数据的查询。
建模:传统数据库主要使用范式建模,数据仓库可以根据需要采用范式建模或者现在互联网普遍使用的星形模型等。
使用技术:一般使用mysql等关系型数据库,数据仓库目前互联网行业更多的是使用hadoop等大数据技术,也有使用mysql等,可以根据实际情况搭建。
存储的数据:传统数据库只存储当前状态的数据,数据仓库需要存储历史状态的数据,用户对历史数据的回溯分析。
可以参考这篇文章:数据仓库(1)什么是数据仓库 - 知乎 (zhihu.com)