2023-03-07 07:18 浏览量:350
数据中台的概念火遍大江南北,有的厂商将数据仓库包装叫数据中台,有的厂商将数据湖做一些解读,叫数据中台。为什么企业已经有了那么多的数据系统,用户对于数据中台这个概念的认可来自什么样的动力和诉求?
市场上并没有一个统一的定义,数据中台究竟是什么,要提供哪些能力?精益数据方法论为什么是数据中台,应该由用户的诉求来确定。
2020年,笔者发起了一个《行业数据中台调研》,收到1700多份有效问卷,分析总结了用户对于数据中台的5大诉求,如图7-18所示:
图7-18 用户对于数据中台的5大诉求
这是排名第一,超过70%的用户都提出的对于数据中台的需求。究其原因数据中台之前,数据在企业的利用模式主要是数据仓库,将数据加工成以报表为主的洞察类产品,然后由业务和管理人员来看这些数据报表,做出决策影响业务。而这个过程一来太长,二来受人为的经验干扰太大,所以导致数据的价值讲不清楚。销量的增加,是由于数据洞察准确带来的,还是偶然的事件?所以数据在企业里虽然越来越重要,但是并没有直接参与业务的经营。而数据中台的出现,让这一切成为可能,通过数据API这样的实时数据接口,能够将数据洞察变成数据服务,直接指导和影响业务的决策,参与到业务当中来。
过去的数据系统以存储和管理数据为核心目标,就像一个仓库的管理员,只要仓库里的货物不丢失,不坏就达成了目标,至于仓库里的货物是否能够卖得出去,这不会仓库的管理员要关心的。但是随着企业对于数据的投资越来越大,业务对于数据的依赖越来越高,企业对于数据的期待不仅限于数据资源的管理,更多的希望这些数据能够产生客户价值,甚至直接为企业带来收入。
数据中台之前的企业数据系统以数据仓库为代表的,提供的主要是在线分析型服务(OLAP),这类服务无法提供实时的数据服务。
主要体现在两个不及时:
第一是服务不及时:受数据仓库的技术架构所限,业务部门对数据仓库的报表提出新的需求, 至少需要一天的时间来修改模型,重新加载数据后才能上线;
第二是数据不及时,很多企业的销售报表,是只能统计到前一天的,无法把当天实时的销量数据和历史的销量数据进行整合分析。
这是计算和存储技术能力所限。而在云计算,大数据,流计算技术日趋成熟的今天,企业希望数据能够更快地响应业务的需求,能够更快地开发速度,更及时的数据。
很多企业的数据分散在不同的业务部门,各自开发各自的,从数据表格,到数据报表,割裂,零散,缺乏统一的管理。所以,当业务部门有需求的时候不知道到哪里能直接找到最可信的数据,而IT部门的带宽有限,无法及时满足所有业务部门的数据需求,于是各个业务部门又基于自己的需求和理解开发了很多新的数据和数据服务。这样一来,企业的数据更加复杂,一个指标可能又众多个版本,这也带来了非常大的数据问题。因为数据不可信,所以要自己搞,搞出来的数据别人也不信任,企业缺少统一的数据服务已经是一个长期存在的问题。
用户希望数据中台能够统一数据服务,把分散在各个业务系统,数据平台,数据应用里的数据服务进行重构,整合,去重,提供统一的,唯一的,可信的数据服务。
虽然每个企业的高层都对数据越来越重视,并且也在大会小会强调数据是企业的,要共享,要集成,但是最终执行起来却困难重重。一来,缺少统一的标准,或者说即使建立了统一的标准,也只是挂在墙上,无法落地。二来,数据都沉淀在各个业务系统里,而业务部门之间是有明确的职能分工的,数据一旦统一共享了,那么业务部门内部的情况也就一览无余了,这并不是很多业务部门所希望看到的。大家都希望别的部门的数据能够对自己开放,而自己的数据却选择性开放,因为大家都知道,数据是业务最真实的存在。所以,很多企业每个业务部门都有自己的数据应用,构建的数据仓库又是按业务领域的,所以有的企业数据仓库就有好几套,加上公司级的数据平台,集团级的大数据平台,企业的数据资产层层叠叠,已经成了数据千层饼,这不仅造成了存储空间的巨大浪费,更给数据的分析利用带来了巨大的挑战。
用户希望数据中台能够结束企业现在的数据乱象,将所有的这些数据资产打通,统一构建企业唯一的数据资产体系,开发统一的数据服务,快速提供给业务。
精益数据方法认为,数据中台的定义是:为业务提供价值服务的统一数据生产平台,如图7-19所示:
图7-19 数据中台的定义
这个定义清晰的指明了数据中台的4个核心要素,缺一不可:
l 业务价值
数据中台一定要以业务为核心,从业务目标出发,而不是从数据或者技术出发,数据中台一定要解决业务问题,而不是技术部门的自娱自乐。
l 价值服务
数据中台一定要提供有价值的服务,这里的价值要能够被度量,让业务用户有获得感。
l 统一入口
每个组织有且只能有一个统一的企业级数据中台,这个数据中台能够汇聚所有的数据资产,统一数据生产标准,沉淀和运营所有的数据产品,是企业数据资产的唯一管理和生产平台。
l 数据生产平台
数据中台的核心是数据的汇聚,加工,生产,将企业的数据加工成解决业务问题,带来业务价值的数据产品。
来源:凯哥讲故事系列