“卓阅数据中台” 第一回 | 什么是数据中台(一)

2023-02-28 10:00 浏览量:288

数据中台自提出以来备受关注,至今仍是各企业在数字化转型浪潮中不断提起的常见话题。围绕数据中台,人们总是有很多疑问,其中最为基本的问题就是希望明确什么是数据中台?这一问题,往往无法简单的通过一句话去直截了当地进行准确解答,其概念的复杂性放大了对其进行简洁凝练表达的难度。由此,我们试图通过对一些问题进行剖析归纳,以期窥得数据中台的大致全貌。

 

 

 

本篇文章中将重点通过分析探讨以下问题,一睹数据中台的剪影。

 

 

Q:数据中台是一套技术工具吗?
 

作为被应用方问到最多的问题之一,这一问题暴露出的是数据中台诞生及推广过程中形成的一些影响,同时也体现了大多数人对于数据中台最宏观的疑惑,即数据中台应该是一种什么类型的概念?

 

 

 
 
 
 

*01* 天下熙熙,皆为利来;天下壤壤,皆为利往。

 
 
 
 
 

 

从数据中台这一词汇的源头来看,阿里对其带来的影响是难以忽视的。

 

2015年,“阿里巴巴集团宣布组织结构全面升级,建设整合阿里产品技术和数据能力的强大中台,进而形成‘大中台,小前台’的组织和业务体制,使前线业务更加灵动、敏捷。”

 

阿里第一次提出中台时已经清晰的昭示了其本质,即中台是对组织架构进行调整的产物,甚至可以直白的理解为形成一套部门,来专门负责相应的组织内部通用基础能力。数据中台则顾名思义,对应组织内部的数据能力。

 

而与此同时,这段话中也精巧的埋下了一条隐线,即对于业务价值的提升。一方面,中台是一种调整而得的“组织和业务体制”,企业组织架构的调整不外乎服务于业务的发展;另一方面,“使前线业务更加灵动、敏捷”更加直白的说明了企业对于业务开拓及迭代效率提升的渴望。

 

企业的第一目标是盈利,无论是组织架构调整,还是引进先进人才与技术,多数时候优先以提升自身盈利能力为目的,中台的出现并没有打破这种规律。了解过数据中台历史沿革的人们都知道,阿里对数据中台的引进源于对Supercell的调研,源于对其盈利效率的惊讶,彼时目睹到的组织架构和业务体制,可以使新业务的发展进一步降低试错成本、提高迭代效率,这一特性之于本就投入轻、成型快的互联网业务来说可谓如虎添翼,阿里对于这一架构的引入也顺理成章。

 

这一“全面升级”后续对于阿里的盈利能力实际有多大提升,我们无从得知,实际上也确实难以准确衡量,一条增长曲线的背后往往隐含着大量影响因子。但我们可以知道的是,短短几年后,数据中台的对外输出之路开启,数据中台的名字开始被人熟知。即便无法求得中台对于阿里内部的优化提升情况,但对外输出的数据中台,却能够切切实实的创造新的增长机遇。

 

有机遇的道路上,就不会缺少同行者。敏锐觉察到机遇的人们纷纷效仿,阿里原本的数据中台团队也开枝散叶,大大小小的中台厂商鳞次栉比,整个产业一派繁荣火热的景象。

 

在ToB的市场中,出售标准化的技术产品是效率最高的盈利方式之一,由此在接下来大大小小的数据中台项目中,无论面对何种行业、何种场景,在大声探讨数据中台建设和应用理论的同时,通常少不了配套的成套数据中台产品交付。我们首先不应该质疑这些项目的建设是不是一定需要这些产品,而是应该思考是不是粗放型的产品兜售模式给人们建立起了一开始问题中的这一印象,即数据中台就是一套技术工具?

 

但这一问题也一定同增长曲线一样,并不只有这一个影响因子。在输出模式这一诱因下,应用方的知识缺乏、主动性差,产业界的概念混杂、方法论失位也同样难辞其咎。

 

利益驱动能够推动一个产业的诞生和快速发展,但这一过程中不免遗留下各种问题。

 

 
 
 
 

*02* 大道无常 众生万相

 
 
 
 
 

 

人们通常总希望有一套终极的理论或方法可以解决一类相似问题,做到掌握一种方法就可以一通百通,但在实践中却不尽然。通过掌握尽量少的方法解决尽量多的问题是符合人类原始惰性的思维方式,因为思考新的方法难,执行老的方法易。但实际上不同的问题之间总有区别,可相通但难照搬,细枝末节的区别造就了大量工作于此的岗位。

 

那么数据中台想解决的问题是什么?

 

回到开始,数据中台的目的是整合企业的数据能力,使前线业务的开展更加容易。这其中可以看出这些业务多多少少是要使用到数据的,构建数据中台的组织寄希望于由中台来满足新业务开展中的数据需求,并持续积累实现的各类需求以更快的满足新的业务。

 

由此数据中台的建设有两个前提,有业务需要数据,希望开展新的需要数据的业务。在此基础上,数据中台希望优化数据需求满足过程的效率和成本。

 

那么不同企业的数据需求满足过程,是否可以通过相同的方式优化?直观的可以想到一定有通用的方法,也一定有更多不通用的方法。

 

对于不同的企业,理想中能够全面优化其数据需求满足过程的数据中台必然不尽相同。对于富含大量数据驱动业务的企业,通常希望能够预知新业务可能会需要的数据支撑形态及形式,基于已积累的工作或预支一定工作快速甚至提前满足其数据需求;对于拥有部分数据驱动业务但同时还有部分业务可用数据但未用数据的企业,更希望厘清这些后排业务的数据需求,并同已完成的数据需求进行匹配,有则用之,无则另行实现;对于所有业务均未用到数据的企业,则希望在全面梳理业务潜在数据需求的同时,为自己搭建起一套能够实现数据需求的工作流程体系。

 

这些都是在优化数据需求的满足过程,这些是不是应该都是在建设数据中台?以上仅仅是从企业对数据使用的程度分类所得,类似的按照企业的发展阶段、业务规模、所属行业等不同维度也相应能够得出更多的分类结果,可想而知,数之不尽的企业对于数据中台的需求何其纷杂繁复。

 

更可怕的是,在数据中台这一概念诞生之前,这样的事没有发生过吗?显然是不可能的。

 

人类自结绳记事起便开始同数据打交道,通过可重复的、结果可长期显现的动作记录数据至今仍是各类数据存储方式的基本原理。四柱记账法带来了最早的使单一数据在其变化过程中保持一致性的记录方法,其确保数据一致性的思想至今仍在数据库系统中常驻。计算机的出现真正意义上革新了人类进行数据计算的效率,由此开启的信息时代是我们当前能在这里讨论一切的基础。随后在软件逐渐成为普适工具的年代里,人们开始使用数据库存储数据并处理数据的变化,使用BI工具分析一系列数据中蕴含的信息。上世纪90年代,数据仓库理论诞生,人们开始对组织内部的数据进行面向业务的组织和管理以便根据业务需求进行分析,这一方式沿用至今。20世纪末至21世纪初,对于数据质量的感知引导企业着手进行数据治理工作,这类工作至今仍是大多企业管理自身内部数据时的重难点工作。随后,互联网浪潮下数据量的激增迫使人们使用分布式存储及计算架构加以应对,以Hadoop为代表的大数据平台开始成为企业跟随这一时代的标志。近十年,移动互联网的发展助推图片、视频等非结构化数据以更为惊人的速度进行积累,旨在将这些非结构化数据均纳入存管的数据湖开始普及。

 

从古至今,人类为了更好的满足自身的数据需求,不断的发明新的方法并持续普及应用,万般诸法不一枚举。这些实现与使用方式各异的方法看似跟数据中台均有所差异,但是否也是在相应的时代中实现着跟“数据中台”相近甚至是相同的事?

 

用好数据的方式伴随着时代发展也在同步演进,境遇的差异也令一万个人有一万种更好的方式,“数据中台”能否长治久安?抑或有被取代的一天?

 

 
 
 
 

*03* 书同文,车同轨

 
 
 
 
 

 

回到当下,之所以要讨论什么是“数据中台”,一大原因是其概念在实践应用的过程中不断发展,但并没有一致性较强的描述。发展中的事物最难通过静态的定义诠释,时至今日,放眼业界充斥着大大小小的数据中台项目,但项目的内容却并不一致。

 

一个组织的数据能力并不是一日建成的,大多数的组织通过经年累月的相关工作,不断的充实、储备相关的各类能力,在每个时代引入先进的技术与理念,甚至是进一步的推动组织变革。一砖一瓦严丝合缝才能使数据能力的大楼拔地而起。

 

而这每次对于数据能力的迭代和更新,在企业的内部无法逃脱对于成效比的衡量。在数据领域的工作中,有些需要通过人力来推动的工作难以受到重视和支持,不少企业决策者还无法把数据工作同一定数量昂贵的高水平人才持续性的脑力+体力劳动联系起来。工具化对企业来说更现代,也更符合降本提效的纲领,于是投其所好,名目各异的项目纷纷将自身包装成系统平台的建设项目,供应商们也相应的备齐了可以对应到各类需求的工具平台产品,看起来供需平衡一团和气。

 

各类以数据中台自居的项目,确确实实都在通过相应的项目建设优化了自身业务的数据需求满足过程,这又何尝不是在建设“数据中台”?企业通过这些项目不断完善自身数据能力的方方面面,相应的技术工具既提升了相关人员执行各方面数据工作的效率又合理的填充了项目立项时的预算明细,可以说“数据中台”是少不了这些技术工具的,但同时,也不止于这些技术工具。

 

我们已经知道了不同的企业,在不同的时期,根据各自不同的业务情况,需要通过或多或少有些不同的方式去构建和提升自身的数据能力。这些方式围绕着业务对数据进行利用的多个方面,解决着不同的问题。

 

数据如何找、如何取、如何处理、如何分析?数据够不够、准不准、及时不及时?哪些数据需要收集?哪些反复使用到的中间结果需要积累?哪些业务和场景能够利用数据提升效益?如何提升这一系列数据工作的协同效率?如何彰显这一系列数据工作的产出价值?

 

通过建设各方面能力,企业根据自身的优先度级别,逐步的在解决这些问题的同时完善着自身的数据能力。这是建设数据中台应该有的过程,“数据中台”也理应包含这些各个方面的能力,而不只是技术工具能力。

 

然而,强调数据中台不止是技术工具,恰恰是因为技术工具对于数据中台有其重要性。技术工具给出了实现或提升各类数据能力的一种手段,并且随着持续发展愈发全面的对这些能力所需的工具进行了总结。

 

以技术工具建设的方式建设数据中台,给了大多数企业一个捷径。在无法清楚认知自身业务切实需求的前提下,购置一套数据中台技术工具,使企业具有了起码的推行各项能力的保障,甚至是较高规格的保障。但技术工具得由人来使用,数据能力涉及的各项工作得由人来开展和推动。

 

权责、能力、动力、协调配合、思维模式,太多太多的因素影响着人能否用好这些技术工具,足够好的完成相应的数据工作,最终真的转化为业务效益的提升。

 

所以,究竟该如何建好、用好数据中台?究竟什么是“数据中台“?

 

数据中台需要一个标准的定义。需要将其全貌展现在大家面前,让人们能在相同的话语体系下沟通、交流,互相学习、启发。而研究什么是数据中台给了我们实现这一目标的机会,在不断的了解、调查、研究、讨论的过程中,我们逐渐明晰前因后果,也逐渐对其大致的面貌有了感知。

 

由此我们开始数据中台标准化相关工作,着眼于哪些能力应该在企业构建数据中台时纳入到考量范畴中。然而这不代表着它规定了企业数据中台应该达到这些方方面面的要求。

 

书同文,并没有让每本书中都写上一模一样的字句。同样的文字只是剔除了表达体系不同对思想传播带来的门槛,可表达的内容依旧因人而异。数据中台的标准期望达到相同的目标。通过标准,希望人们能对数据中台的全貌多一分了解,同时更重要的是,作为一种启发,引导将其同自身的现状进行比较,寻得可增补裨益的方向。

 

 

 
 
 
 

*04* 路漫漫其修远兮

 
 
 
 
 

 

对于数据中台以及组织如何建设数据能力的相关研究依旧任重道远。

 

一方面,关注于数据中台本身。如何定义其能力框架的范围,构建其能力最小集合,判断哪些是必须的能力,哪些是推荐的能力,哪些是根据自身需求可选的能力,是仍需要被解答的问题。

 

如果说,数据中台是一套促进组织使用好数据的能力集合,那么是不是需要具备这其中的所有能力才算数据中台?如果不是,那么仅有其中一项能力的组织又是否算是构建了自身的数据中台?这些问题依旧需要通过将有形的定义同逐个看似例外的实例对比进一步剖析研究。

 

另一方面,数据中台究其本质依旧是为了使组织更好的使用数据,如果一个组织建设了所谓的“数据中台”却仍无法良好的利用其数据,那问题又出在哪里?又该如何解决?

 

在试图使用好数据的道路上,大多数组织依旧在通过各种前沿、革新的概念和方式解决存在已久的陈年老问题,哪些顽疾历久弥新?又是否有根除的良方?

 

在数据领域,愈行深远,愈发觉得问题堆砌的比已实现的成果更多。但我们的目标依旧是让业务把数据利用起来,让数据的价值在业务效益中体现出来。

 

 

 

 

来源:大数据技术标准推进委员会

作者:王卓

上一篇:数据治理八大趋势(清华大学2035)

下一篇:大数据概念解读

  • 分享:
龙石数据
咨询电话: 0512-87811036,18013092598
联系我们
商务联系微信

商务联系微信

0512-87811036,

18013092598

咨询电话