2022-11-07 20:46 浏览量:467
数据治理往往被认为是费力不讨好的事。如何更简单的实现数据治理?可能传统的数据治理思路和数仓、大数据平台、数据湖的建设思路需要调整。其实笔者一直是反对企业建设数据湖的。不建议用数据湖的原因就是数据湖中存储着各种各样未经过处理的数据,想要使用数据是你需要额外很多中间环节的数据处理工作。当然你也可以使用数据湖进行数据治理,但数据量达到一定的程度,可能会超过人的管理极限,只能靠工具去做治理,这就可能会带来很多意想不到的问题,所以最终会走向数据沼泽、数据深渊,难以再从这些数据获得价值,除非付出更大的代价。
信息化这么多年,其实很多公司已经积累了很多的经验,只是拗于厂商的思路和方案,往往无法走出思维误区。遇到阻碍可能是企业流程重构的契机。传统数据治理的思路也需要重构的。数据治理最省力的方式是使数据产生的时候就是标准化的,而不是在后期进行数据的转换和繁琐处理。传统围绕元数据管理的方式也使数据治理缺乏立体性,而基于企业主数据的数据架构能更好的体现数据的全局性、系统性和立体性,更便于对数据的处理和使用。
在对数据进行处理和使用时,数据的质量就很关键了。如果数据质量高,那么数据用起来就得心应手;如果数据质量差,不得不额外增加繁多的数据处理过程,会造成事倍功半的结果。这是体现数据治理价值所在的。数据治理可以早做也可以晚做,甚至可以不做,关键在于数据应用场景和数据应用的深度。数字化和数字化转型往往需要对数据进行深度处理和分析,所以数据质量往往会影响到数字化的能力和转型的效率。数据治理往往是需要做的,不过是早做晚做、早花钱晚花钱的问题。否则可能无法分析数据之间的关系和联系,或者会得出错误的结果,比如说,同样的术语可能代表不一样的含义,不同的数据实体也可能是同一个东西。数据冗余、缺失、错误、格式不同、编码不同等等都会增加数据处理环节,从而降低数据处理的效率,降低数据的价值。
数据顺利应用的前提是良好的数据质量,良好的数据质量来自于良好的数据治理能力。新的数据治理方法面临着存量业务系统和增量业务系统数据治理问题,需要分开来考虑。对于增量的系统,需要考虑全部遵循规范化和标准化。提前规划设计数据架构体系、数据标准和治理体系。对于存量系统,暂维持原来的方式,根据实际需要以新的数据架构和标准逐步替换这些存量系统,直至全部替换。数据规范化和标准化是第一步,数据被使用和应用之前,往往还需要很多的数据预处理工作,比如说,数据计算和统计、数据分类和归类、数据标记和存储等等。这样在使用数据的时候,就可以按图索骥,快速找到需要的数据。这样可以构建企业数据的一个“图书馆”,也就实现了企业数据资产的管理。
因此总的来说,数据作为数字化转型的驱动要素,数据质量的高低决定了数字化转型的难易和成本,做好数据治理将有助于企业的数字化转型,促进企业的数字化转型。
来源:技术思维创新
作者:汪照辉
热门文章