2022-09-07 18:22 浏览量:310
一 、 数据治理是什么
数据治理是指为确保数据安全、私有、准确、可用和易用所执行的所有操作。它包括人们必须采取的行动、必须遵循的流程以及在整个数据生命周期中为其提供支持的技术。通俗一些解释就是为保证在普通用户数据消费时能做到“找的到、读的懂、信的过”所制定的从数据生产、数据应用、数据管理等整个数据生命周期所有的标准和规范。
整体来看就是,其中数据规划是纲领、制定数据标准是基础、整理数据是过程、搭建数据管理工具是技术手段、构建运维体系是前提,推广贯标是持续保障
二 、那些数据被治理及其治理基础
数据治理的范围很多都集中在仓内,很多公司经历了多年的建设,拥有大量独立的数据应用体系,数据架构非常复杂,也是数据治理绕不开的一道墙。
尤其是在构建数据资产大盘时就需要考虑仓外元数据的管理以及一些手工元数据的管理。也就是仓内和仓外的元数据。
统一来看就是包括业务属性、技术属性、管理属性相关的三方面的元数据。而实现这些就需要元数据管理平台,数据只有先被管理起来才有治理可能。而对于元数据管理的实现,可以查看先前的文章
三 、 数据治理所要面对的问题
1.数据开发需要快速迭代
业务探索期/高速发展期需要快速获取运营数据,业务方能接受的排期不会超过1周,留给数据建设的周期并不长,很多报表直接从ODS源表进行加工,为了快速上线牺牲设计,效率优先,且缺乏协作,很多数据团队最核心要交付的是短期业务价值,重构带来需求交付效率的下降且短期无明显价值增长,也有很多数据团队就会选择边开发边进行治理的方案,“先污染后治理”是当前数据治理的主流方案。
2.初期成本不明显
数据治理是一个系统的、全面的工作,在开始实行多标准、规范流程不仅开发人员会觉得不适应,同时很难看到明显的成效。
一般都是在成本不足、数据产出不及时、指标口径对不上,数据质量出问题后再开始推行的数据治理,初期是很难看到成效的,这个必须要有对应的领导有一定的决心坚持的去推行下去,同时也要做到指定可量化的数据治理成效标准,切实体会到数据治理所带来的收益,才能更加坚定逐步的贯彻下去。
3.流程规范执行不彻底
开发人员可能会感觉对标准和规范的实行感到繁琐,在不影响开发的情况下可能就不去维护对应的保准和规范需要的元数据,而这个就需要有对应的审核和管理流程,将数据开发和数据治理相结合,如:
上线前数据模型、质量、安全等规范未落地不允许发布上线等方式确保执行落地。
四 、 数据治理可以带来的成果
1. 做出更明智、更及时的决策
整个组织中的用户都可以获得数据以联系和服务客户、设计和改进产品和服务,并抓住获得新收入的机会。
2.改善费用控制
数据可以帮助您更高效地管理资源。
因为您可以消除由信息孤岛产生的数据重复,所以不必过多地购买(也不必维护)昂贵的硬件。
3.增强合规性
日益复杂的监管环境使得组织建立健全的数据治理做法变得更加重要。
您可以在主动预期新法规的同时避免不合规的风险。
4.获得客户和提供商更大的信任
通过可审核地遵从内部和外部数据政策,您将获得客户和合作伙伴的信任,他们相信您会保护他们的敏感信息,因而对与您开展业务充满信心。
5.更轻松地管理风险
通过强大的治理,您可以消除以下后顾之忧:
将敏感数据暴露给缺乏适当授权的个人或系统、恶意外部人员的入侵,甚至是内部人员访问其无权查看的数据。
6. 允许更多人员访问更多数据
强大的数据治理功能可以让更多人员访问更多数据,确保这些人员具有相应数据的访问权限,并且数据民主化不会对组织产生负面影响。
总结:
简要介绍了一下数据治理相关的内容。
数据治理是一个复杂的系统工程,涉及到企业和单位多个领域,既要做好顶层设计,又要解决好统一标准、统一流程、统一管理体系等问题,同时也要解决好数据采集、数据清洗、数据对接和应用集成等相关问题。
这涉及到每一个数据相关的人员,同时也是要在不断的迭代中改进对应的标准,这个也是一个长期的工程
来源:迪答数据