4个关键点:让数据治理变得简单、高效
视频简介
数据治理变简单有4个要点:确定一个清晰的目标、制定一个可行的机制、找到一个简单的方法(理采存管用)、选择一个好用的工具(数据治理流水线)。
视频内容
现在提到数据治理,大家都很迷茫,行业里创造了太多的概念,弄得专业人士都说不清数据治理到底是啥。
为了帮大家理解什么是数据治理,我在前一个视频里将数据治理类比成粮食加工,大家有兴趣可以去看一看。
我认为,要让数据治理变得简单,可以从4个方面着手:
1、确定一个清晰的目标
2、制定一个可行的机制
3、找到一个简单的方法
4、选择一个好用的工具
目标和机制需要根据组织的情况来确定,这里不讲太多。
从方法上来讲,我们在2019年将它定义为5个字,“理采存管用”。理,就是弄清楚我们有哪些数据;采,就是把分散的数据集中到一起;存,就是把数据集中存储起来;管,就是进行数据质量、数据标准和数据安全的管理;用,就是通过数据标签、数据指标、数据共享、数据报表等方式将数据用起来。

【图(1)】
目前,市场上大多数的数据治理项目只是做了“理采存用”,也能将数据用起来,但如果不把管数也做起来,就不能建立数据治理的长效机制,无法统一标准、提升质量和保障安全,为持续用数保驾护航。
从工具上来讲,我们借鉴工厂流水线的方法来治理数据。例如针对新生入学这个场景,我们先确定数据来源,再创建数据模型,然后做数据归集、数据清洗和数据融合,同时,配套数据标准、数据安全和数据质量方面的保障,然后,再开发数据标签、数据指标和API接口,最后,建成主题库、可视化报表和业务系统。

【图(2)】
这样,一眼就可以看清楚数据治理的全部过程和数据成果,真正做到让数据好管好用。这也是龙石数据的愿景和使命,希望大家能多给我们提建议,帮我们做得更好。