中国数字规划之后,近日在*会两**中国务院机构改革的方案中,又提出要组建国家数据局。这又给了数据人强烈的鼓舞,数据人再一次站到了高光的舞台上。
所以有必要对数据工作必备技能——数据治理的概念、治理原则、要求等进行说明。

一般人的生老病死是有生命周期的,企业从创办到消亡是生命周期,同样数据也有生命周期。
数据的生命周期是从数据的产生(录入或自动生成)、存储、流转、应用、然后封存、销毁(删除)的一个全部过程。因此在数据的全生命周期中,必然会存在数据的各种各样的问题,比如说找不到、管不住、用不了等等。所以,要解决这些数据问题,就需要采用各种各样的应对措施,这就是数据治理。
这样就可以清晰地了解到,进行数据治理的过程是一个系统的过程,需要贯穿上下的组织结构、考虑完善的制度与流程、选择适应自身的技术体系、数据可靠性、质量体系以及数据安全。
数字化建设有四个基本的原则:
1、有明确的数据来源
2、数据客观科学
3、数据分析效率
4、数据安全管控
所以针对于数据治理,也必须要从这四个基本原则出发,采取相应的方法及措施。
一、有明确的数据来源——数据从哪里来
这是数据生命周期的起点,数据的来源决定了数据治理策略的基础。但是在数字化转型之初,很多企业的数据是缺失不全的,甚至很多企业并不知道需要采集哪些数据,才会对企业战略探讨能够起到客观科学的作用。

或者数据是散落、不系统的,企业并不知道需要如何整合和汇总,造成了部门之间的数据不统一,采集不规范的情况。
所以数据治理必须要关注这些问题,制定相应的策略来管理数据的来源,引导收集规范可分析的数据,控制数据来源的路径和生命周期。
二、数据客观科学
经常收集到的数据是不规范的且数量庞大的,这样就对数据管理者非常的头疼。如何将数据中的噪音和重要数据分开才只是数据分析的开始。
所以在采集数据的时候,就需要对数据提出一系列规范和要求,其中包括数据的一致性、完整性、准确性、有效性、及时性。
同时还需要保证,所采集到的数据是合法并且原始真实的。否则在数据从采集、加工处理这个长链路和流程中,某一个环节出现问题,都会导致整条数据链路的数据错误。
三、数据分析效率
在数据智能时代,千万级的数据处理也给数据驱动业务带来了不少的压力。企业如何提高数据效率,节约数据成本,获取数据资产价值成为了数据治理的关键问题。

提高数据处理效率,就涉及到数据仓库的资产化管理,比如元数据管理、主数据管理,模型开发效率高,可复用,通过数据仓库分层建设,提升开发效率和运维效率。
还要求数据资产管理的数据产品,既能满足数据仓库建设的高效率,同时也具备资产索引的地图能力,方便业务查找和使用数据。
四、数据安全管控
数据安全主要是针对数据的安全脱敏管理和安全检查。常用的脱敏方式有以下两种:
1、在数据仓库的接入和输出进行脱敏管控,这样操作的好处在于安全易于管控,并且过程少,缺点是会增加开发的工作量;
2、针对用户进行脱敏管理,就是需要对数据仓库的每一层的敏感数据都进行脱敏处理。它的好处在于对开发没有太大影响,但是加大了安全管理的复杂度,需要全域扫描敏感信息,过敏工作量大。