数据治理取得成效 (数据治理工作的几种推进套路)

数据治理法治原则,数据治理标准落地

数据治理法治原则,数据治理标准落地

如今,我们正处于一个全新的时代,数据正成为改变世界、改变未来的重要力量。同时,互联网不断延伸,云规模无限扩大,5G技术即将到来,人工智能快速增长,所有这些都将产生大量的数据。这种转变产生了一个重要的主题——数据治理。

大量新数据的出现则导致了非结构化、半结构化数据爆发式的增长。信息数据的单位由TB、PB、EB、ZB的级别暴增。这些由我们创造的信息背后产生的这些数据早已经远远超越了目前人力所能处理的范畴。如何管理和使用这些数据,逐渐成为一个新的领域。

大数据的快速发展,使它成为IT领域的又一大新兴产业。据中央财经大学中国经济管理研究院博士张永力估算,国外大数据行业约有1000亿美元的市场,而且每年都以10%的速度在增长,增速是软件行业的两倍。产业发展潜力非常巨大。但我国大数据飞速发展的背后存在诸多的问题。对于已经发现的问题,有种种理由不改,比如修改成本高,没有利益方面的好处,操作习惯不符等等,最终结论是维持现状不进行变更,这显然是被动的,而新时代下唯一不变的就是变化。企业内很多系统是老系统,从设计到实现可能已经没有人能完全说的清楚,由此产生的历史问题没人愿意、没人敢于去解决。负责业务系统的部门担心暴露自身问题会导致绩效考核不达标、请其他部门协助修改问题会导致自己权利被分化等等,设置障碍和技术*锁封**,阻碍数据治理的推进。业务部门、数据分析部门、营销部门等在现有的数据分析中,过度依赖于外部工具,比如Excel,Spss等,这些工具不一定适合企业业务现状,数据存在一定的延迟,而且不同部门对于数据的定义和理解不同,会形成数据孤岛。对于数据没有明确的区分,数据中,哪些是主数据,哪些是核心数据,数据来源是否统一,数据定义是否一致,这些实际情况中很可能是混淆的,最终得出的结论也是有偏差的。对于基础数据,严重依赖于人工导出,负责导出数据的人员可能并不熟悉数据,费时费力,有些时候甚至做不到当天导出完成,后续业务部门还要根据这个数据做汇总分析,延迟就更高,在业务飞速发展的背景下,数据的高延迟是不符合实际业务场景的。一些优化的方案即便规划好,由于上述种种原因也可能无法落地,最终导致搁浅,治理工作也成为摆设。

数据治理法治原则,数据治理标准落地

我们先从数据治理的宏观角度出发。

公司要有足够高度的数据战略,战略是选择和决策的集合,要制定出一个高层次的行动方案,以实现更高层次目标。数据战略是企业发展战略中的重要组成部分,是保持和提高数据质量、完整性、安全性和存取的计划,是指导数据治理的最高原则。以2个关键点为核心:

1.通过数据治理,提供数据服务,完成从管理中心到服务中心的转变。

2.通过数据治理,变现数据价值,完成从成本中心到利润中心的转变。

数据治理是否与企业发展战略相吻合,也是衡量数据治理体系实施是否成熟、是否成功的重要标准。在企业发展战略框架下,建立数据治理的战略文化,取决于企业高层领导对数据治理的重视程度、所能提供的资源、重大问题的协调能力,以及对数据治理文化的宣传推广、培训教育等一系列措施。

数据治理的组织包括制度组织和服务组织。制度组织主要负责数据治理规划和数据治理制度。这些组织是跨职能的,由企业高层领导组成,负责整体数据战略、数据政策、数据度量指标等数据治理规程问题。

数据服务组织主要是由数据治理的专业人员组成,主要执行数据治理各个领域的具体实施工作。

有效的组织机构是项目成功的有力保证,为了达到项目预期目标,在项目开始之前对于组织及其责任分工做出规划是非常必要的。数据治理涉及的范围很广,牵涉到不同的业务部门和技术部门,是全局大事。建立由高层领导者组成的数据治理委员会,组织跨业务部门和IT部门的协调工作,规划数据治理的总体方向,并在其下设立数据治理办公室,执行数据治理计划、监督具体的数据治理工作。不同的组织层次应发挥不同的职责职能,建立合理的组织层次有利于快速推动数据治理工作的开展。

根据数据治理工作的实际需要,在业务部门、技术部门间要确定各个工作人员的职责。不同的组织负责的职责不尽相同,例如不同的业务部门应明确各自业务开展对数据的具体要求和相关规则,技术部门负责具体的实施工作,将业务部门提出的要求转化成技术语言,用于事前的风险控制、事中的逻辑控制、事后的结果核查,以及具体的技术操作和编制定期的报告等。

数据治理规章制度会阐明数据治理的主要目标、相关工作人员、职责、决策权利和度量标准。基于规章制度与工具的结合,需要有一个可落地、可操作的管控办法。建立相应的针对数据治理方面的考核办法,并与个人绩效挂钩,考核是保障制度落实的根本。随着数据量的增长、技术水平的发展,为更好的、可持续的实现数据资产的管理与应用,需要建立明确的技术规范。

根据数据治理的内容,建立相应的流程,且遵循企业数据治理的规章制度。结合所使用的数据治理工具,建立符合企业的流程管理。

刚刚谈到的战略文化、规章制度的贯彻落实,就是最好的事前预防措施。我国一些大型企业已经上线了一些专门的数据治理平台,比如企业级元数据管理系统,数据质量分析系统,主数据管理系统、数据生命周期管理系统,将相关的制度规范和职责要求在系统中进行控制和约束,并在流转的各个环节由相应的组织和角色负责,实施认责机制。组织分析各领域的数据质量问题,监测报告各系统的数据结构变化情况,数据分布情况,数据对业务服务的满足情况、在线数据增长情况、数据空缺和质量恶化情况等。这些事中监测过程除了需要规章制度的保障,还要有数据治理平台来进行分析,避免凭空管理。定期对业务系统开展全面的数据治理状况评估,从问题率、解决率、解决时效等方面建立评价指标,通过系统记录并跟踪需要整改的数据问题,要求按期整改优化,必要时进行一定的考核。

技术应用包含支撑核心领域的工具和平台。他们是数据治理能够顺利开展的技术保障。只有建立计算准确、运行稳定、执行高效、功能丰富的数据治理平台,才能从各个领域有效的进行数据治理,提高数据资产价值。

统一管理企业的数据资产,包括元数据、主数据、数据模型、数据集市、数据服务,以及其他重要的数据资产,并提供可视化的数据查询和展示功能,支持通过功能嵌入等方式实现数据资产的快速与便捷查询。落实数据质量问题的治理工作,实现数据质量问题的发现、跟踪、治理、评价的全流程闭环管理。搭建数据生命周期管理平台,落实数据生命周期管理机制。通过不断丰富源系统的基础数据,持续加大数据积累和整合的广度、深度,建设统一的数据仓库平台,满足前台营销、统计分析、决策支持、风险管理等多种需求,持续提升对数据的挖掘、分析与深度应用能力。在建立上述配套支撑系统的基础上,还需要通过数据服务总线实现各系统间的互联互通,相互协同与验证,提供数据格式统一的数据服务。

CMMI协会在2014年发布了数据管理能力成熟度模型Data Management Maturity,可以用来评估和提升企业的数据管理水平,帮助企业跨越业务与IT之间的鸿沟。DMM模型包括了5个连续能力和25个提升的过程域,可以促进企业建立自己的数据管理成熟度路线图。

可执行级:被动、非正式、经常临时性的、数据孤岛式数据管理,这是比较常见的模式。

可管理级:已定义和文档化的流程,在业务部门层面进行,有一定的工作流进行引导。

已定义级:与业务战略保持一致,标准化、一致性的实施。

可度量级:在整个企业中可度量、可跟踪、跨职能依赖协调。

优化管理级:在持续基础上管理,在反馈的基础上创新和流程改进。

数据治理法治原则,数据治理标准落地

数据治理是一个系统工程,是一个从上至下指导,从下而上推进的工作。因此,在指导方面必须得到大家的共识,要有强有力的组织、合理的章程、明确的流程、健壮的系统,这样才能使数据治理工作得到有效的保障。这方面主要还是要有公司高层领导的支持。数据治理主要是对公司现有系统、数据进行治理,面对庞大的数据、复杂的业务、数据治理工作很可能一时间难以入手,这时需要引入处于专业前沿并在数据治理领域有较多实施经验的人才。数据治理工作不是一朝一夕能够做成、见效的工作,它更是一个持续性、迭代式的工作,面对复杂场景有时需要多次迭代才能够顺利完成。

当业务的不同部分正在接收不具代表性或意外的数据时,实施成功的数据治理计划就变得更加困难。业务的一部分员工以意外的方式使用表单上的字段和代码时。这可能是因为数据尚未更新,不足以反映当前的商业现实。无论是什么原因,这些预期的差距都会产生一个问题:数据如何实际转化并带入整个组织?

如果业务的不同部分不共享一个共同的词汇表,即使报告相同的KPI,数据也可能不一致。这不仅会造成混乱和不良见解的负面反馈循环,而且还会使数据治理变得更加困难。

数据治理面临的最大挑战是数据孤岛:大致上是两类。

第一,逻辑性数据孤岛:不同部门站在自己角度定义数据,使得相同数据被赋予不同含义,加大了跨部门数据合作的沟通成本。

第二,物理性数据孤岛:数据在不同部门相互独立存储,独立维护,彼此间相互孤立。

这个世界,缺的是技术过硬又精通业务的工程师,缺的是真正能解决实际业务问题的人,缺的是复合型的人才。

举个例子:做一笔交易,使用微信支付,花了 3.5 元,买了一瓶无糖 330ml 摩登罐的可乐。攒了100积分,拿回一张小票,监控保存全部视频,这一切通过系统记录了下来。这个叫做业务的数据化。

通过数据分析,3.5元的330ml摩登罐可乐销量上升了20%,而且消费者中大多是20-35岁男性,相比之下,300ml普通瓶的可乐销量下滑40%。店长决定下架300ml普通可乐并随330ml摩登罐可乐赠送一些男性专用物品的打折卡,这个叫做数据的业务化。

数据治理并不是新近提出的概念,已经产生已久,市场上成熟的解决方案和工具还有历史处理数据的经验和优秀人才都能有效的降低成本。

任何成功的数据治理计划的第一个步骤就是,要在本企业找到CEO可以授权的人,然后让这个人负责项目的具体实施。没有什么能取代强有力的领导者。数据治理是涉及人事的一个难题,这需要在许多不同的利益相关者之间达成共识。因而,在企业内选定这样的领导者是一项重要工作。治理官员一旦选定下来,就要成立由企业的利益相关者组成的治理委员会,制订监管政策、定期向CEO及董事会报告进度。

数据治理办公室主要是由数据治理的专业人员组成,包括数据架构师,数据质量分析师,元数据管理员等,主要执行数据治理各个领域的具体实施工作。

数据治理牵扯到数据集成,需要技术部门同事协助完成数据的归集,如果有数据缺失,需要讨论并实施具体的补全方案。比如缓慢变化维的数据。

考核数据治理委员会推进数据规模的数量、广泛性、全面性。

考核数据治理办公室对数据的处理速度和执行效率。

考核信息中心的问题率、解决率、解决时效。