数据对于企业来说是非常重要资产,企业在经营的过程中也会积累不少各类数据,这类数据后期也可通过归纳、提炼从而进行深度挖掘分析,给企业提供更好的决策信息。不过虽然数据可以帮助企业进行提升,但是数据的质量好坏也是非常重要的,因此一个企业如果想合理的利用自己的数据,就需要先治理好自己的数据,确保自己数据的准确性以及有效性等等。
数据质量管理的方法论
1、数据质量管理方针
为了改进和提高数据质量,必须从产生数据的源头开始抓起,从管理入手,对数据运行的全过程进行监控,强化全面数据质量管理的思想观念,把这一观念渗透到数据生命周期的全过程。
2、组织环境
我们在数据治理框架、主数据管理、数据标准管理等章节,都提到了组织机构的设置,这里再次强调一个强有力的数据管理组织的建设是数据治理项目成功的最根本的保证。其作业是两个层面:一是在制度层面,制定企业数据治理的相关制度和流程,并在企业内推广,融入企业文化。二是在执行层面,为各项业务应用提供高可靠的数据。
3、数据全周期管理
数据的生命周期从数据规划开始,中间是一个包括设计、创建、处理、部署、应用、监控、存档、销毁这几个阶段并不断循环的过程。企业的数据质量管理应贯穿数据生命周期的全过程,覆盖数据标准的规划设计、数据的建模、数据质量的监控、数据问题诊断、数据清洗、优化完善等方面。
4、数据质量问题分析
关于质量问题的分析,可以采用经典的六西格玛(缩写:6σ或6Sigma),六西格玛是一种改善企业质量流程管理的技术,以“零缺陷”的完美商业追求,以客户为导向,以业界最佳为目标,以数据为基础,以事实为依据,以流程绩效和财务评价为结果,持续改进企业经营管理的思想方法、实践活动和文化理念。六西格玛重点强调质量的持续改进,对于数据质量问题的分析和管理,该方法依然适用。
中琛魔方大数据平台表示数据质量管理平台的主要功能是为了提高数据质量,提供以基于质量管理指标、数据质量验证、质量验证结果统计及整备程序的数据质量验证基础。