网易首页 > 网易号 > 正文 申请入驻

数据治理中的数据质量管理

0
分享至

众所周知,数据是企业数字化转型的核心要素,大数据建设的目标是为了融合组织数据,增加组织的洞察力和竞争力,实现业务创新和产业升级。而数据能发挥价值的大小依赖于其数据的质量高低。如果没有良好的数据质量,大数据将会对决策产生误导,甚至产生有害的结果提高数据质量是为了巩固大数据建设成果,因此,高质量的数据是企业业务能力的基础。

什么是数据质量管理?

1.数据质量

数据质量在业务环境下,数据符合数据消费者的使用目的,数据质量需要满足业务场景具体的需求。数据质量包含两个方面:数据自身的质量和数据的过程质量。

数据自身的质量很好理解,比如数据必须真实准确地反映实际发生的业务,任何业务操作的数据都没有被遗漏,数据存在各种约束条件,这种约束条件不能自相矛盾等等。

数据的过程质量就是数据的使用过程符合标准规范,比如数据存储:数据是否被安全的存储到了合适的介质上,能够保证数据不受外来因素的破坏。当然数据存储只是数据使用过程的一个环节,除此之外还包括获取、传输、应用和删除等一系列的使用过程,这其实也是数据生命周期的各个阶段。

2.数据质量管理

数据质量管理指对数据在每个阶段里可能引发的各类数据质量问题进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平确保数据质量的提升。

换句话说,数据质量管理是一个集方法论、管理、技术和业务为一体的解决方案,不是一时的数据治理方法,是一个不断循环的管理过程。一方面反映出企业数据很难一次性就达到使用的标准规范,毕竟数据治理是一个相对漫长的过程;另一方面也反映出数据质量的重要性以及数据质量工作的零散性和琐碎性。

数据质量问题根因分析

说到数据质量问题的原因,做过BI或数仓项目的小伙伴肯定都知道,这是一个业务和技术经常扯来扯去、互相推诿的问题。在很多情况下,企业都会把数据质量问题推给技术部门,让技术部门去查找和处理。但是企业的数据质量问题真的都是技术引起的吗,技术部门人一定会说:“这个锅我不背!”

其实,影响数据质量的因素主要就技术、业务、管理三个方面,下面我们就来从这三方面分析下产生数据质量问题都有哪些原因。

1、技术方面

数据模型设计的质量问题,例如:数据库表结构、数据库约束条件、数据校验规则的设计开发不合理,造成数据录入无法校验或校验不当,引起数据重复、不完整、不准确。

数据源存在数据质量问题,例如:有些数据是从生产系统采集过来的,在生产系统中这些数据就存在重复、不完整、不准确等问题,而采集过程有没有对这些问题做清洗处理,这种情况也比较常见。

数据采集过程质量问题, 例如:采集点、采集频率、采集内容、映射关系等采集参数和流程设置的不正确,数据采集接口效率低,导致的数据采集失败、数据丢失、数据映射和转换失败。

数据传输过程的问题,例如:数据接口本身存在问题、数据接口参数配置错误、网络不可靠等都会造成数据传输过程中的发生数据质量问题。

数据装载过程的问题,例如:数据清洗规则、数据转换规则、数据装载规则配置有问题。

数据存储的质量问题,例如:数据存储设计不合理,数据的存储能力有限,人为后台调整数据,引起的数据丢失、数据无效、数据失真、记录重复。

业务系统各自为政,烟囱式建设,系统之间的数据不一致问题严重。

2、业务方面

业务需求不清晰,例如:数据的业务描述、业务规则不清晰,导致技术无法构建出合理、正确的数据模型。

业务需求的变更,这个问题其实是对数据质量影响非常大的,需求一变,数据模型设计、数据录入、数据采集、数据传输、数据装载、数据存储等环节都会受到影响,稍有不慎就会导致数据质量问题的发生。

业务端数据输入不规范,常见的数据录入问题,如:大小写、全半角、特殊字符等一不小心就会录错。人工录入的数据质量与录数据的业务人员密切相关,录数据的人工作严谨、认真,数据质量就相对较好,反之就较差。

数据作假,对,你没看错,就是数据作假!操作人员为了提高或降低考核指标,对一些数据进行处理,使得数据真实性无法保证。

3、管理方面

认知问题。企业管理缺乏数据思维,没有认识到数据质量的重要性,重系统而轻数据,认为系统是万能的,数据质量差些也没关系。

没有明确数据归口管理部门或岗位,缺乏数据认责机制,出现数据质量问题找不到负责人。

缺乏数据规划,没有明确的数据质量目标,没有制定数据质量相关的政策和制度。

数据输入规范不统一,不同的业务部门、不同的时间、甚至在处理相同业务的时候,由于数据输入规范不同,造成数据冲突或矛盾。

缺乏有效的数据质量问题处理机制,数据质量问题从发现、指派、处理、优化没有一个统一的流程和制度支撑,数据质量问题无法闭环。

缺乏有效的数据管控机制,对历史数据质量检查、新增数据质量校验没有明确和有效的控制措施,出现数据质量问题无法考核。

如何做好数据质量管理

正所谓,工欲善其事,必先利其器。亿信华辰睿治数据治理平台的数据质量管理模块以全面质量管理PDCA循环管理方法为指导,充分结合国内数据质量管理工作的特点,运用元数据管理、数据挖掘、数据分析、工作流、评分卡、可视化等技术最终帮助企业和政府建立数据质量管理体系,全面提升数据的完整性、规范性、及时性、一致性、逻辑性等,降低数据管理成本,减少因数据不可靠导致的决策偏差和损失。

(2)数据规范

主要从数据模型和数据标准两个方面定义好数据规范:

①数据模型:是数据特征的抽象,是获取和明确企业数据需求的方法,也是数据需求分析与建模工作的基础,通过对展现客观事物的信息进行抽象、综合、分类,组织为具有某种结构的数据,对这些数据结构、其相互之间逻辑关系、数据操作方式及约束的描述。在实际的建模过程中,数据模型所描述的内容包括数据结构、数据操作、数据约束三个部分。

②数据标准:是对数据模型的另一种延伸,是数据资产管理的核心基础,也是对企业数据资产化进行准确重定义的过程。数据标准可以促进企业数据模型落地,对企业业务系统中关键数据进行标准化起到了关键性作用。但是,真正数据标准并不是规范文档、流程文档、制度文档等,而是通过一套由管理规范、管控流程与技术工具共同组成的体系逐步实现数据信息化标准的过程。

在数据模型的落地和推动过程当中,往往会遇到由于各组织人员认知不同、看待问题的角度不同以及其他内外部原因等限制,导致数据在集成与互通的时候会遇到数据不一致的问题。所以,在做业务系统的数据模型设计之前,企业要设计一套相对标准的数据规范。通过数据标准规范来反向推动业务进行数据收集,解决数据不一致的问题。

数据质量管理是企业数据治理一个重要的组成部分,企业数据治理的所有工作都是围绕提升数据质量目标而开展的。要做好数据质量的管理,应抓住影响数据质量的关键因素,设置质量管理点或质量控制点,从数据的源头抓起,从根本上解决数据质量问题。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国女排为何1-3溃败?前队长惠若琪说大实话,点名1人,球迷怒批

中国女排为何1-3溃败?前队长惠若琪说大实话,点名1人,球迷怒批

林子说事
2024-06-01 01:47:34
卖掉油车,换了电车,如今开了2年多,终于明白网上说的都是真的

卖掉油车,换了电车,如今开了2年多,终于明白网上说的都是真的

西山来客
2024-05-21 15:35:42
担心技术被转移到中国 美国正减缓NVIDIA和AMD向中东出口AI芯片的速度

担心技术被转移到中国 美国正减缓NVIDIA和AMD向中东出口AI芯片的速度

cnBeta.COM
2024-05-31 08:45:04
日本实现世界首个6G技术,比中国5G快200倍!日媒:胜利属于我们

日本实现世界首个6G技术,比中国5G快200倍!日媒:胜利属于我们

田间农人阿馋
2024-06-01 00:26:35
重庆冠军赛:6月1日完整赛程公布!王楚钦 王曼昱抗日,孙颖莎抗韩

重庆冠军赛:6月1日完整赛程公布!王楚钦 王曼昱抗日,孙颖莎抗韩

小马哥谈体育
2024-06-01 02:00:50
惨不忍睹!重庆加油站车辆自燃后爆炸,火光冲天!

惨不忍睹!重庆加油站车辆自燃后爆炸,火光冲天!

饭桶说史
2024-05-31 21:12:46
中途女子收到朋友消息告知房间里面有摄像头

中途女子收到朋友消息告知房间里面有摄像头

挪威森林
2024-05-30 16:24:43
李丽珍庆祝出道40周年,与27岁女儿合照像姐妹,58岁仍风韵犹存

李丽珍庆祝出道40周年,与27岁女儿合照像姐妹,58岁仍风韵犹存

树娃
2024-05-29 13:32:36
江苏句容市政协社会事业委员会主任金伟接受审查调查

江苏句容市政协社会事业委员会主任金伟接受审查调查

鲁中晨报
2024-05-31 15:27:02
讣告!于2024年5月21离世:阮经天崩溃

讣告!于2024年5月21离世:阮经天崩溃

华人星光
2024-05-31 17:27:30
5-6丢冠,C罗双冠王梦碎,表现评分不到8分,但两项数据全场第一

5-6丢冠,C罗双冠王梦碎,表现评分不到8分,但两项数据全场第一

侧身凌空斩
2024-06-01 05:16:05
突然宣布:取消!沌口又一场演唱会没了,行业变天了

突然宣布:取消!沌口又一场演唱会没了,行业变天了

沌口之声
2024-05-31 17:57:00
黄永胜证实:徐向前曾被俘,揭秘真实经历!

黄永胜证实:徐向前曾被俘,揭秘真实经历!

阅史明今
2024-05-31 21:02:36
42岁性感人妻拥魔鬼身材!晒喷血泳衣性感程度又创高峰!

42岁性感人妻拥魔鬼身材!晒喷血泳衣性感程度又创高峰!

肇庆之星
2024-06-01 01:28:24
曹总福耀科技大学审批没有通过,网友都在问,日本为什么能办学校

曹总福耀科技大学审批没有通过,网友都在问,日本为什么能办学校

牛锅巴小钒
2024-05-31 19:33:13
外媒:胡塞组织宣称对美国“艾森豪威尔”号航空母舰发动导弹攻击

外媒:胡塞组织宣称对美国“艾森豪威尔”号航空母舰发动导弹攻击

参考消息
2024-05-31 20:30:59
庆余年2:七位大宗师排名,庆帝仅排第三,四顾剑第四,五竹最强

庆余年2:七位大宗师排名,庆帝仅排第三,四顾剑第四,五竹最强

宇林网络
2024-05-31 18:33:52
老鹰队向火箭提出交易报价!

老鹰队向火箭提出交易报价!

小豆豆赛事
2024-06-01 01:42:59
权威发布丨射洪市政协原党组副书记、副主席张朝平 严重违纪违法被开除党籍和公职

权威发布丨射洪市政协原党组副书记、副主席张朝平 严重违纪违法被开除党籍和公职

鲁中晨报
2024-05-30 16:46:05
地铁上的不文明行为,我该提醒一下吗?

地铁上的不文明行为,我该提醒一下吗?

元爸体育
2024-05-31 14:43:41
2024-06-01 07:02:44
数据这些事
数据这些事
专注大数据和商业智能
807文章数 1194关注度
往期回顾 全部

财经要闻

证监会:对恒大地产罚款41.75亿

头条要闻

胡塞武装称已袭击美国航母 美官员称未发现航母遭袭

头条要闻

胡塞武装称已袭击美国航母 美官员称未发现航母遭袭

体育要闻

欧文:当老二怎么了?硬就行了!

娱乐要闻

白玉兰提名:胡歌、范伟争视帝

科技要闻

业务不卖了,字节跳动重新做游戏

汽车要闻

外观内饰升级/六项权益 全新哈弗H6开启预售

态度原创

教育
数码
家居
本地
艺术

教育要闻

姥姥,这道题选什么呀?我怎么看不出来呢

数码要闻

真正的咸鱼翻身!两年前的骁龙6 Gen 1怎么就翻红了

家居要闻

风雅自来 中式的和谐平衡

本地新闻

食味印象|歙县限定!枇杷味儿的清甜初夏

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

无障碍浏览 进入关怀版