网易首页 > 网易号 > 正文 申请入驻

数据「熵增」时代,AI 如何以标准重构治理秩序?

0
分享至

Agent 热潮不减,但数据分析与治理状况却仍存在短板。据 Gartner 公司预测,到 2027 年,80% 的数据和分析治理举措或将因各类原因而失效。如何在 AI 时代重塑数据治理体系,让混乱数据重归有序,成为企业智能转型的关键命题。

近日,在 infoQ 举办的全球人工智能开发与应用大会上,瓴羊智能数据建设与治理产品 Dataphin 高级技术专家 周鑫 受邀出席,以「基于统一标准的智能数据治理 Dataphin 的落地实践」为主题,系统阐述了以数据标准为核心,实现可持续数据治理的方法论,以及以 AI 赋能自动化数据治理、重构复杂业务流程的实践路径。

1 数据「熵减」之道:基于统一标准,打造数据治理方法论

“事物天生具有‘变混乱’的趋势,数据也是如此。如何将无序变得有序?按照热力学第二定律,需要从外界输入能量,并且具备感知能力。”

周鑫表示:“对于数据治理来说,能量就是治理工具,感知就是标准规范。”数据治理是实现数据世界的“熵减”,它可以通过现状评估、制定目标、执行计划、持续监测四个治理阶段,帮助数据生产者打破孤岛,实现低成本数据开发,帮助数据管理者做好资产盘点,确保数据质量与安全,帮助数据使用者便捷用数,助力决策分析。

但在现实情况中,许多数据治理的结果通常会面临失败,周鑫将其归结为四个原因:1)治理动作分散,缺乏体系化方法论;2)治理流程复杂,重度依赖人的能力和素质;3)缺乏工具支撑,导致理论与实施脱节;4)无法持续治理,治理策略难以快速调整。

面对以上四类问题,Dataphin 提出了一套以数据标准为中心的数据治理方法论及产品化的落地。其核心逻辑为:聚焦 Data x AI,用中台方法论构建统一的数据标准,打造企业级好数据,帮助企业形成数据生产、数据消费、行业数据流通的数据要素服务链,驱动数据价值的释放。

“方法论的核心关键,在于以数据标准为中心。数据标准贯穿数据整个生命周期,它让数据治理具备核心抓手,不会漫无目的”,周鑫表示,企业需从核心业务入手,先行试点开展业务梳理与盘点工作,将相关统一纳入 DataCatalog,并在此过程中逐步形成对应的数据标准

标准梳理完成后,平台即可开展标准构建:通过统一的数据标准,自动实现质量监控与安全分类,保障开发过程规范,阻断不规范数据开发。同时,统一标准可提升数据的可理解性与细节清晰度,实现数据从生成、开发到消费的全生命周期标准化管理。

“整个治理链路就是以数据标准为中心,将传统的复杂的治理手段,简化成数据标准的梳理与治理效果的评估过程,数据符合标准的程度越高,整体数据质量也就越好”。

周鑫表示,该方案以数据标准为核心,通过插件集成、API 注册和准实时同步等多种方式采集元数据,并统一纳入 DataCatalog,结合质量规则和安全策略进行自动识别与治理。这一方法论具备三大优势:一是体系化,明确治理目标与路径;二是易落地,借助一体化工具和 AI 能力,贯穿数据全生命周期;三是可持续,以标准驱动模式便于应对业务变化,有效降低治理成本与复杂度。

2 语义知识 + 流程提效,智能 Agent 多场景赋能数据治理

许多企业在应用 Agent 时都难免遇到一个难题:Agent 虽然具备一定的智能和对话能力,但在复杂业务场景中常常“空转”,无法真正理解业务语境、解决预期的实际问题。

周鑫表示,造成这一现象的根本原因,“在于数据质量偏低或数字化基础薄弱,导致 Agent 无法有效发挥价值,最终企业只能被迫放弃”。

AI 时代,优质数据至关重要,但“好数据”应如何获取?AI 又该如何赋能数据治理?

首先,“Agent 在没有丰富准确的语义知识下,不可能达到可生产使用的准确率”,周鑫认为,企业获取好数据,需要构建准确且丰富的语义知识体系。Dataphin 针对这一需求,打造了包含元数据、数据标准、数据模型、业务知识四大语义知识体系。企业可以通过采集丰富且统一的元数据,建立涵盖码表、词根、值域及安全分类分级的标准体系,依托 Dataphin 智能构建的概念模型、逻辑模型和物理模型,以及对业务词条和逻辑的高效管理,实现对复杂业务知识的精准映射和应用。

以 NL2SQL 为例,Dataphin 通过引入业务语义,不仅提升了问题泛化能力,还大幅提高了 SQL 匹配的准确率,显著增强了对自然语言的理解能力。实测数据显示,在 Dataphin 开放数据共享模型涵盖的 45 个典型问题中,简单问题的 SQL 准确率从 70% 提升至 80%,而中等及复杂问题的准确率更是从 10% 跃升至 60%

其次,企业还需借助 AI,对数据治理链路进行提效。基于 TaskWeaver 改造,Dataphin 构建了具备生产化能力的 Agent 框架,覆盖研发、治理、资产问答等多个场景,显著提升了现有流程效率,拓展了 Agent 的应用边界。

以 NL2SQL 为例,系统可在识别信息不全时自动发起反问,补全后再继续处理,确保复杂业务场景下依然具备高理解力与执行准确率。同时,Dataphin 的开放能力不断演进,从传统的 API 和数据服务扩展至 MCP 模式,支持更灵活的接入方式,适配非固定流程和动态交互等复杂需求。

智能找表场景,Dataphin 有效解决了用户将复杂业务问题,转化为准确搜索词的难题。“引入 AI 后,你可以用业务的语言直接问,比如‘我要做客户分层’,‘我要用哪张表’,AI 会用大模型去对业务问题进行拆解和泛化,最后找关联到你已有的全域资产”。

数据分析场景,Dataphin 通过专辑机制与丰富的语义知识,解决了因语义知识的缺失或混乱,相似口径和命名干扰、以及海量表格带来的找表难题,显著提升了找表的效率与准确率。

数据治理场景,Dataphin 通过“性别”等复杂字段特征识别,解决了正则表达式“不会写”、“看不懂”难题,取代了传统人工探查的繁琐过程,以往需要耗费十几分钟的特征识别,如今只需几十秒即可完成。

数据管家场景,资产上架往往涉及表描述、字段注释、目录归属、标签分类等复杂操作,尤其在字段数量众多时,人工维护工作量大、耗时长且易出错。通过引入 AI 能力,Dataphin 支持属性信息的智能生成,可一键生成表 / 字段描述信息、目录、标签等,使人力成本与操作门槛大大降低。

目前,Data x AI 发展仍处于以模块提效为主的第一阶段;随着 AI 对复杂节点的处理能力增强,Dataphin 正在以“智能工作台”有机整合独立模块,重构整体业务流程。“有了 AI 之后,工作台模式可以让很少的人,完成复杂的业务,每个环节都有大量 AI 和自动化能力支撑,人们干的最多的事情是进行确认。”周鑫表示,未来,AI 还将在更多场景中深度参与,从辅助提效逐步向自动化、智能化方向迈进,推动企业实现数据治理范式的全面升级。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
完了,全完了。澳门英皇宫殿一年净亏2.48亿,彻底崩了。

完了,全完了。澳门英皇宫殿一年净亏2.48亿,彻底崩了。

流苏晚晴
2026-02-12 17:03:00
56岁爷爷误以为7岁孙女被殴打,持刀将其6岁同学砍成重伤!

56岁爷爷误以为7岁孙女被殴打,持刀将其6岁同学砍成重伤!

张晓磊
2026-03-29 11:09:33
涨价疯传!很多人开始囤,有人已经订到12月,“能买的都买了”

涨价疯传!很多人开始囤,有人已经订到12月,“能买的都买了”

最金华
2026-03-28 22:39:12
伊朗:美以大学成合法袭击目标!美酝酿地面行动,3500名美军抵达中东

伊朗:美以大学成合法袭击目标!美酝酿地面行动,3500名美军抵达中东

新民晚报
2026-03-29 10:51:10
大连一企业董事长行贿法官120万内幕:“被告打点法官竟要原告买单”

大连一企业董事长行贿法官120万内幕:“被告打点法官竟要原告买单”

白鹿新闻
2026-03-28 17:30:32
犹太人啊,犹太资本啊,放过我们吧!我给你们跪了!

犹太人啊,犹太资本啊,放过我们吧!我给你们跪了!

红色少女主播
2026-03-26 23:25:43
48小时被打残一个装甲营,以色列以人命为代价,给特朗普做了示范

48小时被打残一个装甲营,以色列以人命为代价,给特朗普做了示范

深析古今
2026-03-29 10:29:13
王传福拿下小米汽车

王传福拿下小米汽车

新浪财经
2026-03-27 08:42:30
程潇不愧是“奶潇”

程潇不愧是“奶潇”

情感大头说说
2026-03-16 00:19:50
笑死我了!一位三年级小朋友趁妈妈洗澡的缝隙时间,和豆包的对话

笑死我了!一位三年级小朋友趁妈妈洗澡的缝隙时间,和豆包的对话

夜深爱杂谈
2026-03-21 19:50:42
75年奶奶收留了一对落难姐弟,多年后一位年轻军官找上了门

75年奶奶收留了一对落难姐弟,多年后一位年轻军官找上了门

人间百态大全
2026-03-29 06:35:03
终于爆发了,击落大批美以军机:隐身战机,超级大黄蜂不断下坠!

终于爆发了,击落大批美以军机:隐身战机,超级大黄蜂不断下坠!

混沌录
2026-03-27 16:39:18
美国为什么突然打伊朗?一篇文讲清楚

美国为什么突然打伊朗?一篇文讲清楚

李月亮
2026-03-02 20:46:25
伊朗封锁海峡,川普拿捏能源买家和卖家达到顶点,差不多才会解决

伊朗封锁海峡,川普拿捏能源买家和卖家达到顶点,差不多才会解决

邵旭峰域
2026-03-28 16:00:03
中美武器交锋!巴基斯坦拿着中国武器反击立威,揍懵阿塔美式装备

中美武器交锋!巴基斯坦拿着中国武器反击立威,揍懵阿塔美式装备

通文知史
2026-03-28 10:30:05
哈里·凯恩薪资曝光:英格兰队内断层第一,周薪超40万英镑

哈里·凯恩薪资曝光:英格兰队内断层第一,周薪超40万英镑

星耀国际足坛
2026-03-28 23:54:54
教师大局已定:2026年全国教师队伍将迎来四大新变化

教师大局已定:2026年全国教师队伍将迎来四大新变化

户外阿毽
2026-03-27 12:30:20
比赖清德更狂的人出现了,只要她当上台湾领导人,我军必定收台

比赖清德更狂的人出现了,只要她当上台湾领导人,我军必定收台

懵面女汉
2026-03-29 06:11:43
敌我难分,比利时和美国球衣撞色,观众只能靠短裤勉强区分

敌我难分,比利时和美国球衣撞色,观众只能靠短裤勉强区分

懂球帝
2026-03-29 08:28:43
随着伊东纯也一剑封喉+比分1-0,日本掀翻欧洲劲旅,迎开门红

随着伊东纯也一剑封喉+比分1-0,日本掀翻欧洲劲旅,迎开门红

侧身凌空斩
2026-03-29 04:38:44
2026-03-29 11:39:00
InfoQ incentive-icons
InfoQ
有内容的技术社区媒体
12220文章数 51822关注度
往期回顾 全部

科技要闻

马斯克承认xAI"建错了",11位创始人均离职

头条要闻

牛弹琴:特朗普亲口对沙特说出傲慢的话 全世界不敢相信

头条要闻

牛弹琴:特朗普亲口对沙特说出傲慢的话 全世界不敢相信

体育要闻

全球第二大车企,也救不了这支德甲队?

娱乐要闻

张凌赫事件持续升级!官方点名怒批

财经要闻

Kimi、Minimax 们的算力荒

汽车要闻

岚图泰山X8配置曝光 四激光雷达/华为新一代座舱

态度原创

家居
数码
教育
本地
房产

家居要闻

曲线华尔兹 现代简约

数码要闻

LG电竞显示器预约!1080P 144Hz仅649/799元

教育要闻

深圳老师借盘古开天地讲创新,唯有开拓创新才能获得新生!

本地新闻

在潍坊待了三天,没遇到一个“潍坊人”

房产要闻

首日430组来访,单日120组认筹!海口首个真四代,彻底爆了!

无障碍浏览 进入关怀版