网易首页 > 网易号 > 正文 申请入驻

震惊!AI开展数据治理将超过人工和数据平台?

0
分享至

【StartDT Talk】“大模型浪潮下的数据探索”系列直播第二期圆满收官!

本期直播聚焦于“大模型时代的数据治理之道”话题,由奇点云创始人行在、资深行业专家证道深入探讨数据治理的时代变化,以及企业面对AI浪潮,如何利用大模型应对数据治理的新挑战。

下文基于直播内容编辑,略有删减。

一、大模型发展的背景

随着人工智能技术特别是大模型的迅速发展,IT行业正在经历一场深刻的变革。业界普遍认为,大模型将给编程工作带来根本性的改变,能够赋能代码开发的全流程,从而极大提高程序员的工作效率。Gartner甚至预测,到2025年,70%的应用程序将由低代码和无代码开发平台构建,其中 80%的应用程序由非IT工作者开发而成。

同时,业内也出现了大量大模型应用实践。例如,某度推出的智能代码助手整体采纳率超过40%;Shopify 的开发团队引入了 GitHub Copilot,常规的重复性任务耗时减少了12%;DeepCode能够提高代码质量,其准确率高达 90% 以上等等。

可以看出,大模型不仅提高了代码质量和开发效率,还让数据治理更加智能化和自动化,为未来的数据应用开辟了新的可能性。

二、关于大模型和数据治理的几个问题

(一)什么是数据治理?

广义的数据治理是指一套跨组织的策略、程序、标准、工具和技术,用于确保整个企业中数据的可用性。大致包含:数据标准、数据组织、数据质量、元数据管理、数据安全、数据生命周期、数据架构等。

理论上,数据治理在国内可以参考DCMM标准,在国际上则可参考DAMA标准。两者关于数据治理的描述虽略有不同,但对于数据治理的安全性、一致性和可用性的观点是相通的。

对于企业而言,数据治理不仅仅是一套理论上的规定,更需要与实际业务相结合。这意味着企业需要考虑使用何种IaaS环境、选择什么样的大数据平台产品,以及与现有IT基础设施的兼容性等问题,以便更好地利用数据产生业务价值。

(二)传统的数据治理是怎么做的?

传统的数据治理通常有两种实施方式。

1自上而下

常见于大型企业,一般是CEO项目。首先,引入咨询公司,完成内部数据现状梳理,给出数字化建设建议。其次,采购硬件资源和大数据平台。同时,联合外部顾问分阶段开展治理工作。这种治理通常是先定组织、数据标准,再选择几个业务板块进行一阶段数据治理试点,分段执行。

2按部就班

一般是由IT或数据团队自行发起,属于CIO项目。这种方式的数据治理范围会更聚焦于业务分析体系、大数据平台、数据质量、数据架构等领域。以自行建设为主,不引入外部团队。

对于系统复杂且有历史包袱重的企业,适合自上而下的治理方式;而系统和组织较为简单的企业,则更适合按部就班的治理方式。

(三)传统数据治理碰到的挑战及解决方法

传统的数据治理的理论框架看似完整,但由于依赖的成功要素较多,实际落地困难。因此,决策层认知、组织调整、业务分析、数据治理和工程管理能力缺一不可。除此之外,传统的数据治理还面临历史包袱重;领导预期高、时间紧;日常运营成本高,缺乏有效工具等问题,难以单纯通过人工或者单一方案进行解决。

为了应对这些挑战,需要采取类似于中药配伍组方的原则,相互协调和补充。

· 外部顾问一般可以解决数据治理理论、方法、治理经验、技术标准、工作流程、工程管理问题;

· 内部业务骨干协助解决分析体系思维框架问题,内部技术老员工解决历史上缺失的信息系统文档;

· AI或是大模型则用于补充平台和工具短板。能够显著提高效率,确保治理工作的持续性和一致性,克服传统数据治理中的诸多障碍。

(四)为什么大模型可以解决问题?

在涉及自然语言识别的场景中,传统开发工具和人工处理存在不足。例如,在词根检查、标准词检查、指标口径检查、指标血缘检查、模型命名规则检查、类型和精度检查等方面。

然而,大模型不仅能够识别同义词、处理时态变化和复数形式,还可以处理跨系统的数据一致性检查,以及指标、标签业务口径与实际代码的校验。

CASE:我们曾服务过一家世界500强体育用品企业,并利用机器和算法帮助该企业解决了业务层面的口径统一问题,确定了指标之间的血缘关系,以及处理了数以万计的报表和任务调度、数十万个字段,这是纯靠人工无法解决的。

总结来说,大模型解决了记忆和计算的问题,并且在自然语言处理和理解方面具有显著优势,在处理复杂和大规模的数据集时,可以大大提高效率和准确性。

(五)如何走出使用大模型的第一步?

CIO们首先应当明确问题类型。如果问题涉及自然语言理解或复杂业务场景的识别,那么使用大模型可能是更好的选择。如果不是,则可以继续使用传统的程序和工具。

如果决定使用大模型,建议选择投入轻、学习成本低的公网SaaS化的免费大模型服务,熟悉开源大模型进行日常提效,充分了解提示工程。初期,主要使用大模型进行创新尝试,或是方案性或检查性工作,避免上传敏感数据,以防数据安全问题的出现。例如,可以先从非涉密的词根、标准词检查和指标口径检查做起,既能体验大模型带来的效率提升,同时规避潜在风险。

(六)大模型在数据治理中的落地难点

大模型并非适用于所有场景,例如,处理大规模数据排序或运行复杂存储过程等任务时,传统数据库仍是更佳选择。如果需要在内存中缓存大量临时数据并进行复杂计算,大模型也可能表现不佳,甚至会出现错误的结果。因此,应理性看待大模型的应用场景,避免将其视为解决所有问题的灵丹妙药。

三、数据治理未来的发展趋势

(一)未来数据治理会如何发展?

单纯依靠人工和传统治理工具已经无法满足数据量激增的现状。虽然,目前阶段,数据平台的作用仍然大于AI,但随着技术进步,AI将在数据治理中占据更重要的位置。

· 阶段一:数据平台>人工>AI (当前阶段)

· 阶段二:数据平台>AI>人工

· 阶段三:AI>数据平台>人工

随着AI技术的发展,它将逐渐承担更多工作,提高数据治理的效率和准确性,从而更好地支持企业的数据管理需求。未来数据治理的发展将是人工、数据平台和AI的结合。

(二)大模型浪潮对程序员的影响

尽管谈及程序员完全被AI取代还言之尚早,但是大模型的确会对程序员的未来发展产生深远影响。一方面,大模型简化了许多常规任务,致使初级程序员可能面临转型或者薪酬降低的风险。另一方面,大模型的兴起带来了新的工作机会。中高级程序员不仅可以利用其提升工作效率,处理更为复杂的问题,甚至可以成为AI训练师,参与到设计和优化这些模型的工作中。

总的来说,新技术的产生往往会导致一些传统岗位的调整,但同时也会催生新的机遇。因此,程序员们不必过分担忧,但仍需积极适应变化,提升自身技能,以便在未来的技术环境中保持竞争力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
狼王怒喷:狗屎!文班遭炮轰!巴克利力挺!他不该吗?

狼王怒喷:狗屎!文班遭炮轰!巴克利力挺!他不该吗?

篮球盛世
2026-06-03 15:59:41
男篮2将打服FMP俱乐部主帅!发布会公开招募:希望徐昕王俊杰能来

男篮2将打服FMP俱乐部主帅!发布会公开招募:希望徐昕王俊杰能来

篮球资讯达人
2026-06-03 22:54:19
云南两县级市迎来新任市委书记

云南两县级市迎来新任市委书记

汲古知新
2026-06-03 23:38:09
东北一男子养鹿破产,赌气放生了30头鹿,8年后上山,眼前一幕却让他泪崩了...

东北一男子养鹿破产,赌气放生了30头鹿,8年后上山,眼前一幕却让他泪崩了...

背包旅行
2026-05-11 14:51:09
双喜临门!6月4日国内油价调整迎来油价大跌,5日燃油附加费下调

双喜临门!6月4日国内油价调整迎来油价大跌,5日燃油附加费下调

有料财经
2026-06-03 22:13:04
善恶终有报!放弃国籍、贬低中国,68岁瘫在轮椅的张铁林活成笑话

善恶终有报!放弃国籍、贬低中国,68岁瘫在轮椅的张铁林活成笑话

混沌录
2026-06-01 23:24:09
太窒息了!1米长的五步蛇藏电瓶车挡风被下 男子开锁时被咬中虎口 医生提醒:有条件尽量留存毒蛇样貌照片

太窒息了!1米长的五步蛇藏电瓶车挡风被下 男子开锁时被咬中虎口 医生提醒:有条件尽量留存毒蛇样貌照片

闪电新闻
2026-06-03 11:54:05
6月3日,人社部关于2026年调整退休人员基本养老金通知公布了吗?

6月3日,人社部关于2026年调整退休人员基本养老金通知公布了吗?

小彬说事
2026-06-03 11:34:06
有人花了47万,就为了让这台30万的保时捷皮卡合法上路

有人花了47万,就为了让这台30万的保时捷皮卡合法上路

热血体育社
2026-06-02 02:18:19
将要迎来高温天气,医生再三劝告:天热宁可看电视,也别做4件事

将要迎来高温天气,医生再三劝告:天热宁可看电视,也别做4件事

芹姐说生活
2026-06-03 23:57:55
正义来的太晚了!如今62岁已经退休的朱军,终于看到女方受到惩罚

正义来的太晚了!如今62岁已经退休的朱军,终于看到女方受到惩罚

青橘罐头
2026-06-03 09:45:45
“穷养女真可怜”,买10分钟商务坐拍了9分钟,鞋子让人无语

“穷养女真可怜”,买10分钟商务坐拍了9分钟,鞋子让人无语

泽泽先生
2026-04-09 21:36:08
2950枚导弹无一命中,霹雳-2的惨痛代价谁人知

2950枚导弹无一命中,霹雳-2的惨痛代价谁人知

起喜电影
2026-05-23 11:24:35
心理学上有个词叫:破窗效应(如果一个休学的孩子,整天不读书、不出门、不运动,无爱好、无目标、无期望,那他的状态只会越来越糟)

心理学上有个词叫:破窗效应(如果一个休学的孩子,整天不读书、不出门、不运动,无爱好、无目标、无期望,那他的状态只会越来越糟)

掌门1对1
2026-06-02 16:27:26
黄仁勋到底有没有误读“韬定律”?

黄仁勋到底有没有误读“韬定律”?

观察者网
2026-06-02 08:42:08
印度被高温逼出一个疯狂想法,可是这事连中国都望尘莫及!

印度被高温逼出一个疯狂想法,可是这事连中国都望尘莫及!

华庭讲美食
2026-05-31 00:20:42
王守业贪污1.6亿,2005年“双规”后却被放出,他叫嚣:我摆平了

王守业贪污1.6亿,2005年“双规”后却被放出,他叫嚣:我摆平了

帝哥说史
2026-06-02 21:40:03
阿尔兹海默症跟做家务有关?提醒:60岁后,做家务时要注意这5点

阿尔兹海默症跟做家务有关?提醒:60岁后,做家务时要注意这5点

健康之光
2026-06-03 18:13:57
集团公司召开纪委书记座谈会

集团公司召开纪委书记座谈会

新浪财经
2026-06-03 21:44:24
不是吓唬人!下月起,70岁以上老人的生活,要迎来大变化

不是吓唬人!下月起,70岁以上老人的生活,要迎来大变化

匹夫来搞笑
2026-06-04 06:16:19
2026-06-04 08:31:00
奇点云
奇点云
奇点云是独立第三方的大数据基础软件提供商,旗下有“奇点云”、“GrowingIO”两大品牌
177文章数 12关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

纠结的欧洲人:边说"不能关起大门" 边说"不能怕中国"

头条要闻

纠结的欧洲人:边说"不能关起大门" 边说"不能怕中国"

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

数码
家居
旅游
时尚
军事航空

数码要闻

黑色版苹果Vision Pro头显配件再曝光,含侧边格栅等

家居要闻

江畔轻奢 观云大宅

旅游要闻

苏州网师园内一处木雕被游客撞断,园区:是否为清代文物待确认

月经、初潮与生育真相,那些藏在动画片里的性启蒙

军事要闻

媒体:美伊和谈以方却从中作梗 内塔尼亚胡有私人算计

无障碍浏览 进入关怀版