Joe Rose有个观点想澄清。作为技术服务商JBS Dev的总裁,他注意到一个普遍误解:企业总觉得得先把数据打磨完美,才能上生成式AI和智能体系统。
这种焦虑被放大了。AI Fieldbook近期文章指出,厂商推销海量数据湖,咨询公司推销多年数据改造计划。高管们听得头大。但Rose的说法不同:"现在的工具处理低质量数据的能力前所未有。"他补充,"大语言模型对半成品提示词的理解力,几乎让人惊讶。"
![]()
逻辑很直接。既然工具有这个本事,就该用起来——前提是设好护栏。模型的不可预测性意味着必须处理错误输出,这就是"人机回环"的价值。文本或分类数据层面,系统有一定容错韧性。Rose提醒:"人们习惯了'做出来、跑起来、忘掉它',但这类系统不是这样玩的。"
他举了个医疗客户的实例。目标是迁移到新的账单对账系统。记录乱七八糟:有的是PDF,有的是图片;手术记录可能写在医生名字栏,医生名字又可能填进患者姓名栏。生成式AI靠简单提示词就能从OCR图像、PDF文本提取中筛选干净数据。后续还叠加了智能体功能,比如比对客户记录和保险合同,核查收费是否准确。
"你会把不同用例层层叠加上去,"Rose说,"不是说它百发百中——人机回环仍然必要。但你可以设定目标:从20%自动化起步,再到40%、60%、80%,逐步爬坡。"
往前看,Rose认为行业讨论焦点将转向成本与可移植性。"模型能力的激进跳跃会降温,"他判断,"更多转向'怎么让成本可持续,不用以现在的速度狂建数据中心'。"
![]()
他口中的"最后一英里"是:怎么让这些模型在笔记本或手机上跑,而非依赖数据中心。"模型训练用的数据体量——基本就是整个互联网加其他素材——已经到头了。不存在什么还没喂进去的海量数据能引发下一次突破。"
在AI & Big Data Expo展会上,Rose准备抛出另一个争议观点:能自己做的事,就别买SaaS厂商的方案。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.