网易首页 > 网易号 > 正文 申请入驻

Gartner:AI大模型触达天花板,警惕“贴牌智能体”

0
分享至

21世纪经济报道记者 彭新

近日,市场调研公司Gartner发布《2025年中国数据、分析和人工智能技术成熟度曲线》报告,解析中国AI市场未来走向。

生成式AI和代理型AI是报告的两大核心主题,共同塑造了今年中国AI发展的主要趋势。该报告显示,此前AI市场“顶流”大语言模型(LLM)已越过市场期望顶峰,热度趋冷并开始滑向“泡沫破裂低谷期”,在经历“百模大战”后,市场已趋于理性。



Gartner高级研究总监闫斌称,对于中国的数据、分析和AI领域的领导者来说,现在比以往更需要在AI炒作的喧嚣中认清AI的真正价值。他告诉21世纪经济报道记者,从现实来看,大语言模型的能力已到天花板,性能的边际提升有限,使得AI市场趋势从“模型”向“智能体”转移成为必然。

“到2027年,优先考虑准备AI就绪型数据而非生成式AI模型开发的中国企业中,80%实现的业务价值将是同行的两倍。”闫斌表示,中国AI产业正从尝鲜期进入价值兑现期,数据质量与治理能力将取代模型性能成为核心竞争力。

GPT-5反应平淡,2026年将进入“AI下半场”

闫斌表示,GPT-5的市场反应证明了大语言模型发展的重要拐点。市场曾期待GPT-5接近AGI(通用人工智能),但实际发布后效果有限。“这体现了现在大语言模型的能力——技术发展随着时间推移确实有过快速飞跃,但到今天已经慢慢感觉到天花板了,上面仿佛一条无形的线压着它,它上不去了。”他说。

根据国际AI模型评测网站Artificial Analysis数据,OpenAI从2022至2023年保持领先优势,但已进入“Frog Leap”(青蛙跳)式混战——某个模型跳过去领先一点,另一个模型马上超过上来。国内的DeepSeek、千问、Kimi等模型已进入第一梯队。

“现在模型排名第一、第二、第三,实际使用起来区别不大。”闫斌指出,各家模型性能提升空间有限,领先优势微乎其微。这也解释了为何大语言模型在Gartner成熟度曲线上从期望峰值掉头向下。

闫斌表示,模型厂商数量正在减少,出现收购、并购和价格战。未来模型的发展方向是从“⼤”转向“精”,通过Small Language Model(小语言模型)和领域专业模型(DSLM)实现精细化、场景化突破。

Gartner强调,大语言模型并非万能,未来更强的AI系统需要结合多种技术。“大语言模型就像汽车发动机,AI Agent是整车。”闫斌比喻,“发动机可以用大语言模型,也可以用其他技术,最后拼装成整车,混合系统要比只依赖大模型好用得多。”

另一方面,Gartner调研数据显示,中国企业将生成式AI部署到生产环境的比例从2023至2024年的6%至8%,在2025年暴涨至40%。“我相信现在已经涨到60%至70%。”闫斌判断,2025年企业对生成式AI的“尝鲜期”结束后,2026年将正式进入“AI下半场”。

闫斌强调,生成式AI时代对高质量数据有很高要求,企业若无法提供高质量的“上下文”数据,再强的模型也无法产生价值。Gartner预测,到2027年,优先考虑准备AI就绪型数据的中国企业,其实现的业务价值将是同行的两倍。

对于传统企业AI应用上,闫斌坦言仍面临巨大挑战。“有些企业光做数字化转型就要三年。”他表示,AI是系统工程,涉及企业方方面面的改造。“如果企业的API(应用程序编程接口)根本不好用,要引入智能体,还得先把旧有系统做好数字化转型。”

相比之下,互联网和高科技企业将走得更快,因为系统架构新、API友好、数据管理规范、企业文化接受度高。

“Agent Washing”泛滥,多数产品名不副实

在AI Agent(智能体)方面,闫斌直言行业存在严重的“Agent Washing”(贴牌智能体)现象,即将普通的聊天机器人宣称为智能体。

“昨天厂商的产品其实还是聊天机器人,今天摇身一变成了AI Agent,里面其实什么都没变、只有名字变了。现在市面号称的智能体,可能10个里面有8个其实并不是真正的。”闫斌表示。从资本市场来看,近期不少公司借助AI智能体概念进行宣传炒作,但产品本质并未改变。

从演进路径看,AI智能体已经历了三个阶段:聊天机器人(Chatbot)专注于在对话中给出答案,智能助手(Assistant)帮助完成任务,智能体(AI Agent)则要完成更复杂的目标。“从今天来看,我们可能刚刚跨入智能体的大门。”闫斌判断,当前还有很多产品不是真正的AI Agent,处于从Assistant向Agent过渡的阶段。

根据Gartner定义,真正的AI智能体需要具备三要素:感知世界、自主决策、执行行动,最终与环境形成闭环反馈。“以五分制评价,大模型在语言理解上可以打四星半,行动能力四星,但决策能力只有三星。”闫斌表示,大模型尤其是在针对企业复杂场景的决策能力仍然较弱。

从实际应用来看,闫斌透露,市面上很多所谓智能体,为了可靠性,仍然基于写死的工作流程,难以做到智能化。“根本原因是智能体可靠性不足,完全依赖大语言模型做决策有点像算命的感觉,因为大语言模型还是基于概率的。”

观察近期AI智能体技术进展,MCP(模型上下文协议)一词频频被提及,MCP是AI智能体用来执行任务的一种通信协议或标准。

对此,闫斌认为MCP价值被高估,他解释,MCP的理想状态是互联网中智能体和工具处于开放状态,可以通过统一协议调用。但实际应用中来看,调用出错时的异常处理、安全因素、性能因素都是问题。“对于企业来讲,难点不在于用什么协议,难点是原来为软件写的API是否适合Agent调用。”他说,包括权限管理、调用频率控制等都需要改造。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
太阳报:长子向小贝夫妇发函,警告他们只能通过律师与他联系

太阳报:长子向小贝夫妇发函,警告他们只能通过律师与他联系

懂球帝
2026-01-09 20:05:05
又一CBA主帅要下课了!带队狂输30分,比刘炜还差,战术太单一了

又一CBA主帅要下课了!带队狂输30分,比刘炜还差,战术太单一了

篮球专区
2026-01-10 22:18:10
无语!男子地铁上猥亵女孩,被抓后辩称“女孩身形很像妻子年轻时”……公共场所女性该如何保护自己

无语!男子地铁上猥亵女孩,被抓后辩称“女孩身形很像妻子年轻时”……公共场所女性该如何保护自己

扬子晚报
2026-01-10 22:00:31
你见过的最沉得住气的人是怎样?网‬友:五分钟连超10万人的奇迹

你见过的最沉得住气的人是怎样?网‬友:五分钟连超10万人的奇迹

夜深爱杂谈
2026-01-04 23:05:06
45岁男星晒上海新家!4万电视柜,15万沙发,没戏拍日子照样舒坦

45岁男星晒上海新家!4万电视柜,15万沙发,没戏拍日子照样舒坦

瓜汁橘长Dr
2026-01-09 17:44:33
哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

岐黄传人孙大夫
2026-01-08 10:06:20
广州的衰落,和香港几乎如出一辙

广州的衰落,和香港几乎如出一辙

鱼跃水纹
2026-01-10 21:40:49
16万转卖“中国猪仔”后续:叶文斌妈妈柬埔寨寻子无果,她回国了

16万转卖“中国猪仔”后续:叶文斌妈妈柬埔寨寻子无果,她回国了

江山挥笔
2026-01-10 16:05:59
戴旭发言不寒而栗!

戴旭发言不寒而栗!

安安说
2026-01-10 10:51:32
天道:低级人活在情绪里,中级人活在价值里,高级人活在觉醒里

天道:低级人活在情绪里,中级人活在价值里,高级人活在觉醒里

洞见
2026-01-09 21:19:55
3选1,恩里克决定不续约!英超三豪门见曙光,巴萨两功勋将对垒

3选1,恩里克决定不续约!英超三豪门见曙光,巴萨两功勋将对垒

万花筒体育球球
2026-01-10 18:49:29
你错过了哪些异性对你的暗示?网友:果然单身都是有理由的!

你错过了哪些异性对你的暗示?网友:果然单身都是有理由的!

解读热点事件
2025-11-08 17:33:23
终于轮到日本“强烈抗议”了:130年来,日本从未像今天这样憋屈

终于轮到日本“强烈抗议”了:130年来,日本从未像今天这样憋屈

胖哥不胡说
2026-01-08 13:12:20
回国了我才敢说:委内瑞拉,是我去过的所有国家中,最被低估的!

回国了我才敢说:委内瑞拉,是我去过的所有国家中,最被低估的!

另子维爱读史
2026-01-09 21:09:05
一定要大量读书:读书,就是在借命

一定要大量读书:读书,就是在借命

欣辰读书
2026-01-09 23:12:53
原来他已去世10年!不抽烟不喝酒,每天坚持锻炼,59岁却骤然离世

原来他已去世10年!不抽烟不喝酒,每天坚持锻炼,59岁却骤然离世

寒士之言本尊
2026-01-10 12:54:57
景德镇灭门案再添猛料!凶手不道歉,父亲大闹法庭,还想打律师

景德镇灭门案再添猛料!凶手不道歉,父亲大闹法庭,还想打律师

阿纂看事
2026-01-09 16:24:27
中美贸易战掀桌子了,1月10日,凌晨的四大消息正式发酵!

中美贸易战掀桌子了,1月10日,凌晨的四大消息正式发酵!

叮当当科技
2026-01-10 06:03:51
我国唯一的“美人县”,街上到处都是高颜值美女,你知道是哪吗?

我国唯一的“美人县”,街上到处都是高颜值美女,你知道是哪吗?

千秋文化
2026-01-09 14:29:50
热搜第一!义乌“哭哭马”供不应求,工人手滑缝反嘴巴意外爆红,网友:马倒成功了

热搜第一!义乌“哭哭马”供不应求,工人手滑缝反嘴巴意外爆红,网友:马倒成功了

大风新闻
2026-01-10 16:09:20
2026-01-10 23:51:00
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
228385文章数 743531关注度
往期回顾 全部

科技要闻

传DeepSeek准备第二次震惊全世界

头条要闻

男子带父母去四川"纯玩" 不料消费7万连上厕所都收费

头条要闻

男子带父母去四川"纯玩" 不料消费7万连上厕所都收费

体育要闻

怒摔水瓶!杜兰特30+12 难阻火箭遭双杀

娱乐要闻

吴速玲曝儿子Joe是恋爱脑

财经要闻

这不算诈骗吗?水滴保诱导扣款惹众怒

汽车要闻

宝马25年全球销量246.3万台 中国仍是第一大市场

态度原创

艺术
旅游
健康
手机
公开课

艺术要闻

投资百亿,对标世界杯!杭州“玉璧”封顶!

旅游要闻

科幻IP赋能文旅消费 刘慈欣科幻漫画宇宙主题展在海口日月广场启幕

这些新疗法,让化疗不再那么痛苦

手机要闻

魅族22Air、22 Next不开售发布,魅族23确认

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版