网易首页 > 网易号 > 正文 申请入驻

Gartner:AI大模型触达天花板,警惕“贴牌智能体”

0
分享至

21世纪经济报道记者 彭新

近日,市场调研公司Gartner发布《2025年中国数据、分析和人工智能技术成熟度曲线》报告,解析中国AI市场未来走向。

生成式AI和代理型AI是报告的两大核心主题,共同塑造了今年中国AI发展的主要趋势。该报告显示,此前AI市场“顶流”大语言模型(LLM)已越过市场期望顶峰,热度趋冷并开始滑向“泡沫破裂低谷期”,在经历“百模大战”后,市场已趋于理性。



Gartner高级研究总监闫斌称,对于中国的数据、分析和AI领域的领导者来说,现在比以往更需要在AI炒作的喧嚣中认清AI的真正价值。他告诉21世纪经济报道记者,从现实来看,大语言模型的能力已到天花板,性能的边际提升有限,使得AI市场趋势从“模型”向“智能体”转移成为必然。

“到2027年,优先考虑准备AI就绪型数据而非生成式AI模型开发的中国企业中,80%实现的业务价值将是同行的两倍。”闫斌表示,中国AI产业正从尝鲜期进入价值兑现期,数据质量与治理能力将取代模型性能成为核心竞争力。

GPT-5反应平淡,2026年将进入“AI下半场”

闫斌表示,GPT-5的市场反应证明了大语言模型发展的重要拐点。市场曾期待GPT-5接近AGI(通用人工智能),但实际发布后效果有限。“这体现了现在大语言模型的能力——技术发展随着时间推移确实有过快速飞跃,但到今天已经慢慢感觉到天花板了,上面仿佛一条无形的线压着它,它上不去了。”他说。

根据国际AI模型评测网站Artificial Analysis数据,OpenAI从2022至2023年保持领先优势,但已进入“Frog Leap”(青蛙跳)式混战——某个模型跳过去领先一点,另一个模型马上超过上来。国内的DeepSeek、千问、Kimi等模型已进入第一梯队。

“现在模型排名第一、第二、第三,实际使用起来区别不大。”闫斌指出,各家模型性能提升空间有限,领先优势微乎其微。这也解释了为何大语言模型在Gartner成熟度曲线上从期望峰值掉头向下。

闫斌表示,模型厂商数量正在减少,出现收购、并购和价格战。未来模型的发展方向是从“⼤”转向“精”,通过Small Language Model(小语言模型)和领域专业模型(DSLM)实现精细化、场景化突破。

Gartner强调,大语言模型并非万能,未来更强的AI系统需要结合多种技术。“大语言模型就像汽车发动机,AI Agent是整车。”闫斌比喻,“发动机可以用大语言模型,也可以用其他技术,最后拼装成整车,混合系统要比只依赖大模型好用得多。”

另一方面,Gartner调研数据显示,中国企业将生成式AI部署到生产环境的比例从2023至2024年的6%至8%,在2025年暴涨至40%。“我相信现在已经涨到60%至70%。”闫斌判断,2025年企业对生成式AI的“尝鲜期”结束后,2026年将正式进入“AI下半场”。

闫斌强调,生成式AI时代对高质量数据有很高要求,企业若无法提供高质量的“上下文”数据,再强的模型也无法产生价值。Gartner预测,到2027年,优先考虑准备AI就绪型数据的中国企业,其实现的业务价值将是同行的两倍。

对于传统企业AI应用上,闫斌坦言仍面临巨大挑战。“有些企业光做数字化转型就要三年。”他表示,AI是系统工程,涉及企业方方面面的改造。“如果企业的API(应用程序编程接口)根本不好用,要引入智能体,还得先把旧有系统做好数字化转型。”

相比之下,互联网和高科技企业将走得更快,因为系统架构新、API友好、数据管理规范、企业文化接受度高。

“Agent Washing”泛滥,多数产品名不副实

在AI Agent(智能体)方面,闫斌直言行业存在严重的“Agent Washing”(贴牌智能体)现象,即将普通的聊天机器人宣称为智能体。

“昨天厂商的产品其实还是聊天机器人,今天摇身一变成了AI Agent,里面其实什么都没变、只有名字变了。现在市面号称的智能体,可能10个里面有8个其实并不是真正的。”闫斌表示。从资本市场来看,近期不少公司借助AI智能体概念进行宣传炒作,但产品本质并未改变。

从演进路径看,AI智能体已经历了三个阶段:聊天机器人(Chatbot)专注于在对话中给出答案,智能助手(Assistant)帮助完成任务,智能体(AI Agent)则要完成更复杂的目标。“从今天来看,我们可能刚刚跨入智能体的大门。”闫斌判断,当前还有很多产品不是真正的AI Agent,处于从Assistant向Agent过渡的阶段。

根据Gartner定义,真正的AI智能体需要具备三要素:感知世界、自主决策、执行行动,最终与环境形成闭环反馈。“以五分制评价,大模型在语言理解上可以打四星半,行动能力四星,但决策能力只有三星。”闫斌表示,大模型尤其是在针对企业复杂场景的决策能力仍然较弱。

从实际应用来看,闫斌透露,市面上很多所谓智能体,为了可靠性,仍然基于写死的工作流程,难以做到智能化。“根本原因是智能体可靠性不足,完全依赖大语言模型做决策有点像算命的感觉,因为大语言模型还是基于概率的。”

观察近期AI智能体技术进展,MCP(模型上下文协议)一词频频被提及,MCP是AI智能体用来执行任务的一种通信协议或标准。

对此,闫斌认为MCP价值被高估,他解释,MCP的理想状态是互联网中智能体和工具处于开放状态,可以通过统一协议调用。但实际应用中来看,调用出错时的异常处理、安全因素、性能因素都是问题。“对于企业来讲,难点不在于用什么协议,难点是原来为软件写的API是否适合Agent调用。”他说,包括权限管理、调用频率控制等都需要改造。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
从端屎端尿到决绝分手,瞿颖用半年看透他,原来患难不一定见真情

从端屎端尿到决绝分手,瞿颖用半年看透他,原来患难不一定见真情

观察者海风
2026-02-28 19:30:08
新iPhone 正式官宣:3 月 2 日,即将发布!

新iPhone 正式官宣:3 月 2 日,即将发布!

科技堡垒
2026-02-28 11:22:07
WTT大满贯:王曼昱9-2险翻车!首局轰15-13,对手连得8分逆转失败

WTT大满贯:王曼昱9-2险翻车!首局轰15-13,对手连得8分逆转失败

刘姚尧的文字城堡
2026-03-01 12:21:22
震撼!曾精确预言911的盲眼神婆预测今年8大事件,有一条暗指中国

震撼!曾精确预言911的盲眼神婆预测今年8大事件,有一条暗指中国

刀刃故事
2024-11-22 01:55:03
结婚不到一年,娶了“白月光”的李国庆,口碑彻底反转了

结婚不到一年,娶了“白月光”的李国庆,口碑彻底反转了

萧鑟科普解说
2026-02-26 06:07:11
为什么说丰田混动是普通人的优选车

为什么说丰田混动是普通人的优选车

侃故事的阿庆
2026-03-01 18:03:42
战斧导弹为啥要超低空飞行?

战斧导弹为啥要超低空飞行?

52赫兹实验室
2026-03-01 09:49:41
央媒怒批、坑害老百姓!臭名昭著的四大相声演员,各个难以原谅

央媒怒批、坑害老百姓!臭名昭著的四大相声演员,各个难以原谅

青橘罐头
2026-02-18 07:08:27
五角大楼称美军12小时内对伊朗发动900次空袭

五角大楼称美军12小时内对伊朗发动900次空袭

财联社
2026-03-01 10:57:04
德国总理访华回国后发表演讲: 从中国回去就能深刻感受到 德国目前的状况 无法维持德国的长久繁荣

德国总理访华回国后发表演讲: 从中国回去就能深刻感受到 德国目前的状况 无法维持德国的长久繁荣

闪电新闻
2026-02-28 15:46:30
让央视春晚给全国道歉,入美国籍回中国捞金,她到底有什么来头?

让央视春晚给全国道歉,入美国籍回中国捞金,她到底有什么来头?

陌上桃花开的
2026-02-28 16:16:42
八路军有条奇怪的战场纪律:可以不要冲锋枪,但必须拿走三八大盖

八路军有条奇怪的战场纪律:可以不要冲锋枪,但必须拿走三八大盖

饭小妹说历史
2026-03-01 10:53:31
杜聿明晚年回忆:要是听了郭汝瑰的话,我真有可能从淮海战场逃走

杜聿明晚年回忆:要是听了郭汝瑰的话,我真有可能从淮海战场逃走

掠影后有感
2026-03-01 10:05:58
比熬夜可怕十倍的10个坏习惯,一定要抛弃!

比熬夜可怕十倍的10个坏习惯,一定要抛弃!

深度知局
2026-02-26 21:39:44
连续6年数据为零!马斯克画饼被监管揭穿:特斯拉从未在加州推进Robotaxi无人驾驶测试

连续6年数据为零!马斯克画饼被监管揭穿:特斯拉从未在加州推进Robotaxi无人驾驶测试

快科技
2026-02-27 16:09:08
钱枫近照曝光,肥头大耳认不出,天天兄弟物是人非:还好退圈了

钱枫近照曝光,肥头大耳认不出,天天兄弟物是人非:还好退圈了

娱说瑜悦
2026-02-27 17:37:41
10点睡觉是错误的?医生建议:过了63岁,睡觉尽量要做到这5点!

10点睡觉是错误的?医生建议:过了63岁,睡觉尽量要做到这5点!

小胡军事爱好
2026-03-01 18:50:10
4000万港元成本,《夜王》口碑票房爆棚,江志强助港片大赚一笔

4000万港元成本,《夜王》口碑票房爆棚,江志强助港片大赚一笔

电影票房预告片
2026-02-28 00:18:13
大S两娃去医院探望后妈马筱梅照片曝光,网友感叹满屏讨好的客气

大S两娃去医院探望后妈马筱梅照片曝光,网友感叹满屏讨好的客气

安宁007
2026-02-28 21:48:25
脸在江山在?事实证明,失去黄晓明的杨颖,又回到了她的“怪圈”

脸在江山在?事实证明,失去黄晓明的杨颖,又回到了她的“怪圈”

观察鉴娱
2026-02-28 10:07:44
2026-03-01 21:19:00
21世纪经济报道 incentive-icons
21世纪经济报道
中国商业新闻领导者
235032文章数 743764关注度
往期回顾 全部

科技要闻

小米超跑概念车全球首秀!杀入顶豪俱乐部

头条要闻

伊朗代表在安理会会议上直接警告美方:建议你保持礼貌

头条要闻

伊朗代表在安理会会议上直接警告美方:建议你保持礼貌

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

《江山为聘》:吴谨言陈哲远燃炸朝堂

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

理想汽车2月交付26421辆 历史累计交付超159万辆

态度原创

房产
数码
家居
本地
公开课

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

数码要闻

小米Vision Gran Turismo超跑设计细节首曝

家居要闻

素色肌理 品意式格调

本地新闻

津南好·四时总相宜

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版