网易首页 > 网易号 > 正文 申请入驻

英伟达最新研究:小模型才是智能体的未来!

0
分享至

  英伟达研究院和佐治亚理工大学的研究人员最近发表了一篇论文,抛出了一个非共识的观点:

  小语言模型(SLM)才是AI智能体的未来,而不是那些庞大的大型语言模型。

  https://arxiv.org/abs/2506.02153v1

  作者核心理由主要是以下三点:

  首先,SLM已经足够强大,能处理AI智能体中大多数重复、专一的任务;其次,它们天生更适合智能体系统的架构,灵活且易集成;最后,从经济角度看,SLM更省钱、更高效,能大幅降低AI运行成本。

  想象一下,AI智能体系统就像一个虚拟团队,能自动分解任务、调用工具(比如浏览器或代码编辑器),最终解决问题。目前,大多数AI智能体都依赖LLM作为“大脑”,因为LLM聊天能力强、知识广博,能处理各种复杂问题。

  论文指出,2024年AI智能体市场已达52亿美元,预计到2034年飙升至2000亿美元,企业中超过一半已经在用。但问题来了:AI智能体的任务往往重复单一,比如“检查邮件”“生成报告”,用LLMs这种“全能选手”来干这些活,就好像用超级计算机玩扫雷,开兰博基尼送披萨——过于浪费资源。

  而且不单是浪费,智能体系统任务的特点也使得小模型能更好的适配智能体生态,从而更有可能交付出更符合要求的结果。

  因为本质上AI智能体不是聊天机器人,而是“工具箱+大脑”的系统。SLM小巧,训练/微调成本低(几小时GPU就行),易适应新需求(如新法规)。这带来“民主化”,从而能让更多人能开发智能体,减少偏见,促进创新。

  作者指出,智能体任务只用LLM的一小部分技能,如格式严格的工具调用。而AI智能体系统天然异构就利于混用模型,主智能体用LLM,子任务用SLM。

  而如果大量采用SLM,还能发挥数据收集优势:智能体运行时,自然产生的专精数据,可以用来微调SLM,形成良性循环,从而使得结果越来越好。

  01

  什么是SLM

  论文对SLM给出了一个实用的定义:

  SLMs:能装进普通消费电子设备(如手机或笔记本),推理速度快,能实时服务一个用户的智能体请求。目前,10亿参数以下的模型可以算是SLM。而其他更大的模型,通常需要云端服务器支持。

  为什么这样定义?SLM像“便携大脑”,适合终端部署;LLM像“宇宙级超级电脑”,但延迟高、成本大。

  作者给了一个很极端但是又很有意思的例子做比喻:如果AI无限大,会受光速限制没法实时互动;无限小,又太弱没法做事。人类大脑就是平衡点,SLM就像人类大脑这个平衡点,高效,易于迭代。

  作者对比两种类型的智能体结构:

  
在左侧,一个语言模型与用户聊天并直接触发每个工具,因此整个流程都位于该单个模型中。

  在右侧,一个小型控制器程序处理工具调用,让模型专注于对话或特定推理。

  这种拆分使得为大多数调用插入小型语言模型变得容易,节省成本,并将大型模型仅保留用于不太常见的开放式问答或者推理步骤。

  论文表示,最前沿的小模型如Phi-3和Hymba,在工具使用、常识推理和指令遵循方面,性能足以媲美30B到70B的大模型,但在实际工作流中的计算量却降低了10-30倍。

  英伟达还对三款真实世界的AI智能体进行了测试,发现:

  MetaGPT:60%的任务可以用SLM取代

  Open Operator:40%的任务可以用SLM取代

  Cradle(图形界面自动化):70%的任务可以用SLM取代

  02

  SLM那么好,为什么还要用LLM呢?

  论文认为AI智能体没有大规模利用SLM的主要原因还是因为路径依赖。

  大量资金(高达570亿美元)被投入了中心化的大模型基础设施,团队倾向于重复使用付费设置,而不是转向更轻的本地选项,短期内难以转变。

  行业内对「大即是好」的偏见依然强烈。对小型模型的研究一直在追逐用于大型模型的相同广泛基准,而这些测试都体现不出于小模型在智能体任务上的优秀表现。

  SLM几乎没有GPT-4那样的热度,小模型也不像让大模型那样经历了一轮一轮的营销热潮,因此许多构建者从未尝试过更便宜更合理的路线。

  对此,论文认为如果研究任务员和智能体搭建者能够做到一下几点,那么将能很好的发挥SLM在智能体方面的潜力。

  -收集梳理数据

  -针对特定任务微调SLM

  -把任务进行聚类并建立SLM的“技能”

  03

  华人作者介绍

  SHIZHE DIAO

  根据他领英公开的资料,他先后就读于北京师范大学,香港科技大学,曾经在UIUC做过访问学者。

  曾经在字节AI LAB做过实习,2024年加入英伟达担任研究科学家。

  Xin Dong

  根据他的个人博客,他博士毕业于哈佛大学。曾经在腾讯,Meta等公司有过工作和实习经历。

  Yonggan Fu

  根据他的领英公开资料,他本科毕业于中国科学技术大学,在莱斯大学和乔治亚理工完成了自己的博士学业。

  在Meta和英伟达实习过,现为英伟达研究科学家。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
杨绛:记住,和周围人搞好关系的秘诀就是,不要和他们分享任何成功的喜悦,和任何开心的事儿

杨绛:记住,和周围人搞好关系的秘诀就是,不要和他们分享任何成功的喜悦,和任何开心的事儿

四行书
2025-12-14 17:37:10
对话小鹏、理想、问界等5位车主,今年春运谁有充电焦虑?|新春走基层

对话小鹏、理想、问界等5位车主,今年春运谁有充电焦虑?|新春走基层

蓝鲸新闻
2026-02-18 15:10:22
42岁的王冠嫁给了企业家,住800平的别墅,穿188元的拖鞋

42岁的王冠嫁给了企业家,住800平的别墅,穿188元的拖鞋

潘蠸旅行浪子
2026-01-27 17:15:38
汽车圈“大地震”!比亚迪大将投奔行业巨头,叫嚣:三年内没对手

汽车圈“大地震”!比亚迪大将投奔行业巨头,叫嚣:三年内没对手

长星寄明月
2026-01-20 21:00:46
七个姐妹凑70万开咖啡店,结果从“七仙女”变成“战国七雄”互掐

七个姐妹凑70万开咖啡店,结果从“七仙女”变成“战国七雄”互掐

达文西看世界
2026-02-12 11:31:45
整天开会有啥必要啊?

整天开会有啥必要啊?

北京老付
2026-01-20 10:59:33
不是血统问题!美媒主编点破:谷爱凌争议,只因她是美国本可拥有的王牌

不是血统问题!美媒主编点破:谷爱凌争议,只因她是美国本可拥有的王牌

草莓解说体育
2026-02-18 03:01:17
CBA夺冠形势大变,热门球队硬核升级,卫冕冠军遭遇伤病危机

CBA夺冠形势大变,热门球队硬核升级,卫冕冠军遭遇伤病危机

五姑娘台球
2026-02-19 09:49:07
2月19日冬奥会看点:宁忠岩1500米冲击领奖台,谷爱凌再度登场

2月19日冬奥会看点:宁忠岩1500米冲击领奖台,谷爱凌再度登场

全景体育V
2026-02-19 07:06:24
暗示将离队?林葳接受采访袒露心声 他已成男篮下一代后卫领袖

暗示将离队?林葳接受采访袒露心声 他已成男篮下一代后卫领袖

大嘴爵爷侃球
2026-02-19 11:59:32
夸美国空气香甜的杨舒平,已被美驱逐出境,如今回国下场怎么样了

夸美国空气香甜的杨舒平,已被美驱逐出境,如今回国下场怎么样了

谈史论天地
2026-02-07 13:20:03
空客2025年净利润52.21亿欧元 同比增长23%

空客2025年净利润52.21亿欧元 同比增长23%

每日经济新闻
2026-02-19 13:28:03
硬刚美国仅3天,秘鲁总统突然下台,波及中国35亿投资,美方表态

硬刚美国仅3天,秘鲁总统突然下台,波及中国35亿投资,美方表态

东极妙严
2026-02-18 18:16:28
霉运运来!3月顺风顺水,财只进不出的3个生肖

霉运运来!3月顺风顺水,财只进不出的3个生肖

毅谈生肖
2026-02-19 18:09:13
章若楠大年初一去舅舅家,穿貂毛大衣素颜漂亮,送48元碗仔面节俭

章若楠大年初一去舅舅家,穿貂毛大衣素颜漂亮,送48元碗仔面节俭

另子维爱读史
2026-02-18 14:40:12
北京警方刑拘30余人!

北京警方刑拘30余人!

美丽大北京
2026-02-18 17:16:34
向美国捐8亿被骂叛徒!无锡唐氏21代掌门:我的钱只认文明归属

向美国捐8亿被骂叛徒!无锡唐氏21代掌门:我的钱只认文明归属

谈史论天地
2026-02-10 08:16:24
91年在医院照顾舅舅,顺便帮了邻床一把,没想到却改变了我一生

91年在医院照顾舅舅,顺便帮了邻床一把,没想到却改变了我一生

衍月
2025-11-17 16:54:11
灰熊官宣:莫兰特因左手肘扭伤至少再伤停两周 本季已缺席33场

灰熊官宣:莫兰特因左手肘扭伤至少再伤停两周 本季已缺席33场

醉卧浮生
2026-02-19 11:21:20
27岁荷兰女王破纪录,拉链一拉全网爆,代言或超百万美元?

27岁荷兰女王破纪录,拉链一拉全网爆,代言或超百万美元?

老吴教育课堂
2026-02-19 04:14:51
2026-02-19 19:59:00
直面派 incentive-icons
直面派
讲述值得讲述的真实故事
248文章数 235关注度
往期回顾 全部

科技要闻

怒烧45亿,腾讯字节阿里决战春节

头条要闻

尹锡悦被判无期只瞥了一眼法官 离庭时与律师相视一笑

头条要闻

尹锡悦被判无期只瞥了一眼法官 离庭时与律师相视一笑

体育要闻

不想退役!徐梦桃:希望能参加第6次冬奥

娱乐要闻

明星过年百态!黄晓明等现身三亚

财经要闻

面条火腿香菇酱!上市公司这些年请你吃

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

游戏
时尚
教育
艺术
军事航空

集体错觉?《ARC》官方辟谣机器人学习玩家打法传闻

冬季穿衣不用太复杂!内搭选高领、外套选简约款,大方又耐看

教育要闻

教育思路 不训练延迟满足

艺术要闻

震惊!安徒生竟是画家,他的田园生活太美了!

军事要闻

金正恩出席火箭炮赠送仪式 强调确保朝鲜安全环境

无障碍浏览 进入关怀版