网易首页 > 网易号 > 正文 申请入驻

英伟达最新研究:小模型才是智能体的未来!

0
分享至

  英伟达研究院和佐治亚理工大学的研究人员最近发表了一篇论文,抛出了一个非共识的观点:

  小语言模型(SLM)才是AI智能体的未来,而不是那些庞大的大型语言模型。

  https://arxiv.org/abs/2506.02153v1

  作者核心理由主要是以下三点:

  首先,SLM已经足够强大,能处理AI智能体中大多数重复、专一的任务;其次,它们天生更适合智能体系统的架构,灵活且易集成;最后,从经济角度看,SLM更省钱、更高效,能大幅降低AI运行成本。

  想象一下,AI智能体系统就像一个虚拟团队,能自动分解任务、调用工具(比如浏览器或代码编辑器),最终解决问题。目前,大多数AI智能体都依赖LLM作为“大脑”,因为LLM聊天能力强、知识广博,能处理各种复杂问题。

  论文指出,2024年AI智能体市场已达52亿美元,预计到2034年飙升至2000亿美元,企业中超过一半已经在用。但问题来了:AI智能体的任务往往重复单一,比如“检查邮件”“生成报告”,用LLMs这种“全能选手”来干这些活,就好像用超级计算机玩扫雷,开兰博基尼送披萨——过于浪费资源。

  而且不单是浪费,智能体系统任务的特点也使得小模型能更好的适配智能体生态,从而更有可能交付出更符合要求的结果。

  因为本质上AI智能体不是聊天机器人,而是“工具箱+大脑”的系统。SLM小巧,训练/微调成本低(几小时GPU就行),易适应新需求(如新法规)。这带来“民主化”,从而能让更多人能开发智能体,减少偏见,促进创新。

  作者指出,智能体任务只用LLM的一小部分技能,如格式严格的工具调用。而AI智能体系统天然异构就利于混用模型,主智能体用LLM,子任务用SLM。

  而如果大量采用SLM,还能发挥数据收集优势:智能体运行时,自然产生的专精数据,可以用来微调SLM,形成良性循环,从而使得结果越来越好。

  01

  什么是SLM

  论文对SLM给出了一个实用的定义:

  SLMs:能装进普通消费电子设备(如手机或笔记本),推理速度快,能实时服务一个用户的智能体请求。目前,10亿参数以下的模型可以算是SLM。而其他更大的模型,通常需要云端服务器支持。

  为什么这样定义?SLM像“便携大脑”,适合终端部署;LLM像“宇宙级超级电脑”,但延迟高、成本大。

  作者给了一个很极端但是又很有意思的例子做比喻:如果AI无限大,会受光速限制没法实时互动;无限小,又太弱没法做事。人类大脑就是平衡点,SLM就像人类大脑这个平衡点,高效,易于迭代。

  作者对比两种类型的智能体结构:

  
在左侧,一个语言模型与用户聊天并直接触发每个工具,因此整个流程都位于该单个模型中。

  在右侧,一个小型控制器程序处理工具调用,让模型专注于对话或特定推理。

  这种拆分使得为大多数调用插入小型语言模型变得容易,节省成本,并将大型模型仅保留用于不太常见的开放式问答或者推理步骤。

  论文表示,最前沿的小模型如Phi-3和Hymba,在工具使用、常识推理和指令遵循方面,性能足以媲美30B到70B的大模型,但在实际工作流中的计算量却降低了10-30倍。

  英伟达还对三款真实世界的AI智能体进行了测试,发现:

  MetaGPT:60%的任务可以用SLM取代

  Open Operator:40%的任务可以用SLM取代

  Cradle(图形界面自动化):70%的任务可以用SLM取代

  02

  SLM那么好,为什么还要用LLM呢?

  论文认为AI智能体没有大规模利用SLM的主要原因还是因为路径依赖。

  大量资金(高达570亿美元)被投入了中心化的大模型基础设施,团队倾向于重复使用付费设置,而不是转向更轻的本地选项,短期内难以转变。

  行业内对「大即是好」的偏见依然强烈。对小型模型的研究一直在追逐用于大型模型的相同广泛基准,而这些测试都体现不出于小模型在智能体任务上的优秀表现。

  SLM几乎没有GPT-4那样的热度,小模型也不像让大模型那样经历了一轮一轮的营销热潮,因此许多构建者从未尝试过更便宜更合理的路线。

  对此,论文认为如果研究任务员和智能体搭建者能够做到一下几点,那么将能很好的发挥SLM在智能体方面的潜力。

  -收集梳理数据

  -针对特定任务微调SLM

  -把任务进行聚类并建立SLM的“技能”

  03

  华人作者介绍

  SHIZHE DIAO

  根据他领英公开的资料,他先后就读于北京师范大学,香港科技大学,曾经在UIUC做过访问学者。

  曾经在字节AI LAB做过实习,2024年加入英伟达担任研究科学家。

  Xin Dong

  根据他的个人博客,他博士毕业于哈佛大学。曾经在腾讯,Meta等公司有过工作和实习经历。

  Yonggan Fu

  根据他的领英公开资料,他本科毕业于中国科学技术大学,在莱斯大学和乔治亚理工完成了自己的博士学业。

  在Meta和英伟达实习过,现为英伟达研究科学家。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
切尔西昔日巨星彻底拉胯!球迷怒喷:上他等于少打一人

切尔西昔日巨星彻底拉胯!球迷怒喷:上他等于少打一人

澜归序
2026-02-20 04:10:16
警报!三种“毒早餐”竟成家长的心头好,快来看看你在喂什么!

警报!三种“毒早餐”竟成家长的心头好,快来看看你在喂什么!

特约前排观众
2026-01-25 00:20:06
特朗普称奥巴马涉外星人言论泄密

特朗普称奥巴马涉外星人言论泄密

澎湃新闻
2026-02-20 04:49:03
北大教授韩毓海:毛主席在世的时候,我完全没有能力理解他!

北大教授韩毓海:毛主席在世的时候,我完全没有能力理解他!

王発吃吃喝喝
2026-02-18 13:03:21
“姐弟之争”变中央“铁腕清场”!郑丽文三不规矩,卢秀燕梦碎!

“姐弟之争”变中央“铁腕清场”!郑丽文三不规矩,卢秀燕梦碎!

汪镛的创业之路
2026-02-19 10:30:17
俞飞鸿和母亲的事情,被网友大肆吐槽

俞飞鸿和母亲的事情,被网友大肆吐槽

陈意小可爱
2026-02-19 08:41:34
太监是否会出现净身不彻底的情况?晚清一名宫女道出其中一些门道

太监是否会出现净身不彻底的情况?晚清一名宫女道出其中一些门道

抽象派大师
2026-01-28 02:30:30
这是最好的生日礼物!苏翊鸣夺金之后难掩热泪:我只有获得第一名,才能让我们的国歌奏响

这是最好的生日礼物!苏翊鸣夺金之后难掩热泪:我只有获得第一名,才能让我们的国歌奏响

环球网资讯
2026-02-19 07:45:11
自取灭亡的立陶宛总统瑙塞达,这次中国没有迁就他!

自取灭亡的立陶宛总统瑙塞达,这次中国没有迁就他!

百态人间
2026-01-29 15:43:09
“流水220万,利润0” 2026开年多了个新词——无利润繁荣

“流水220万,利润0” 2026开年多了个新词——无利润繁荣

餐饮界
2026-02-13 19:49:19
不出意外,中国未来一半以上人口,将会流入到这些地方

不出意外,中国未来一半以上人口,将会流入到这些地方

蓝色海边
2026-02-18 00:24:06
郭台铭没料到!富士康厂妹成劲敌,抢走大批苹果订单,年赚2209亿

郭台铭没料到!富士康厂妹成劲敌,抢走大批苹果订单,年赚2209亿

胖哥不胡说
2026-01-13 12:09:17
长沙“年入35万扛楼小伙”:不想一辈子扛楼,以后想做生意挣钱买房

长沙“年入35万扛楼小伙”:不想一辈子扛楼,以后想做生意挣钱买房

封面新闻
2026-02-19 19:49:03
报复一个人最狠的方法,不是翻脸,不是打压,而是佛家三句话

报复一个人最狠的方法,不是翻脸,不是打压,而是佛家三句话

瓜哥的动物日记
2026-02-14 00:59:40
A股宝藏:被市场低估的50只优质龙头全梳理

A股宝藏:被市场低估的50只优质龙头全梳理

慧眼看世界哈哈
2026-02-20 04:26:13
美股深夜下挫,科技股普跌,原油涨近2%,特朗普称伊朗必须与美国达成“有意义的协议”

美股深夜下挫,科技股普跌,原油涨近2%,特朗普称伊朗必须与美国达成“有意义的协议”

21世纪经济报道
2026-02-19 23:46:40
中国1月Swift人民币在全球支付中占比3.13%

中国1月Swift人民币在全球支付中占比3.13%

每日经济新闻
2026-02-19 09:12:45
离春节假期结束仅剩4天,社会上出现奇怪一幕!过年出现大变样?

离春节假期结束仅剩4天,社会上出现奇怪一幕!过年出现大变样?

猫叔东山再起
2026-02-19 18:05:03
你身边有把一手好牌打的稀烂的人吗?网友:都是上辈子欠人家的

你身边有把一手好牌打的稀烂的人吗?网友:都是上辈子欠人家的

带你感受人间冷暖
2026-01-21 00:15:05
小朋友说过最离谱的话是啥?网友:哈哈哈,这个画面感也太强了点

小朋友说过最离谱的话是啥?网友:哈哈哈,这个画面感也太强了点

带你感受人间冷暖
2026-02-05 02:09:15
2026-02-20 08:36:49
直面派 incentive-icons
直面派
讲述值得讲述的真实故事
248文章数 235关注度
往期回顾 全部

科技要闻

怒烧45亿,腾讯字节阿里决战春节

头条要闻

65岁尹锡悦被判无期 韩国近10年来未曾判处过一例死刑

头条要闻

65岁尹锡悦被判无期 韩国近10年来未曾判处过一例死刑

体育要闻

宁忠岩4年从第7到摘金,刷新奥运纪录

娱乐要闻

霍启山恋情再添实锤 和娜然同游意大利

财经要闻

面条火腿香菇酱!上市公司这些年请你吃

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

手机
游戏
亲子
旅游
健康

手机要闻

Google发布 Gemini 3.1 Pro:主打“复杂问题求解”的推理升级

狂卖9万份!《如龙极3》日本实体首周销量出炉

亲子要闻

妈妈的侥幸,就是孩子的灾难!

旅游要闻

大年初三,济南30家重点监测景区纳客79.57万人次

转头就晕的耳石症,能开车上班吗?

无障碍浏览 进入关怀版