网易首页 > 网易号 > 正文 申请入驻

2026年AI变天:350M小模型把120B大模型逼成了"后台客

0
分享至


2024年你问ChatGPT明天天气,2025年你让它订机票,2026年它开始自己组队干活了——而且队伍里最忙的不是那个最大的。

三个数字正在改写开发者的日常:65 token/秒的本地推理速度、350M参数的活跃智能体、以及一套50年前的老技术重新杀回C位。这不是参数军备竞赛的延续,而是组织方式的彻底换轨。

从JSON到Shell:AI终于学会"打电话"而不是"填表格"

过去两年,开发者给AI agent建了一座图书馆——不是让它读书,而是让它填借书卡。每个工具都要写JSON schema,每个动作都要先查目录再选编号。上下文窗口被这些结构化描述撑爆,agent的可靠性像过山车。

2026年的解法让人意外:扔掉图书馆,直接给AI一部电话。

open-multi-agent项目和AWS新推出的CLI Agent Orchestrator在做同一件事——把能力暴露为标准命令行指令。AI不再需要学习新的JSON方言,它获得的是一个终端(通过run(command="..." ))和管道符(|、&&、||)。

训练数据里已经塞了数十亿行shell脚本,这是人类写给机器的最古老接口之一。

从"函数选择"转向"字符串组合",token开销和认知负荷同时下降。一个类比:以前AI点菜要先看菜单编码再填订单,现在直接对后厨喊"少辣加蛋"。


Unix哲学(小工具做好一件事,通过管道组合)在AI orchestration(编排)层复活。这不是怀旧,是算力约束下的最优解。

背包里的服务器:120B模型在M5 Max上跑65 token/秒

本地AI的临界点到了,而且来得比预期更猛。

Google的TurboQuant架构是幕后推手之一。它通过随机旋转n维状态向量再量化,绕过了早期量化模型的"注意力沉陷"精度损失。配合Apple M5 Max把神经网络加速器(Neural Accelerators)直接塞进GPU核心的设计,结果让开发者重新考虑自己的硬件预算。

实测数据:Qwen3.5-122B-A10B-4bit和gpt-oss-120b这类120B+参数模型,在笔记本上跑到65 token/秒以上。企业机架和开发者背包的界限,正在模糊。

「我们测过,同一台M5 Max跑70B模型的吞吐量,已经接近两年前A100云实例的水平。」一位在Hugging Face维护量化模型的开发者提到。

但这只是故事的一半。

350M参数的智能体:小个子成了前线主力


2026年最反直觉的趋势发生在参数规模的另一端。

Liquid AI发布的LFM2.5-350M证明,3.5亿参数足以支撑可靠的agentic loop(智能体循环)。Mistral的Voxtral TTS用3GB内存、低于100毫秒延迟,做出业内顶尖的语音合成。这些微型模型不跟大模型拼智商,它们拼的是嵌入位置和响应速度。

典型场景:一个350M模型实时处理用户语音输入,提取意图后扔给120B模型做深度推理,再把结果丢给另一个专用小模型生成回复。大模型成了后台的"顾问",小模型包揽前台交互。

智能和能动性(agency)不再与模型尺寸挂钩,这是2026年最核心的认知更新。

开发者开始把微模型直接埋进应用管道,作为专用节点向更大的编排器输送结果。整个系统的智能分布像蜂窝——没有中心大脑,只有分工协作的节点。

Chorus(合唱队)这个词开始频繁出现。不是人类和机器的对话,而是机器与机器的编排。每个声部有自己的音域,合起来才是完整的演奏。

一位在开源orchestration框架中贡献代码的工程师说:「2024年我们争论prompt工程,2025年争论RAG架构,2026年争论的是进程间通信协议。」

当AI的基础设施层退回到Unix哲学,应用层却向前跃进到了分布式智能体网络。这种张力定义了今年的技术图景——不是更简单,而是更分层;不是更集中,而是更碎片化。

你的下一个AI应用,可能由五六个不同大小的模型共同完成,而你甚至不会意识到谁在具体执行哪一步。这种透明化的复杂,是进步还是新的黑箱?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
对话20年前采访张雪的记者易军:开拍20分钟,我觉得“上当受骗”了

对话20年前采访张雪的记者易军:开拍20分钟,我觉得“上当受骗”了

新民周刊
2026-04-01 20:15:11
研究张雪峰 3 年,我发现他反复推的专业,就这几个

研究张雪峰 3 年,我发现他反复推的专业,就这几个

混沌录
2026-04-01 20:48:11
薅羊毛失败!50万婚纱费砸手里了,70名女子“嫁给自己”荒唐收场

薅羊毛失败!50万婚纱费砸手里了,70名女子“嫁给自己”荒唐收场

火山詩话
2026-04-02 06:26:48
“嫁给自己”没嫁成,先嫁给了50万债务

“嫁给自己”没嫁成,先嫁给了50万债务

老端的观点
2026-04-01 19:46:12
继德国之后,英国也开始贴出“中文标语”?中国游客:不能够接受

继德国之后,英国也开始贴出“中文标语”?中国游客:不能够接受

潮鹿逐梦
2026-04-02 12:31:48
特朗普称中国富豪有56个美国孩子 吃瓜网友们:这位富豪是谁?

特朗普称中国富豪有56个美国孩子 吃瓜网友们:这位富豪是谁?

齐天候
2026-04-01 14:51:44
伊朗外交部发言人:伊朗将继续抵抗“非法战争”

伊朗外交部发言人:伊朗将继续抵抗“非法战争”

财联社
2026-04-02 14:22:09
70名女性“嫁给自己”后集体退货婚纱,商家拒退,52万打水漂

70名女性“嫁给自己”后集体退货婚纱,商家拒退,52万打水漂

看晓天下事
2026-04-02 11:57:46
桌面装备新标杆:安克黑神话悟空联名套装体验评测

桌面装备新标杆:安克黑神话悟空联名套装体验评测

极果酷玩
2026-01-27 18:44:43
两地副市长,接连任上被查

两地副市长,接连任上被查

上观新闻
2026-04-02 13:47:05
27岁单亲妈妈开直播,播着播着睡着了,醒来一看后台直接傻眼了

27岁单亲妈妈开直播,播着播着睡着了,醒来一看后台直接傻眼了

小椰的奶奶
2026-04-01 17:04:55
“自动铅笔”事件火了,面相学果然权威,带入同学视角天都塌了!

“自动铅笔”事件火了,面相学果然权威,带入同学视角天都塌了!

知晓科普
2026-04-02 07:35:03
特朗普将油价飙升归咎于伊朗,称涨价是“暂时的”;“开玩笑”表示如果没跟伊朗达成协议都怪万斯,如果成了“功劳全归我”

特朗普将油价飙升归咎于伊朗,称涨价是“暂时的”;“开玩笑”表示如果没跟伊朗达成协议都怪万斯,如果成了“功劳全归我”

大风新闻
2026-04-02 11:46:05
英国首相回应特朗普退出北约言论

英国首相回应特朗普退出北约言论

新华社
2026-04-01 17:49:30
7天时间已过,日本拒绝道歉,中方发起反制,禁止高市幕僚入境

7天时间已过,日本拒绝道歉,中方发起反制,禁止高市幕僚入境

书纪文谭
2026-04-01 19:28:04
随着邱党3-4,2026乒乓球男子世界杯8强诞生1席:世界第4逆转晋级

随着邱党3-4,2026乒乓球男子世界杯8强诞生1席:世界第4逆转晋级

凌空倒钩
2026-04-02 12:59:54
峰学未来直播间只剩3万人!满屏"退钱":没了张雪峰还是不行

峰学未来直播间只剩3万人!满屏"退钱":没了张雪峰还是不行

魔都姐姐杂谈
2026-04-02 12:29:52
国家一级女演员陈丽云被逮捕!

国家一级女演员陈丽云被逮捕!

许三岁
2026-03-28 09:24:30
4月1日起全国道路监控全面启用,这10种行为将直接扣分罚款

4月1日起全国道路监控全面启用,这10种行为将直接扣分罚款

深度报
2026-04-01 20:31:41
人类对闲鱼的开发速度,跟不上闲鱼的进化速度

人类对闲鱼的开发速度,跟不上闲鱼的进化速度

定焦One
2026-04-02 12:14:27
2026-04-02 15:00:49
全栈遛狗员
全栈遛狗员
白天跟需求对线,晚上在小区遛狗。
715文章数 30关注度
往期回顾 全部

科技要闻

SpaceX秘密申报IPO,估值冲刺12万亿

头条要闻

媒体:打了一个月把美国带入泥潭 特朗普面临两难抉择

头条要闻

媒体:打了一个月把美国带入泥潭 特朗普面临两难抉择

体育要闻

这六个字,代表了邵佳一的新国足

娱乐要闻

宋宁峰带女儿出轨,张婉婷找董璇哭诉

财经要闻

电商售械三水光针 机构倒货or假货猖獗?

汽车要闻

2026款海豹06GT/海豹06DM-i旅行版激光雷达上车

态度原创

时尚
教育
艺术
房产
本地

女人有没有品位看看穿搭就知道,这些造型值得借鉴,温柔高级

教育要闻

四年级学霸题,求A和B,思维训练

艺术要闻

故人西辞黄鹤楼,烟花三月下扬州

房产要闻

大反转!海口今年首宗重磅江景地块,拍卖突然终止!

本地新闻

从学徒到世界冠军,为什么说张雪的底气在重庆?

无障碍浏览 进入关怀版