网易首页 > 网易号 > 正文 申请入驻

“雷军的AI秘密武器”罗福莉首秀:详解小米AGI之路

0
分享至



作者|郭晓静

12月17日,2025小米“人车家全生态合作伙伴大会”举办。在这次大会上,小米MiMo团队负责人罗福莉完成了首秀演讲。作为前DeepSeek核心成员,罗福莉自从加入小米,就被视为小米AI研发走向“正规军化”和“极客化”的里程碑。

市场曾期待她能带来像DeepSeek那样颠覆性的“小而美”模型,而罗福莉身上AI时代的极客特质,也许能与小米初创时期的极客基因完美相融,产生新的化学反应。

罗福莉的首秀略显紧张,但不负众望,她带来了一个高效的模型MiMo-V2-Flash,也抛出了新的AGI梦想。

在她看来,现在的模型大多只是“完美的语言外壳,没有锚定现实世界的物理模型”;“真正的智能是从交互中活出来的”,通往AGI的必经之路,不是打造一个程序,而是“推演整个世界的运作逻辑,打造一个虚拟宇宙”。

这次首秀,罗福莉确实带来了鲜明的“DeepSeek 基因”,比如MoE架构、MTP技术和对极致效率的追求。

此次开源的MiMo-V2-Flash模型,它具备三个核心特点:

高效推理

虽然总参高达309B,但通过MoE架构仅激活15B,结合被低估的MTP(多令牌预测)技术,生成速度达到150 tokens/秒。这带来约2.5倍加速,主要为了解决车机、助手等端侧交互对延迟的敏感。

创新的长文本架构

设计上追求“简单优雅”,采用Hybrid SWA机制,锁定128 tokens的“神奇窗口”。这不仅支持256K长上下文,固定了KV缓存以降低硬件压力,还在代码生成上刷新了SOTA。

极高的性价比

落地层面非常务实,后训练阶段采用MOPD技术,用极低的计算量(不到标准流程1/50)复刻教师模型性能,意在降低大规模部署的成本。


这场首秀被安排在“人车家全生态”大会上,意义耐人寻味。罗福莉在小米的职责很明确:主导大模型研发,通过高效推理与智能体技术,推动AI从“语言交互”跨越到“物理世界”,赋能全生态。

但客观来看,端侧AI智能、赋能全生态的理想还在路上,现在的硬件依然难以支撑这样一个已经“极致效率”的模型。

以当前最高端的旗舰手机为例,端侧模型的舒适区依然停留在3B到7B参数之间。MiMo-V2-Flash的15B激活参数,对移动设备而言依然是“房间里的大象”。

所谓的“高效推理”,更多是指在云端数据中心实现了高吞吐量,对于用户手中的终端,这依然是一个重度依赖网络的“云端模型”。

虽然有惊喜,但是此次小米并没有打破端侧AI的算力天花板,对于期待“AI手机”变革的用户而言,还需要继续等待。

但今天的罗福莉,确实在给小米,讲了一个可围绕“人车家生态的”、新的AGI故事。


以下为演讲实录(为优化阅读体验,做了二次编辑、删减):

01

从生物演变看 AI 发展路径

今天我想带大家换一个视角,从 10 亿年生物进化的长河中,重新去审视我们正在经历的这一场 AI 变革。

如果我们回到生命进化的历程,会发现自然界在构建智能这座金字塔时,遵循着非常严密的逻辑:在 6 亿年前,生命首先学会了控制身体与环境互动;紧接着进化出了多巴胺系统,通过强化学习进一步提升生存能力;在 2 亿年前,哺乳动物的大脑首次具备了在行动前先在大脑里模拟未来的能力;最终我们发现,人类才登上了智能的塔尖,掌握了语言这一抽象的符号系统。

所以我们能看到,生物演化的规律是先具备对物理世界的感知和生存体验,最后才诞生了语言。但大家都能发现,到现在为止,大模型的发展路径其实跟生物进化路径是不同步的,甚至说是一种倒叙,或者说是一种跳跃。


生物是先从行动进化到思考,再进化到语言;但是大模型是先学会了语言,再去补齐它的思考能力,最后再去补齐对物理世界的模拟以及具身感知。

为什么大模型智能的产生首先是在语言领域?因为语言不仅仅是一种符号的排列组合,更是人类思维以及对于世界的一种描述。在文本领域的投射,本质上是一种有损压缩。当大模型通过 Next Token Prediction(下一词预测)这种范式在海量文本里进行学习,试图把 Loss(损失函数)降到最低的时候,我们发现它不仅仅是在拟合一个统计规律,而是在压缩人类数十亿年间关于这个世界的认知同构。

这种压缩的过程,在我们看来就是一种智能。所以,大模型通过语言的爆发,通过 Scaling(扩展)算力和数据,从而理解了人类的思维和对世界的理解。但其实它并不真正像人类一样具备对整个物理世界的感知。严谨来说,它应该是成功地解码了人类思维在文本空间的一个投影。大家都能看到,这其实是一种自顶向下的捷径,因为它是在学习一种智能的结果,来倒推智能产生的过程。

02

MiMo-V2-Flash 的诞生,

解决三大核心问题

不管怎么说,语言包含了人类对世界极致的压缩,是智慧的结晶,也是高阶智能体之间高效协作的工具。因此,小米从语言出发,构建了全新一代面向 Agent(智能体)的基座模型——MiMo-V2-Flash。

MiMo-V2-Flash 在研发之初,主要围绕着三个非常关键的问题展开:

第一,我们认为当代的智能体必须要有一个高效的沟通语言,即代码能力和工具调用能力。

第二,目前智能体之间的沟通带宽非常低,如何加速带宽?这需要一个推理效率极高的模型结构。

第三,Scaling 的范式已经逐步从预训练(Pre-train)转向后训练(Post-train),我们如何激发后训练的潜能?这就需要一个稳定的范式,以便在强化学习(RL)上投入更多的 Compute(算力)。

在这三个问题的驱动下,我们看到了 MiMo-V2-Flash 超强的基座潜能。虽然它的总参数在我看来非常小——总参数 309B,激活参数只有 15B,我甚至都不愿意称它为“大”模型——但它的代码能力和 Agent 能力在世界级公开公正的评估榜单上,已经进入了全球开源模型 Top 1-2 的行列。

基本上,大部分评估基准已经超过或者与 DeepSeek-V3、Kimi、Qwen 等模型相当,而这些模型的总参数量通常是 MiMo-V2-Flash 的两倍到三倍。


03

性能与成本的平衡,

挑战推理不可能三角

这个图展示了全球相同水位大模型在价格和速度上的比较:横轴是推理价格(从大到小),纵轴是推理速度(从小到大)。我们能看到 MiMo 在右上角,代表了低成本、高速度。

举两个模型进行对比: 比如 DeepSeek-V3.2,MiMo-V2-Flash 比它更便宜一点,但推理速度大概是 V3.2 的三倍左右。

再比如 Gemini 2.5 Pro,虽然综合性能相当,且推理速度差不多,但 Gemini 2.5 Pro 的推理成本比 MiMo-V2-Flash 贵了整整 20 倍。

04

架构创新与 MTP 加速

那么我们是怎么做到这一切的呢?核心关键在于围绕“极致推理效率”重新设计模型结构,主要依靠两个创新。

第一个是Hybrid Attention(混合注意力)结构。我们采用了 Hybrid Sliding Window Attention(混合滑动窗口注意力)和 Full Attention(全局注意力),比例大概是 5:1。

为什么选 Sliding Window Attention?因为它看起来非常简单,只关注邻域的 128 个 Token。经过大量实验验证,我们发现一些看似复杂的 Linear Attention(线性注意力)结构,在兼顾长短文推理和知识检索的综合性能上,其实并不如简单的 Sliding Window Attention。更重要的是,它的 KV Cache 是固定的,能非常好地适配当代主流的 Infra(基础设施)推理框架。


图:全局注意力(GA)和滑动窗口注意力(SWA)的1:5混合结构

第二个是挖掘 MTP(Multi-Token Prediction,多令牌预测)的潜力。MTP 一开始被提出是用于做推理加速的,后来 DeepSeek 将其用于提升基座模型能力。我们在训练时加入了一层 MTP 层以提升基座潜能,并且在微调时加入了更多层的 MTP,用少量算力就提升了 MTP 层的接受率。

最终推理时,我们使用了三层 MTP 进行加速并行 Token 验证。在实际场景中,这种方式能做到 2.2 到 2.6 倍的推理加速。

在社区关于三层 MTP 的情况下,我们来看模型输出吞吐:在单机吞吐能做到 5,000~15,000 Tokens/秒的基础上,单请求吞吐也能做到 150~155 Tokens/秒。使用 MTP 相比不使用,整体速度提升了 2 到 3 倍。

05

训练范式革新:

MOPD 与自进化

除了关注预训练结构的高效性,我们还在思考如何扩展强化学习训练的 Compute。强化学习训练通常非常不稳定,因此我们提出了MOPD(Multi-Teacher On-Policy Distillation,多教师在线策略蒸馏)范式。


它的核心在于 On-Policy,依赖稠密的 Token Level Reward(令牌级奖励)进行监督学习。通常 Post-train 范式会通过 SFT 和 RL 拿到各领域专家模型。MOPD 则会让 Student(学生)模型基于自身概率分布 Roll out(生成)一些序列,然后用专家模型对这些序列进行打分,提供非常稠密的监督信号。

我们发现这种学习效率极高,通过简短的几十步就能将各领域专家的能力快速蒸馏到 Student 模型上。

此外,我们还有一个意外发现:当 Student 很快超越 Teacher 时,我们正在尝试将 Teacher 替换成更强的 Student,继续自我迭代提升,这是一个正在进行中的工作。

06

迈向物理世界:

从语言模拟到真实交互

MiMo-V2 已经初步具备在语言空间模拟世界的能力。比如,我们可以通过 HTML 让它写一个操作系统,很多功能都是可实现的;或者写一个 HTML 模拟太阳系;甚至做一个画圣诞树并产生交互的小 Demo。


MiMo-V2-Flash 已经在昨天发布,我们开源了所有模型权重,同步了技术报告细节,并提供了 API 供开发者接入 Web Coding IDE。我们的体验 Web 也已上线,大家可以扫描试用。

虽然现在的大模型能聊天、能写代码,但我相信大家还是不放心把身边复杂的任务交给它。我认为真正的下一代智能体系统,不应该只是一个语言模拟器,而是需要跟世界共存。

下一代智能体必须具备两个潜能: 第一,从“回答问题”变成“完成任务”。 这不仅需要记忆、推理、规划能力,更需要一个 Omni(全模态)的感知能力。做一个统一的动态系统非常必要,这是理解世界的基础。有了这个基础,模型才能无缝嵌入到像眼镜这样的智能终端,融入我们的生活流。


第二,构建物理模型。 回到开头的话题,现有大模型本质上是用算力的“暴力美学”攻克了顶层的语言和第二层的强化学习,但跳过了中间对世界的感知和模拟,以及底层的实体交互。这就是为什么大模型能做奥数、模仿莎士比亚,却不懂重力等物理法则,经常产生具身幻觉。

因此,AI 进化的下一个起点,一定要有一个可以跟真实环境交互的物理模型。我们要打造的本质上不是一个程序,而是一个具备物理一致性、时空连贯性的虚拟宇宙。

这意味着 AI 能力的本质跨越——不仅仅是看懂画面,而是理解背后的物理规律;不仅仅是处理文本,而是推演世界的运作逻辑。真正的智能绝对不是在文本里读出来的,而是在交互里“活”出来的。

>End

本文转载自“腾讯科技”,原标题《“雷军的AI秘密武器”罗福莉首秀:详解小米AGI之路》。

为分享前沿资讯及有价值的观点,太空与网络微信公众号转载此文,并经过编辑。

未按照规范转载及引用者,我们保留追究相应责任的权利

部分图片难以找到原始出处,故文中未加以标注,如若侵犯了您的权益,请第一时间联系我们。

HISTORY/往期推荐

充满激情的新时代,

充满挑战的新疆域,

与踔厉奋发的引领者,

卓尔不群的企业家,

一起开拓,

一起体验,

一起感悟,

共同打造更真品质,

共同实现更高价值,

共同见证商业航天更大的跨越!

——《太空与网络》,观察,记录,传播,引领。

·《卫星与网络》创始人:刘雨菲

·《卫星与网络》副社长:王俊峰

·微信公众号(ID:satnetdy)团队

编辑:艳玲、哈玫,周泳、邱莉、黄榕、娜娜

主笔记者:李刚、魏兴、张雪松、霍剑、乐瑜、稻子、赵栋

策划部:杨艳、若㼆、李真子

视觉总监:董泞

专业摄影:冯小京、宋伟

设计部:顾锰、潘希峎、杨小明

行政部:姜河、林紫

业务部:王锦熙、瑾怡

原创文章转载授权、转载文章侵权、投稿等事宜,请加微信:15910858067

商务合作;展览展厅设计、企业VI/CI及室内设计、企业文化建设及品牌推广;企业口碑传播及整体营销传播等,请加微信:13811260603

杂志订阅,请加微信:wangxiaoyu9960

·卫星与网络各分部:

成都分部负责人:沈淮

长沙分部负责人:宾鸿浦

西安分部负责人:郭朝晖

青岛分部负责人:江伟

·卫星与网络总部负责人:农燕

·会议活动部负责人乔颢益、许克新、董今福

· 投融资及战略层面合作:刘雨菲

·本平台签约设计公司:一画开天(北京)文化创意设计有限公司

· 航天加(深圳)股权投资基金管理负责人:杨艳

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
回顾许家印被抓捕现场,奋力反抗,怒吼不已,被抓捕人员抬出去

回顾许家印被抓捕现场,奋力反抗,怒吼不已,被抓捕人员抬出去

干史人
2026-01-08 22:47:00
CBA再现奇葩!2米19中锋下黑脚激化矛盾,裁判8分钟狂吹8次技犯

CBA再现奇葩!2米19中锋下黑脚激化矛盾,裁判8分钟狂吹8次技犯

体坛野秀才
2026-01-23 00:43:54
我国迎新一轮大范围雨雪,多地大雪、局地大暴雪!北京大部小雪

我国迎新一轮大范围雨雪,多地大雪、局地大暴雪!北京大部小雪

鲁中晨报
2026-01-23 11:35:06
永远不可能被抹杀的历史:四野部队里的那三万日籍士兵

永远不可能被抹杀的历史:四野部队里的那三万日籍士兵

深度报
2026-01-21 21:25:16
Tiktok官宣美国方案,两公司共同运营,字节保留算法知识产权

Tiktok官宣美国方案,两公司共同运营,字节保留算法知识产权

第一财经资讯
2026-01-23 08:53:35
沈从文进精神病院后,妻子从未来探望,临终前他说:“对不起”

沈从文进精神病院后,妻子从未来探望,临终前他说:“对不起”

史之铭
2026-01-23 05:29:14
炸裂!中粮集团春招公告,学历从大专起步,外语水平居然不设限…

炸裂!中粮集团春招公告,学历从大专起步,外语水平居然不设限…

火山诗话
2026-01-22 10:40:46
女子违停竖中指被撞后续!正脸曝光全网社死,司机发声,警方介入

女子违停竖中指被撞后续!正脸曝光全网社死,司机发声,警方介入

离离言几许
2026-01-22 11:52:29
1300万粉丝博主向嫣然医院捐款500万元,曾想补齐所有资金缺口,李亚鹏劝其量力而行就好

1300万粉丝博主向嫣然医院捐款500万元,曾想补齐所有资金缺口,李亚鹏劝其量力而行就好

极目新闻
2026-01-23 10:22:00
炸裂!50岁网红自称"性商教母",教狐系媚术浴室玩法,狂敛2400万

炸裂!50岁网红自称"性商教母",教狐系媚术浴室玩法,狂敛2400万

派大星纪录片
2026-01-22 14:56:51
中国没有本土狮子,却拥有2000多年的“狮文化”,怎么诞生的?

中国没有本土狮子,却拥有2000多年的“狮文化”,怎么诞生的?

收藏大视界
2026-01-22 21:38:48
套现7.49亿!无锡富豪被侄女送入狱两年半,出来把公司贱卖给国企

套现7.49亿!无锡富豪被侄女送入狱两年半,出来把公司贱卖给国企

素衣读史
2026-01-15 17:46:53
原子弹炸后百年内寸草不生,今广岛却住满了人,看看专家怎么说?

原子弹炸后百年内寸草不生,今广岛却住满了人,看看专家怎么说?

浩渺青史
2026-01-23 05:38:56
太卷了吧!又一位身材火爆的日本美女画师火出圈,亲自当本子主角

太卷了吧!又一位身材火爆的日本美女画师火出圈,亲自当本子主角

街机时代
2026-01-22 15:00:03
嫣然医院有救了?曝台湾省裕隆集团要全资资助,称对李亚鹏很敬佩

嫣然医院有救了?曝台湾省裕隆集团要全资资助,称对李亚鹏很敬佩

小徐讲八卦
2026-01-22 14:35:50
重庆警方通报“男子因摩托车加油纠纷把燃油喷洒地面”:张某因加油被拒,向地面喷洒约1升汽油,已被行拘,罚款100元,驾驶证记1分

重庆警方通报“男子因摩托车加油纠纷把燃油喷洒地面”:张某因加油被拒,向地面喷洒约1升汽油,已被行拘,罚款100元,驾驶证记1分

极目新闻
2026-01-22 19:28:40
1月23日人民币对美元中间价调升90个基点

1月23日人民币对美元中间价调升90个基点

证券时报
2026-01-23 09:35:06
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
美航母打击群抵达中东前,伊朗是安全的,但现在伊朗越来越危险

美航母打击群抵达中东前,伊朗是安全的,但现在伊朗越来越危险

止戈军是我
2026-01-22 23:01:14
冠军有戏!U23亚洲杯决赛前,中国队意外获好消息,日本媒体确认

冠军有戏!U23亚洲杯决赛前,中国队意外获好消息,日本媒体确认

侃球熊弟
2026-01-23 03:30:03
2026-01-23 15:28:49
太空与网络 incentive-icons
太空与网络
卫星应用领域全媒体平台
6302文章数 8171关注度
往期回顾 全部

科技要闻

TikTok守住了算法"灵魂" 更握紧了"钱袋子"

头条要闻

32岁猝死程序员一人干六七人的工作 上月到手薪资披露

头条要闻

32岁猝死程序员一人干六七人的工作 上月到手薪资披露

体育要闻

跑个步而已,他们在燃什么?

娱乐要闻

刘大锤曝料 将王星越的“体面”撕粉碎

财经要闻

茂名首富,这次糟了

汽车要闻

“四十不惑”的吉利 信力不信命

态度原创

房产
数码
亲子
本地
公开课

房产要闻

正式官宣!三亚又一所名校要来了!

数码要闻

仁宝总经理兼CEO:内存在PC原料成本中的占比已然翻倍

亲子要闻

上海黄浦为每所幼儿园增配儿科家庭医生和专科医生,就诊有绿色通道

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版