网易首页 > 网易号 > 正文 申请入驻

罗福莉首秀,雷军的AI新战事

0
分享至

文|光锥智能 魏琳华

从年初曝出与雷军接触、离职,到上个月官宣加入小米,再到本月出席小米"人车家全生态大会",被冠以"天才少女"名号的罗福莉,站在台前拿出了新模型MiMo-V2-Flash。

刚刚在这个领域开始起跑的小米,交出了一份看起来不错的成绩单。

作为一个参数309B、激活参数15B的"大"模型(罗福莉本人也提到,这个尺寸小到不愿意称之为大模型),在小米团队的构想中,这个模型是为了给Agent当基座来训练的。

为此,这个模型的优化更加侧重一些特定的方向,核心是高性价比、快速:

比如能够达到每秒150 tokens的生成速度、极低的成本,在保持高性价比的同时,它还保证了模型的性能。

"它的代码能力和 Agent 能力在世界级公开公正的评估榜单上,已经进入了全球开源模型 Top 1-2 的行列。"罗福莉说,"大部分评估基准已经超过或者和DeepSeek-V3、Kimi K2- Thinking、Qwen等模型相当,但它的参数是后者们的1/2-1/3。"


发布的小米模型,也面临了两极分化的口碑,有人盛赞模型代码能力领先,有人则认为这是一个"刷分"之作。

无论如何,小米需要AI。

选在12月18日的人车家全生态大会,更说明了AI之于小米的重要性。

放到智能终端,摆在小米眼前的两个任务是:第一,做轻量化模型,靠端侧部署,升级"超级小爱"和澎湃OS,把AI接入智能终端;第二,智驾方面,小米则更需要大模型做基座,靠模型给智驾能力提升空间。

做AI上,小米用行动表示,自己"动真格"了。

01 压成本、提速,小米押注Agent

从一开始,小米做AI的目标,或许早在2023年雷军的年度演讲上就提到了——"轻量化+端侧部署"。

罗福莉在演讲中直言,当下模型学习的方向与生物智能的进化方向存在背离,单纯的"大力出奇迹"已难以涌现更高阶的智能。

当Scaling Law能够带来的提升越来越少,小米选择了一条更契合自身的路:做一个参数小、性能好且够便宜的模型。

"Scaling的范式已经逐步从预训练(Pre-train)转向后训练(Post-train),"罗福莉解释道,"我们如何激发后训练的潜能?这就需要一个稳定的范式,以便在强化学习(RL)上投入更多的算力。"

为此,作为一个给Agent打底的模型,MiMo-V2-Flash的优化逻辑指向了三个关键问题:

高效沟通:强化代码能力和工具调用,这是智能体交互的基础。

加速带宽:通过极高的推理效率,解决智能体之间信息传递的瓶颈。

发力后训练:通过稳定范式,激发强化学习的潜能。


由此,小米做了个309B的大模型MiMo-V2-Flash,从指标上来看,它最突出的地方在于代码能力。

在官方给出的数据中,可以看到,在SWE-Bench Multilingual(软件工程基准测试中的多语言版本)中,该模型甚至超过了包括GPT-5在内的一众闭源大模型。

虽然在其他指标上,该模型和DeepSeek V3.2、kimi k2 Thinging等开源模型还有些许差距,但作为一个尺寸较小的模型,表现已经很亮眼。

更核心的其实是这个模型在推理速度和价格上的优化:

用Claude Sonnet 4.5作为对比指标,小米新模型的推理价格仅为其2.5%,生成速度却是其2倍。

MiMo-V2-Flash的API定价为,输入0.7元/百万tokens,输出2.1元/百万tokens。和国内模型相比,这也是一个非常具备竞争力的价格。


为了优化成本,提升推理速度,小米披露了其背后的技术架构选择——混合注意力机制。

从混合注意力机制上下手,月之暗面、MiniMax等独角兽也曾在类似方向上探索。

小米的选择是,采用了5:1的滑动窗口注意力(Sliding Window Attention, SWA)与全局注意力(Global Attention, GA)的混合结构。

官方实验表明,SWA在长文和推理能力上优于主流的线性注意力机制,且固定大小的KV Cache极易适配现有的基础设施(Infra)。

不过,对于小米来说,如果要达到在会上宣讲的效果,把模型接入到车、手机等设备中,300B还是一个不小的规模,距离端侧落地仍有距离。

最耐人寻味的,或许是罗福莉在演讲时的结语:

"AI进化的下一个起点,一定要有一个可以跟真实环境交互的物理模型,"罗福莉说道,"我们要打造的本质上不是一个程序,而是一个具备物理一致性、时空连贯性的虚拟宇宙。"

从今年小米的模型发布动态上,我们猜测,小米未来的优化将被拆解为两条线:一是死磕端侧,为智能终端加码;二是攻克物理模型,补足在智驾方面的模型能力。

02 做端侧、做智驾AI给小米全家桶打底

无论外界对参数和架构的讨论如何热烈,对小米而言,AI的价值最终必须回归到业务。

选在12月18日的人车家全生态大会发布模型,本身就说明了AI之于小米的战略意义:

在智能终端侧,通过升级"超级小爱"和澎湃OS,让它们从指令执行者变为真正的助理;在智能驾驶侧,则急需大模型作为基座,拓展智驾的上限。

回顾2025年,小米在MiMo系列上的发力呈现出一种急行军的态势,不同于两年前模型发布后的安静,今年的小米高调了起来。

4月:开源MiMo-7B系列,覆盖基础、指令微调及强化学习版。

5月:发布MiMo-VL-7B,突破多模态视觉理解。

11月:推出MiMo-Embodied具身智能大模型,整合自动驾驶与机器人技术。

12月:MiMo-V2-Flash压轴登场,主打极致效率与Agent能力。

这一连串动作的背后,是巨额的真金白银。小米集团总裁卢伟冰在财报电话会上明确表示,AI是核心研发方向。2025年,小米研发投入预计超过300亿元,其中四分之一(约75亿元)将直接砸向AI领域,并计划在未来五年投入超过2000亿元。

"在端侧,我们要追求轻量算力、低功耗和周期成本,这样才能普及端侧AI,"卢伟冰说道,"这一定是小米未来的大方向,也是小米的优势所在。"

组织层面的动作,同样印证了小米的决心:从2024年开始,小米搭建了自己的AI Infra平台,去年年底,界面新闻爆出,小米正在着手搭建自己的GPU万卡集群,将对AI大模型大力投入。据悉,其团队在成立时已有6500张GPU资源。

为了支撑这一战略,小米的人才拼图也在2025年逐步完整。

除了负责基础大模型的罗福莉,小米还挖来了陈龙服务于智驾团队。这种"双核"配置在技术路线上已经初见成效——陈龙团队提出并开源了全球首个打通自驾与具身操作的跨具身(X-Embodied)基座模型MiMo-Embodied。


这一模型试图解决自动驾驶与机器人之间的知识迁移难题,意味着小米正在尝试用一套通用的AI逻辑,去驱动其庞大的硬件生态——从手中的手机,到智能家居,再到智驾。

雷军曾提到,小米的AI战略是"轻量化+本地部署"。可以看到,小米是一定会利用在全球连接超过10亿台设备的巨大存量优势,靠AI做业务。

对于小米来说,MiMo-V2-Flash的发布不仅仅是为了在排行榜上占据一席之地。它是小米试图向资本市场和用户讲述的一个新故事:

一家硬件公司,正在通过掌握最高效的"大脑"(AI模型)和最广泛的"身体"(人车家生态),试图在智能时代完成一次彻底的进化。

至于这个故事能否讲通,不仅取决于模型做得好不好,更取决于这些技术能否真正跑通每一台小米设备,转化为用户感知得到的体验。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
全国人大代表李义虎:日本成美国在亚太“离岸平衡”支点

全国人大代表李义虎:日本成美国在亚太“离岸平衡”支点

国际在线
2026-03-07 16:46:32
她得了金庸全书最难听的名字,小时候乍一听很美,长大却不堪入耳

她得了金庸全书最难听的名字,小时候乍一听很美,长大却不堪入耳

耳东文史
2026-03-08 00:05:33
人社部、财政部发布重要消息,2026年养老金上涨定了吗?了解下

人社部、财政部发布重要消息,2026年养老金上涨定了吗?了解下

云鹏叙事
2026-03-07 23:03:02
老年人的性生活多久一次合理?要戴套吗?答案颠覆认知

老年人的性生活多久一次合理?要戴套吗?答案颠覆认知

贱议你读史
2026-03-06 23:28:50
熬了8年!高速收费终于定了,2026年起,车主上高速彻底变了

熬了8年!高速收费终于定了,2026年起,车主上高速彻底变了

奇思妙想草叶君
2026-03-06 23:23:57
以总理发言人:伊朗每天都在向以色列发射多次导弹攻击,并多次直接击中居民区,耶路撒冷等地均传出防空警报

以总理发言人:伊朗每天都在向以色列发射多次导弹攻击,并多次直接击中居民区,耶路撒冷等地均传出防空警报

观威海
2026-03-05 22:11:14
央视《我的山与海》开播!看完4集,我说:这是年代剧该有的样子

央视《我的山与海》开播!看完4集,我说:这是年代剧该有的样子

好贤观史记
2026-03-07 20:08:23
“哈梅内伊之死”可以有几种赢法?

“哈梅内伊之死”可以有几种赢法?

名人苟或
2026-03-07 06:04:59
一锤定音!高速收费改革落地,2026年车主将享更人性化减免政策

一锤定音!高速收费改革落地,2026年车主将享更人性化减免政策

蓝色海边
2026-03-07 12:00:24
李连杰当面一句“我刚换了心脏”,谢苗脸唰一下白了,气都不敢喘

李连杰当面一句“我刚换了心脏”,谢苗脸唰一下白了,气都不敢喘

西楼知趣杂谈
2026-02-28 21:36:48
潮汕婚礼丈母娘火了,打扮娇艳比新娘还抢镜,网友:感觉有点不对

潮汕婚礼丈母娘火了,打扮娇艳比新娘还抢镜,网友:感觉有点不对

梅子的小情绪
2026-02-08 19:59:04
开战第七天,最大赢家浮现,不是伊朗,不是以色列,也不是美国

开战第七天,最大赢家浮现,不是伊朗,不是以色列,也不是美国

徐徐道史
2026-03-07 15:04:03
2-1!迈阿密客场迎2连胜 38岁梅西写意搓射 距900球里程碑仅差1球

2-1!迈阿密客场迎2连胜 38岁梅西写意搓射 距900球里程碑仅差1球

我爱英超
2026-03-08 07:40:09
新欢就是出轨对象!买超又要当爸了,当年那个“小三”终于上位

新欢就是出轨对象!买超又要当爸了,当年那个“小三”终于上位

科学发掘
2026-03-07 15:26:44
香菇再次被关注!医生发现:癌症患者吃香菇,不用多久或有5改善

香菇再次被关注!医生发现:癌症患者吃香菇,不用多久或有5改善

读懂世界历史
2026-02-12 21:48:53
后续!母子睡楼道132天:数名男子轮番守房,儿子大冬天睡帐篷

后续!母子睡楼道132天:数名男子轮番守房,儿子大冬天睡帐篷

史樍
2026-03-08 00:25:25
一场3:5验出大连英博一大水货 昔日国足希望星彻底沉沦 令人叹息

一场3:5验出大连英博一大水货 昔日国足希望星彻底沉沦 令人叹息

零度眼看球
2026-03-08 07:23:02
被新帅用废?U23国足红星演砸中超首秀!0射门+0过人,13次丢球权

被新帅用废?U23国足红星演砸中超首秀!0射门+0过人,13次丢球权

我爱英超
2026-03-07 18:22:35
两个小药丸儿,一个助硬,一个延时长,在家门口的药店就能买到

两个小药丸儿,一个助硬,一个延时长,在家门口的药店就能买到

中医陈旺医生
2025-11-14 10:43:05
乌克兰检修CV90C步兵战车 炮塔弹痕触目惊心 瑞典设计经受住考验

乌克兰检修CV90C步兵战车 炮塔弹痕触目惊心 瑞典设计经受住考验

hawk26讲武堂
2026-03-07 12:02:30
2026-03-08 09:51:00
蓝鲸新闻 incentive-icons
蓝鲸新闻
财经信息服务平台
127796文章数 193699关注度
往期回顾 全部

科技要闻

OpenClaw最大的推手是闲鱼和小红书

头条要闻

媒体:伊朗问题要注意普京的动向 其在向美以喊话

头条要闻

媒体:伊朗问题要注意普京的动向 其在向美以喊话

体育要闻

塔图姆298天走完这段路 只用27分钟征服这座城

娱乐要闻

汪小菲曝亲妈猛料,张兰公开财产分配

财经要闻

油价要失控?

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

游戏
手机
数码
旅游
军事航空

成功是必然!《幻兽帕鲁》高管盛赞《杀戮尖塔2》

手机要闻

麒麟9030产能火力全开!华为Mate 80系列销量激增:已突破400万台

数码要闻

跌破3000元指日可待,苹果Macbook Neo会卖爆吗?

旅游要闻

湖州,不只有风景

军事要闻

美第三个航母打击群据称准备部署至中东

无障碍浏览 进入关怀版