网易首页 > 网易号 > 正文 申请入驻

罗福莉首秀,雷军的AI新战事

0
分享至

从年初曝出与雷军接触、离职,到上个月官宣加入小米,再到本月出席小米“人车家全生态大会”,被冠以“天才少女”名号的罗福莉,站在台前拿出了新模型MiMo-V2-Flash。

刚刚在这个领域开始起跑的小米,交出了一份看起来不错的成绩单。

作为一个参数309B、激活参数15B的“大”模型(罗福莉本人也提到,这个尺寸小到不愿意称之为大模型),在小米团队的构想中,这个模型是为了给Agent当基座来训练的。

为此,这个模型的优化更加侧重一些特定的方向,核心是高性价比、快速:

比如能够达到每秒150 tokens的生成速度、极低的成本,在保持高性价比的同时,它还保证了模型的性能。

“它的代码能力和 Agent 能力在世界级公开公正的评估榜单上,已经进入了全球开源模型 Top 1-2 的行列。”罗福莉说,“大部分评估基准已经超过或者和DeepSeek-V3、Kimi K2- Thinking、Qwen等模型相当,但它的参数是后者们的1/2-1/3。”


发布的小米模型,也面临了两极分化的口碑,有人盛赞模型代码能力领先,有人则认为这是一个“刷分”之作。

无论如何,小米需要AI。

选在12月18日的人车家全生态大会,更说明了AI之于小米的重要性。

放到智能终端,摆在小米眼前的两个任务是:第一,做轻量化模型,靠端侧部署,升级“超级小爱”和澎湃OS,把AI接入智能终端;第二,智驾方面,小米则更需要大模型做基座,靠模型给智驾能力提升空间。

做AI上,小米用行动表示,自己“动真格”了。

压成本、提速,

小米押注Agent

从一开始,小米做AI的目标,或许早在2023年雷军的年度演讲上就提到了——“轻量化+端侧部署”。

罗福莉在演讲中直言,当下模型学习的方向与生物智能的进化方向存在背离,单纯的“大力出奇迹”已难以涌现更高阶的智能。

当Scaling Law能够带来的提升越来越少,小米选择了一条更契合自身的路:做一个参数小、性能好且够便宜的模型。

“Scaling的范式已经逐步从预训练(Pre-train)转向后训练(Post-train),”罗福莉解释道,“我们如何激发后训练的潜能?这就需要一个稳定的范式,以便在强化学习(RL)上投入更多的算力。”

为此,作为一个给Agent打底的模型,MiMo-V2-Flash的优化逻辑指向了

三个关键问题:

高效沟通:强化代码能力和工具调用,这是智能体交互的基础。

加速带宽:通过极高的推理效率,解决智能体之间信息传递的瓶颈。

发力后训练:通过稳定范式,激发强化学习的潜能。


由此,小米做了个309B的大模型MiMo-V2-Flash,从指标上来看,它最突出的地方在于代码能力。

在官方给出的数据中,可以看到,在SWE-Bench Multilingual(软件工程基准测试中的多语言版本)中,该模型甚至超过了包括GPT-5在内的一众闭源大模型。

虽然在其他指标上,该模型和DeepSeek V3.2、kimi k2 Thinging等开源模型还有些许差距,但作为一个尺寸较小的模型,表现已经很亮眼。

更核心的其实是这个模型在推理速度和价格上的优化:

用Claude Sonnet 4.5作为对比指标,小米新模型的推理价格仅为其2.5%,生成速度却是其2倍。

MiMo-V2-Flash的API定价为,输入0.7元/百万tokens,输出2.1元/百万tokens。和国内模型相比,这也是一个非常具备竞争力的价格。


为了优化成本,提升推理速度,小米披露了其背后的技术架构选择——混合注意力机制。

从混合注意力机制上下手,月之暗面、MiniMax等独角兽也曾在类似方向上探索。

小米的选择是,采用了5:1的滑动窗口注意力(Sliding Window Attention, SWA)与全局注意力(Global Attention, GA)的混合结构。

官方实验表明,SWA在长文和推理能力上优于主流的线性注意力机制,且固定大小的KV Cache极易适配现有的基础设施(Infra)。

不过,对于小米来说,如果要达到在会上宣讲的效果,把模型接入到车、手机等设备中,300B还是一个不小的规模,距离端侧落地仍有距离。

最耐人寻味的,或许是罗福莉在演讲时的结语:

“AI进化的下一个起点,一定要有一个可以跟真实环境交互的物理模型,”罗福莉说道,“我们要打造的本质上不是一个程序,而是一个具备物理一致性、时空连贯性的虚拟宇宙。”

从今年小米的模型发布动态上,我们猜测,小米未来的优化将被拆解为两条线:一是死磕端侧,为智能终端加码;二是攻克物理模型,补足在智驾方面的模型能力。

做端侧、做智驾

AI给小米全家桶打底

无论外界对参数和架构的讨论如何热烈,对小米而言,AI的价值最终必须回归到业务。

选在12月18日的人车家全生态大会发布模型,本身就说明了AI之于小米的战略意义:

在智能终端侧,通过升级“超级小爱”和澎湃OS,让它们从指令执行者变为真正的助理;在智能驾驶侧,则急需大模型作为基座,拓展智驾的上限。

回顾2025年,小米在MiMo系列上的发力呈现出一种急行军的态势,不同于两年前模型发布后的安静,今年的小米高调了起来。

4月:开源MiMo-7B系列,覆盖基础、指令微调及强化学习版。

5月:发布MiMo-VL-7B,突破多模态视觉理解。

11月:推出MiMo-Embodied具身智能大模型,整合自动驾驶与机器人技术。

12月:MiMo-V2-Flash压轴登场,主打极致效率与Agent能力。

这一连串动作的背后,是巨额的真金白银。小米集团总裁卢伟冰在财报电话会上明确表示,AI是核心研发方向。2025年,小米研发投入预计超过300亿元,其中四分之一(约75亿元)将直接砸向AI领域,并计划在未来五年投入超过2000亿元。

“在端侧,我们要追求轻量算力、低功耗和周期成本,这样才能普及端侧AI,”卢伟冰说道,“这一定是小米未来的大方向,也是小米的优势所在。”

组织层面的动作,同样印证了小米的决心:从2024年开始,小米搭建了自己的AI Infra平台,去年年底,界面新闻爆出,小米正在着手搭建自己的GPU万卡集群,将对AI大模型大力投入。据悉,其团队在成立时已有6500张GPU资源。

为了支撑这一战略,小米的人才拼图也在2025年逐步完整。

除了负责基础大模型的罗福莉,小米还挖来了陈龙服务于智驾团队。这种“双核”配置在技术路线上已经初见成效——陈龙团队提出并开源了全球首个打通自驾与具身操作的跨具身(X-Embodied)基座模型MiMo-Embodied。

这一模型试图解决自动驾驶与机器人之间的知识迁移难题,意味着小米正在尝试用一套通用的AI逻辑,去驱动其庞大的硬件生态——从手中的手机,到智能家居,再到智驾。

雷军曾提到,小米的AI战略是“轻量化+本地部署”。可以看到,小米是一定会利用在全球连接超过10亿台设备的巨大存量优势,靠AI做业务。

对于小米来说,MiMo-V2-Flash的发布不仅仅是为了在排行榜上占据一席之地。它是小米试图向资本市场和用户讲述的一个新故事:

一家硬件公司,正在通过掌握最高效的“大脑”(AI模型)和最广泛的“身体”(人车家生态),试图在智能时代完成一次彻底的进化。

至于这个故事能否讲通,不仅取决于模型做得好不好,更取决于这些技术能否真正跑通每一台小米设备,转化为用户感知得到的体验。

责任编辑丨陈斌

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
毛主席睡前散步时告诉秘书高智:其实全国我只管两个人半吗?

毛主席睡前散步时告诉秘书高智:其实全国我只管两个人半吗?

舆图看世界
2026-04-04 11:20:05
立陶宛总统:中国若是还想跟立陶宛和好,必须对我们展现充分诚意

立陶宛总统:中国若是还想跟立陶宛和好,必须对我们展现充分诚意

咸鱼金脑袋
2026-04-04 14:20:11
什么暴雨不花妆,纯属营销噱头,看看玲花就知道多假!

什么暴雨不花妆,纯属营销噱头,看看玲花就知道多假!

小光侃娱乐
2026-04-04 11:50:07
击败陈幸同,申裕斌成为首位获得乒乓球世界杯奖牌的韩国女球员

击败陈幸同,申裕斌成为首位获得乒乓球世界杯奖牌的韩国女球员

懂球帝
2026-04-04 19:40:40
开拓者官方召回杨瀚森!混音晒大合影告别本赛季:小杨并不在其中

开拓者官方召回杨瀚森!混音晒大合影告别本赛季:小杨并不在其中

罗说NBA
2026-04-05 05:02:30
日本政坛突然爆雷,民众倒吸一口凉气:好多人差点死在高市手里

日本政坛突然爆雷,民众倒吸一口凉气:好多人差点死在高市手里

福建平子
2026-04-04 08:54:24
现在高价卖掉房子的将后悔?中央定调,2026年房产或开始一轮暴涨

现在高价卖掉房子的将后悔?中央定调,2026年房产或开始一轮暴涨

职场资深秘书
2026-04-04 16:14:05
伊朗大杀器参战,以色列本土告急,美军基地被炸,特朗普进退两难

伊朗大杀器参战,以色列本土告急,美军基地被炸,特朗普进退两难

史智文道
2026-04-05 11:38:02
留给美国时间不多了,伊朗战争打完后,世界就只剩一个超级大国了

留给美国时间不多了,伊朗战争打完后,世界就只剩一个超级大国了

触摸史迹
2026-04-02 14:39:03
黄晓明带9岁小海绵春日骑行,帅气发型超吸睛,父子同框满是温柔

黄晓明带9岁小海绵春日骑行,帅气发型超吸睛,父子同框满是温柔

精彩背后
2026-04-05 08:59:58
美国前官员“痛心疾首”:从未想过美国会变成一个“流氓国家”!他曾为三位美国总统提供有关伊朗问题的建议

美国前官员“痛心疾首”:从未想过美国会变成一个“流氓国家”!他曾为三位美国总统提供有关伊朗问题的建议

扬子晚报
2026-04-05 09:48:10
“给你女儿买件好内衣吧!”中学女孩锻炼视频,网友都看不下去了

“给你女儿买件好内衣吧!”中学女孩锻炼视频,网友都看不下去了

妍妍教育日记
2026-03-30 18:38:24
FBI点名3类中国App:1条权限能扒光你通讯录

FBI点名3类中国App:1条权限能扒光你通讯录

我是一个粉刷匠2
2026-04-03 22:29:41
王曼昱淘汰桥本却遭到评论区满屏嘲讽,日本女队全出局

王曼昱淘汰桥本却遭到评论区满屏嘲讽,日本女队全出局

鸟语花香的季节
2026-04-05 00:41:21
马兴全与他的深圳生意

马兴全与他的深圳生意

法经网
2025-12-15 17:52:35
萨林杰伤情更新!徐杰喊话全队,广东传3利好,下场有望双杀山东

萨林杰伤情更新!徐杰喊话全队,广东传3利好,下场有望双杀山东

后仰大风车
2026-04-05 07:10:13
娶到小时候的女神是一种怎样体验?三天没出门,后来想想不过如此

娶到小时候的女神是一种怎样体验?三天没出门,后来想想不过如此

另子维爱读史
2026-04-04 21:35:59
伊朗发起93轮猛攻,数百万人逃入地下,特朗普转变态度,必须停战

伊朗发起93轮猛攻,数百万人逃入地下,特朗普转变态度,必须停战

策略述
2026-04-04 17:11:07
张水华遭嫉妒?大众一姐不服:我自己花钱报名参赛 还得躲着她?

张水华遭嫉妒?大众一姐不服:我自己花钱报名参赛 还得躲着她?

念洲
2026-04-04 11:26:20
世界杯4月5日赛程+CCTV5直播:孙颖莎、王曼昱出战,王楚钦VS雨果

世界杯4月5日赛程+CCTV5直播:孙颖莎、王曼昱出战,王楚钦VS雨果

开成运动会
2026-04-05 09:02:03
2026-04-05 12:55:00
环球老虎财经
环球老虎财经
全球财经资讯的中文分析平台
18024文章数 56513关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

专家:美国对伊朗发动战争是本世纪最大战略失误之一

头条要闻

专家:美国对伊朗发动战争是本世纪最大战略失误之一

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

好用心!宋慧乔为好友庆生做一桌美食

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

时尚
本地
健康
亲子
游戏

女人不管多大年纪衣服不要随便穿,这些穿搭可借鉴,优雅显瘦

本地新闻

跟着歌声游安徽,听古村回响

干细胞抗衰4大误区,90%的人都中招

亲子要闻

这女孩不简单

《战争机器5》配音演员分享自己的6代剧情创意

无障碍浏览 进入关怀版