网易首页 > 网易号 > 正文 申请入驻

罗福莉首秀,雷军的AI新战事

0
分享至

从年初曝出与雷军接触、离职,到上个月官宣加入小米,再到本月出席小米“人车家全生态大会”,被冠以“天才少女”名号的罗福莉,站在台前拿出了新模型MiMo-V2-Flash。

刚刚在这个领域开始起跑的小米,交出了一份看起来不错的成绩单。

作为一个参数309B、激活参数15B的“大”模型(罗福莉本人也提到,这个尺寸小到不愿意称之为大模型),在小米团队的构想中,这个模型是为了给Agent当基座来训练的。

为此,这个模型的优化更加侧重一些特定的方向,核心是高性价比、快速:

比如能够达到每秒150 tokens的生成速度、极低的成本,在保持高性价比的同时,它还保证了模型的性能。

“它的代码能力和 Agent 能力在世界级公开公正的评估榜单上,已经进入了全球开源模型 Top 1-2 的行列。”罗福莉说,“大部分评估基准已经超过或者和DeepSeek-V3、Kimi K2- Thinking、Qwen等模型相当,但它的参数是后者们的1/2-1/3。”


发布的小米模型,也面临了两极分化的口碑,有人盛赞模型代码能力领先,有人则认为这是一个“刷分”之作。

无论如何,小米需要AI。

选在12月18日的人车家全生态大会,更说明了AI之于小米的重要性。

放到智能终端,摆在小米眼前的两个任务是:第一,做轻量化模型,靠端侧部署,升级“超级小爱”和澎湃OS,把AI接入智能终端;第二,智驾方面,小米则更需要大模型做基座,靠模型给智驾能力提升空间。

做AI上,小米用行动表示,自己“动真格”了。

压成本、提速,

小米押注Agent

从一开始,小米做AI的目标,或许早在2023年雷军的年度演讲上就提到了——“轻量化+端侧部署”。

罗福莉在演讲中直言,当下模型学习的方向与生物智能的进化方向存在背离,单纯的“大力出奇迹”已难以涌现更高阶的智能。

当Scaling Law能够带来的提升越来越少,小米选择了一条更契合自身的路:做一个参数小、性能好且够便宜的模型。

“Scaling的范式已经逐步从预训练(Pre-train)转向后训练(Post-train),”罗福莉解释道,“我们如何激发后训练的潜能?这就需要一个稳定的范式,以便在强化学习(RL)上投入更多的算力。”

为此,作为一个给Agent打底的模型,MiMo-V2-Flash的优化逻辑指向了

三个关键问题:

高效沟通:强化代码能力和工具调用,这是智能体交互的基础。

加速带宽:通过极高的推理效率,解决智能体之间信息传递的瓶颈。

发力后训练:通过稳定范式,激发强化学习的潜能。


由此,小米做了个309B的大模型MiMo-V2-Flash,从指标上来看,它最突出的地方在于代码能力。

在官方给出的数据中,可以看到,在SWE-Bench Multilingual(软件工程基准测试中的多语言版本)中,该模型甚至超过了包括GPT-5在内的一众闭源大模型。

虽然在其他指标上,该模型和DeepSeek V3.2、kimi k2 Thinging等开源模型还有些许差距,但作为一个尺寸较小的模型,表现已经很亮眼。

更核心的其实是这个模型在推理速度和价格上的优化:

用Claude Sonnet 4.5作为对比指标,小米新模型的推理价格仅为其2.5%,生成速度却是其2倍。

MiMo-V2-Flash的API定价为,输入0.7元/百万tokens,输出2.1元/百万tokens。和国内模型相比,这也是一个非常具备竞争力的价格。


为了优化成本,提升推理速度,小米披露了其背后的技术架构选择——混合注意力机制。

从混合注意力机制上下手,月之暗面、MiniMax等独角兽也曾在类似方向上探索。

小米的选择是,采用了5:1的滑动窗口注意力(Sliding Window Attention, SWA)与全局注意力(Global Attention, GA)的混合结构。

官方实验表明,SWA在长文和推理能力上优于主流的线性注意力机制,且固定大小的KV Cache极易适配现有的基础设施(Infra)。

不过,对于小米来说,如果要达到在会上宣讲的效果,把模型接入到车、手机等设备中,300B还是一个不小的规模,距离端侧落地仍有距离。

最耐人寻味的,或许是罗福莉在演讲时的结语:

“AI进化的下一个起点,一定要有一个可以跟真实环境交互的物理模型,”罗福莉说道,“我们要打造的本质上不是一个程序,而是一个具备物理一致性、时空连贯性的虚拟宇宙。”

从今年小米的模型发布动态上,我们猜测,小米未来的优化将被拆解为两条线:一是死磕端侧,为智能终端加码;二是攻克物理模型,补足在智驾方面的模型能力。

做端侧、做智驾

AI给小米全家桶打底

无论外界对参数和架构的讨论如何热烈,对小米而言,AI的价值最终必须回归到业务。

选在12月18日的人车家全生态大会发布模型,本身就说明了AI之于小米的战略意义:

在智能终端侧,通过升级“超级小爱”和澎湃OS,让它们从指令执行者变为真正的助理;在智能驾驶侧,则急需大模型作为基座,拓展智驾的上限。

回顾2025年,小米在MiMo系列上的发力呈现出一种急行军的态势,不同于两年前模型发布后的安静,今年的小米高调了起来。

4月:开源MiMo-7B系列,覆盖基础、指令微调及强化学习版。

5月:发布MiMo-VL-7B,突破多模态视觉理解。

11月:推出MiMo-Embodied具身智能大模型,整合自动驾驶与机器人技术。

12月:MiMo-V2-Flash压轴登场,主打极致效率与Agent能力。

这一连串动作的背后,是巨额的真金白银。小米集团总裁卢伟冰在财报电话会上明确表示,AI是核心研发方向。2025年,小米研发投入预计超过300亿元,其中四分之一(约75亿元)将直接砸向AI领域,并计划在未来五年投入超过2000亿元。

“在端侧,我们要追求轻量算力、低功耗和周期成本,这样才能普及端侧AI,”卢伟冰说道,“这一定是小米未来的大方向,也是小米的优势所在。”

组织层面的动作,同样印证了小米的决心:从2024年开始,小米搭建了自己的AI Infra平台,去年年底,界面新闻爆出,小米正在着手搭建自己的GPU万卡集群,将对AI大模型大力投入。据悉,其团队在成立时已有6500张GPU资源。

为了支撑这一战略,小米的人才拼图也在2025年逐步完整。

除了负责基础大模型的罗福莉,小米还挖来了陈龙服务于智驾团队。这种“双核”配置在技术路线上已经初见成效——陈龙团队提出并开源了全球首个打通自驾与具身操作的跨具身(X-Embodied)基座模型MiMo-Embodied。

这一模型试图解决自动驾驶与机器人之间的知识迁移难题,意味着小米正在尝试用一套通用的AI逻辑,去驱动其庞大的硬件生态——从手中的手机,到智能家居,再到智驾。

雷军曾提到,小米的AI战略是“轻量化+本地部署”。可以看到,小米是一定会利用在全球连接超过10亿台设备的巨大存量优势,靠AI做业务。

对于小米来说,MiMo-V2-Flash的发布不仅仅是为了在排行榜上占据一席之地。它是小米试图向资本市场和用户讲述的一个新故事:

一家硬件公司,正在通过掌握最高效的“大脑”(AI模型)和最广泛的“身体”(人车家生态),试图在智能时代完成一次彻底的进化。

至于这个故事能否讲通,不仅取决于模型做得好不好,更取决于这些技术能否真正跑通每一台小米设备,转化为用户感知得到的体验。

责任编辑丨陈斌

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
港警严阵以待!新义安创办人之子出殡,江湖大佬都来了...

港警严阵以待!新义安创办人之子出殡,江湖大佬都来了...

港港地
2026-01-20 10:42:45
短信曝光后马克龙翻脸!特朗普的“和平委员会”:本质私人俱乐部

短信曝光后马克龙翻脸!特朗普的“和平委员会”:本质私人俱乐部

鹰眼Defence
2026-01-21 18:03:07
A股浮现3大重磅信号!目前“慢牛”还是太“牛”!还需要沉淀

A股浮现3大重磅信号!目前“慢牛”还是太“牛”!还需要沉淀

观察员老陈
2026-01-21 23:13:20
急眼了?目睹球队0-3不敌中国U23后,一越南球迷赛后怒砸电视机

急眼了?目睹球队0-3不敌中国U23后,一越南球迷赛后怒砸电视机

懂球帝
2026-01-21 12:46:06
张小斐的身材线条也太优越了吧,紧致又匀称,这状态看了真羡慕

张小斐的身材线条也太优越了吧,紧致又匀称,这状态看了真羡慕

TVB的四小花
2026-01-20 13:55:23
-12℃!北京本周还有降雪!

-12℃!北京本周还有降雪!

美丽大北京
2026-01-21 17:27:45
不打了!丁俊晖再次弃赛原因曝光,出勤率比奥沙利文还低球迷不解

不打了!丁俊晖再次弃赛原因曝光,出勤率比奥沙利文还低球迷不解

曹说体育
2026-01-21 15:33:19
娱乐圈又丢人!嫣然医院捐款名单曝光,年入上亿明星“集体沉默”

娱乐圈又丢人!嫣然医院捐款名单曝光,年入上亿明星“集体沉默”

完善法
2026-01-21 13:05:04
目睹80岁父亲临终的经历后,我才明白:有些病不治才是最大的孝顺

目睹80岁父亲临终的经历后,我才明白:有些病不治才是最大的孝顺

小马达情感故事
2025-12-14 18:55:03
499隔衣服摸胸!私人影院暗藏涉黄:299元起步撕丝袜,还有更过火

499隔衣服摸胸!私人影院暗藏涉黄:299元起步撕丝袜,还有更过火

鋭娱之乐
2025-12-22 14:10:46
美国多地爆发抗议

美国多地爆发抗议

每日经济新闻
2026-01-21 11:38:56
萨巴伦卡坦言白卓璇让她在场上感到紧张:打她很棘手

萨巴伦卡坦言白卓璇让她在场上感到紧张:打她很棘手

网球之家
2026-01-21 22:21:20
办公室诱惑:一种不合作的修辞

办公室诱惑:一种不合作的修辞

疾跑的小蜗牛
2026-01-21 22:03:38
俄柬菲免签了,明星们却扎堆北海道

俄柬菲免签了,明星们却扎堆北海道

生活时尚导刊
2026-01-19 22:00:12
李亚鹏做梦也没想到,心中这口恶气竟让向太给出了,窦靖童没说谎

李亚鹏做梦也没想到,心中这口恶气竟让向太给出了,窦靖童没说谎

墨印斋
2026-01-18 21:54:20
“国家队”2000亿资金逃离!是“换仓”还是“撤退”?

“国家队”2000亿资金逃离!是“换仓”还是“撤退”?

界面新闻
2026-01-21 17:21:58
1月21日俄乌:乌克兰 “每月毙敌5万” 的新目标

1月21日俄乌:乌克兰 “每月毙敌5万” 的新目标

山河路口
2026-01-21 18:08:06
历史性突破!U23国足首进亚洲杯决赛

历史性突破!U23国足首进亚洲杯决赛

财联社
2026-01-21 01:28:20
王征同志逝世

王征同志逝世

政知新媒体
2026-01-20 10:18:42
江敦涛,被罢免

江敦涛,被罢免

新京报政事儿
2026-01-21 09:13:31
2026-01-22 00:51:00
环球老虎财经
环球老虎财经
全球财经资讯的中文分析平台
17617文章数 56481关注度
往期回顾 全部

科技要闻

给机器人做仿真训练 这家创企年营收破亿

头条要闻

西安高校创始人两女儿争继承权 判完才发现公证书造假

头条要闻

西安高校创始人两女儿争继承权 判完才发现公证书造假

体育要闻

只会防守反击?不好意思,我们要踢决赛了

娱乐要闻

首位捐款的明星 苗圃现身嫣然医院捐款

财经要闻

丹麦打响第一枪 欧洲用资本保卫格陵兰岛

汽车要闻

2026款上汽大众朗逸正式上市 售价12.09万起

态度原创

本地
游戏
房产
手机
艺术

本地新闻

云游辽宁|漫步千年小城晨昏,“康”复好心情

《FF7RE》N2版M站均分90分:无一差评质量夯爆了

房产要闻

那个砸下400亿的绿地,又要杀回海南了!

手机要闻

iPhone越贵越好卖!iPhone18没有单打孔

艺术要闻

你绝对想不到,他的油画美得如此惊人!

无障碍浏览 进入关怀版