网易首页 > 网易号 > 正文 申请入驻

罗福莉首秀,雷军的AI新战事

0
分享至


文|魏琳华 ,编辑|王一粟

从年初曝出与雷军接触、离职,到上个月官宣加入小米,再到本月出席小米“人车家全生态大会”,被冠以“天才少女”名号的罗福莉,站在台前拿出了新模型MiMo-V2-Flash。

刚刚在这个领域开始起跑的小米,交出了一份看起来不错的成绩单。

作为一个参数309B、激活参数15B的“大”模型(罗福莉本人也提到,这个尺寸小到不愿意称之为大模型),在小米团队的构想中,这个模型是为了给Agent当基座来训练的。

为此,这个模型的优化更加侧重一些特定的方向,核心是高性价比、快速:

比如能够达到每秒150 tokens的生成速度、极低的成本,在保持高性价比的同时,它还保证了模型的性能。

“它的代码能力和 Agent 能力在世界级公开公正的评估榜单上,已经进入了全球开源模型 Top 1-2 的行列。”罗福莉说,“大部分评估基准已经超过或者和DeepSeek-V3、Kimi K2- Thinking、Qwen等模型相当,但它的参数是后者们的1/2-1/3。”


发布的小米模型,也面临了两极分化的口碑,有人盛赞模型代码能力领先,有人则认为这是一个“刷分”之作。

无论如何,小米需要AI。

选在12月18日的人车家全生态大会,更说明了AI之于小米的重要性。

放到智能终端,摆在小米眼前的两个任务是:第一,做轻量化模型,靠端侧部署,升级“超级小爱”和澎湃OS,把AI接入智能终端;第二,智驾方面,小米则更需要大模型做基座,靠模型给智驾能力提升空间。

做AI上,小米用行动表示,自己“动真格”了。

压成本、提速,小米押注Agent

从一开始,小米做AI的目标,或许早在2023年雷军的年度演讲上就提到了——“轻量化+端侧部署”。

罗福莉在演讲中直言,当下模型学习的方向与生物智能的进化方向存在背离,单纯的“大力出奇迹”已难以涌现更高阶的智能。

当Scaling Law能够带来的提升越来越少,小米选择了一条更契合自身的路:做一个参数小、性能好且够便宜的模型。

“Scaling的范式已经逐步从预训练(Pre-train)转向后训练(Post-train),”罗福莉解释道,“我们如何激发后训练的潜能?这就需要一个稳定的范式,以便在强化学习(RL)上投入更多的算力。”

为此,作为一个给Agent打底的模型,MiMo-V2-Flash的优化逻辑指向了三个关键问题

高效沟通:强化代码能力和工具调用,这是智能体交互的基础。

加速带宽:通过极高的推理效率,解决智能体之间信息传递的瓶颈。

发力后训练:通过稳定范式,激发强化学习的潜能。


由此,小米做了个309B的大模型MiMo-V2-Flash,从指标上来看,它最突出的地方在于代码能力。

在官方给出的数据中,可以看到,在SWE-Bench Multilingual(软件工程基准测试中的多语言版本)中,该模型甚至超过了包括GPT-5在内的一众闭源大模型。

虽然在其他指标上,该模型和DeepSeek V3.2、kimi k2 Thinging等开源模型还有些许差距,但作为一个尺寸较小的模型,表现已经很亮眼。

更核心的其实是这个模型在推理速度和价格上的优化:

用Claude Sonnet 4.5作为对比指标,小米新模型的推理价格仅为其2.5%,生成速度却是其2倍。

MiMo-V2-Flash的API定价为,输入0.7元/百万tokens,输出2.1元/百万tokens。和国内模型相比,这也是一个非常具备竞争力的价格。


为了优化成本,提升推理速度,小米披露了其背后的技术架构选择——混合注意力机制。

从混合注意力机制上下手,月之暗面、MiniMax等独角兽也曾在类似方向上探索。

小米的选择是,采用了5:1的滑动窗口注意力(Sliding Window Attention, SWA)与全局注意力(Global Attention, GA)的混合结构。

官方实验表明,SWA在长文和推理能力上优于主流的线性注意力机制,且固定大小的KV Cache极易适配现有的基础设施(Infra)。

不过,对于小米来说,如果要达到在会上宣讲的效果,把模型接入到车、手机等设备中,300B还是一个不小的规模,距离端侧落地仍有距离。

最耐人寻味的,或许是罗福莉在演讲时的结语:

“AI进化的下一个起点,一定要有一个可以跟真实环境交互的物理模型,”罗福莉说道,“我们要打造的本质上不是一个程序,而是一个具备物理一致性、时空连贯性的虚拟宇宙。”

从今年小米的模型发布动态上,我们猜测,小米未来的优化将被拆解为两条线:一是死磕端侧,为智能终端加码;二是攻克物理模型,补足在智驾方面的模型能力。

做端侧、做智驾,AI给小米全家桶打底

无论外界对参数和架构的讨论如何热烈,对小米而言,AI的价值最终必须回归到业务。

选在12月18日的人车家全生态大会发布模型,本身就说明了AI之于小米的战略意义:

在智能终端侧,通过升级“超级小爱”和澎湃OS,让它们从指令执行者变为真正的助理;在智能驾驶侧,则急需大模型作为基座,拓展智驾的上限。

回顾2025年,小米在MiMo系列上的发力呈现出一种急行军的态势,不同于两年前模型发布后的安静,今年的小米高调了起来。

4月:开源MiMo-7B系列,覆盖基础、指令微调及强化学习版。

5月:发布MiMo-VL-7B,突破多模态视觉理解。

11月:推出MiMo-Embodied具身智能大模型,整合自动驾驶与机器人技术。

12月:MiMo-V2-Flash压轴登场,主打极致效率与Agent能力。

这一连串动作的背后,是巨额的真金白银。小米集团总裁卢伟冰在财报电话会上明确表示,AI是核心研发方向。2025年,小米研发投入预计超过300亿元,其中四分之一(约75亿元)将直接砸向AI领域,并计划在未来五年投入超过2000亿元。

“在端侧,我们要追求轻量算力、低功耗和周期成本,这样才能普及端侧AI,”卢伟冰说道,“这一定是小米未来的大方向,也是小米的优势所在。”

组织层面的动作,同样印证了小米的决心:从2024年开始,小米搭建了自己的AI Infra平台,去年年底,界面新闻爆出,小米正在着手搭建自己的GPU万卡集群,将对AI大模型大力投入。据悉,其团队在成立时已有6500张GPU资源。

为了支撑这一战略,小米的人才拼图也在2025年逐步完整。

除了负责基础大模型的罗福莉,小米还挖来了陈龙服务于智驾团队。这种“双核”配置在技术路线上已经初见成效——陈龙团队提出并开源了全球首个打通自驾与具身操作的跨具身(X-Embodied)基座模型MiMo-Embodied。


这一模型试图解决自动驾驶与机器人之间的知识迁移难题,意味着小米正在尝试用一套通用的AI逻辑,去驱动其庞大的硬件生态——从手中的手机,到智能家居,再到智驾。

雷军曾提到,小米的AI战略是“轻量化+本地部署”。可以看到,小米是一定会利用在全球连接超过10亿台设备的巨大存量优势,靠AI做业务。

对于小米来说,MiMo-V2-Flash的发布不仅仅是为了在排行榜上占据一席之地。它是小米试图向资本市场和用户讲述的一个新故事:

一家硬件公司,正在通过掌握最高效的“大脑”(AI模型)和最广泛的“身体”(人车家生态),试图在智能时代完成一次彻底的进化。

至于这个故事能否讲通,不仅取决于模型做得好不好,更取决于这些技术能否真正跑通每一台小米设备,转化为用户感知得到的体验。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
苹果2026年首款新机官宣:1 月 28 日,正式首发上市

苹果2026年首款新机官宣:1 月 28 日,正式首发上市

科技堡垒
2026-01-20 12:29:44
断崖式下跌!中国人突然不爱喝酒了?真相太扎心!

断崖式下跌!中国人突然不爱喝酒了?真相太扎心!

达文西看世界
2026-01-18 20:56:11
新年首罚!这家第三方支付公司又又又收到千万罚单

新年首罚!这家第三方支付公司又又又收到千万罚单

观察者网
2026-01-21 12:00:12
湖人逆转掘金!东契奇轰38分,斯玛特统治关键球,詹姆斯带队起势

湖人逆转掘金!东契奇轰38分,斯玛特统治关键球,詹姆斯带队起势

篮球资讯达人
2026-01-21 13:37:43
新型三毒,正在让很多年轻人一夜返贫。

新型三毒,正在让很多年轻人一夜返贫。

爱吃糖的猫cat
2026-01-20 13:59:24
连克世界第3第6,赵心童7连胜进决赛!四强中国3席,冠军仍是外协

连克世界第3第6,赵心童7连胜进决赛!四强中国3席,冠军仍是外协

求球不落谛
2026-01-21 06:29:18
【独家】连线刚从伊朗回国的中国学者:过去十几天,伊朗到底发生了什么?

【独家】连线刚从伊朗回国的中国学者:过去十几天,伊朗到底发生了什么?

环球网资讯
2026-01-20 07:03:07
越南少将大实话:当年中国撤军为啥不追?不是不想,是一份绝密命令让人不得不服

越南少将大实话:当年中国撤军为啥不追?不是不想,是一份绝密命令让人不得不服

老杉说历史
2026-01-14 20:31:37
工信部:将扩大“二次号码焕新”覆盖范围

工信部:将扩大“二次号码焕新”覆盖范围

IT之家
2026-01-21 11:21:11
韩媒:中国队疯了,他们的表现比韩国队还好

韩媒:中国队疯了,他们的表现比韩国队还好

懂球帝
2026-01-21 02:19:12
贾玲巴黎周“一脸男相”!不爱笑也没梨涡眼神犀利,梳大背头好酷

贾玲巴黎周“一脸男相”!不爱笑也没梨涡眼神犀利,梳大背头好酷

轩逸阿II
2026-01-20 07:54:29
硬钢篮协?武汉女篮官方:放弃球员上调国家队后外援4节8人次政策

硬钢篮协?武汉女篮官方:放弃球员上调国家队后外援4节8人次政策

懂球帝
2026-01-21 13:06:06
晚年有没有福,看生日尾数就知道?有这5个数字的,注定享清福

晚年有没有福,看生日尾数就知道?有这5个数字的,注定享清福

牛锅巴小钒
2026-01-21 11:19:44
一个微信存储清理工具,为何被腾讯跨国发函“追杀”?

一个微信存储清理工具,为何被腾讯跨国发函“追杀”?

观察者网
2026-01-20 20:24:22
董赤赤拳击赛后首次更新并发言:自己塌的房,就要自己盖起来

董赤赤拳击赛后首次更新并发言:自己塌的房,就要自己盖起来

草莓解说体育
2026-01-21 00:29:51
火箭遭重创!亚当斯脚踝三级扭伤将无限期缺阵 可能会赛季报销

火箭遭重创!亚当斯脚踝三级扭伤将无限期缺阵 可能会赛季报销

罗说NBA
2026-01-21 08:07:51
中央气象台:寒潮天气对我国影响已接近尾声,低温状态还将持续一段时间

中央气象台:寒潮天气对我国影响已接近尾声,低温状态还将持续一段时间

界面新闻
2026-01-21 08:56:05
惊人的两倍电力鸿沟,让所有制裁成了笑话

惊人的两倍电力鸿沟,让所有制裁成了笑话

李荣茂
2026-01-20 08:45:13
中美GDP差距再次缩小!25年中国GDP达20万亿美元,占美国GDP的64%

中美GDP差距再次缩小!25年中国GDP达20万亿美元,占美国GDP的64%

凡知
2026-01-21 11:19:44
曾不顾恩师反对,常昊执意娶大8岁师姑为妻,后来两人过得怎样?

曾不顾恩师反对,常昊执意娶大8岁师姑为妻,后来两人过得怎样?

秋姐居
2026-01-19 22:01:43
2026-01-21 14:59:00
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
129211文章数 861682关注度
往期回顾 全部

科技要闻

中芯国际等巨头集体提价,8英寸芯片最高涨20%

头条要闻

男子到民营医院看男科7天花1.7万 公立医院称无需手术

头条要闻

男子到民营医院看男科7天花1.7万 公立医院称无需手术

体育要闻

只会防守反击?不好意思,我们要踢决赛了

娱乐要闻

李亚鹏2天获1291万网友力挺

财经要闻

消失的投资金 起底华文映像电影投资骗局

汽车要闻

新一代理想L9电池加码体型加大 重夺高端话语权

态度原创

房产
教育
手机
旅游
数码

房产要闻

那个砸下400亿的绿地,又要杀回海南了!

教育要闻

山东2026高考人数过百万!15万复读生!

手机要闻

荣耀Magic8/Pro通信性能综合排名第一!中国电信认证 5G、GNSS全面领先

旅游要闻

威海上演现实版“冰河世纪” 葡萄滩冰凌景观蔚为壮观 惊艳游客

数码要闻

苹果Fitness+登陆日本 支持AI日语配音与多设备联动

无障碍浏览 进入关怀版