网易首页 > 网易号 > 正文 申请入驻

小米突然发布新模型:媲美 DeepSeek-V3.2,把手机的性价比卷到 AI

0
分享至

开源模型再次迎来一位重磅选手,就在刚刚,小米正式发布并开源新模型 MiMo-V2-Flash。

MiMo-V2-Flash 总参数3090亿,活跃参数150亿,采用专家混合架构 (MoE),性能还能和 DeepSeek-V3.2、Kimi-K2这些头部开源模型掰 掰 手腕。


此外,MiMo-V2-Flash 采用 MIT 开源协议,基础版权重也已经在 Hugging Face 上发布。


当然,除去「开源」这一标签,新模型真正的杀手锏在于架构设计上的激进创新,把推理速度拉到了150 tokens/秒,成本压到了每百万 token 输入0.1美元、输出0.3美元,主打一个超绝性价比。


此外 ,根据官方体验页面信息,MiMo-V2-Flash 还支持深度思考和联网搜索功能, 既能对话聊天,也能在需要实时数据、最新动态或资料核对的场景里派上用场。


附上 AI Studio 体验地址:

http://aistudio.xiaomimimo.com

开源模型新标杆, MiMo-V2-Flash 跑分全线开花

先来看看 MiMo-V2-Flash 的跑分。

基准测试成绩显示,AIME 2025数学竞赛和 GPQA-Diamond 科学知识测试中,MiMo-V2-Flash 都排在开源模型前两名。

编程能力更是亮眼,SWE-bench Verified 得分73.4%,超越所有开源模型,直逼 GPT-5-High。而这个测试是让 AI 去修真实世界的软件 bug,73.4% 的成功率也意味着它能搞定大部分实际编程问题。


在多语言编程基准测试 SWE-Bench Multilingual 里,MiMo-V2-Flash 的解决率为71.7%。

转看智能体任务,MiMo-V2-Flash 在τ²-Bench 分类得分中,通信类95.3分,零售类79.5分,航空类66.0分,BrowseComp 搜索代理得分45.4,启用上下文管理后直接飙到58.3。


这些数据说明,MiMo-V2-Flash 不仅会写代码,还能真正理解复杂任务逻辑,执行多轮智能体交互。

更重要的是,写作质量也接近顶级闭源模型,这意味着 MiMo-V2-Flash 不只是个工具,还能当个靠谱的日常助手。

MiMo-V2-Flash 在保持长文本性能的同时,还降低了成本,究其原因,离不开两项核心技术创新。

混合滑动窗口注意力机制:传统大模型处理长文本时,全局注意力机制会导致计算量二次爆炸,存储中间结果的 KV 缓存也跟着飙升。

小米这次采用了5比1的激进比例,5层滑动窗口注意力搭配1层全局注意力交替使用,滑动窗口只看128个 token。

这种设计让 KV 缓存存储量直接减少了近6倍,但长文本能力却没打折扣,最长支持256k 上下文窗口。


且模型即使在这么激进的窗口设置下,照样能稳住长文本性能。

对此, 罗福莉在社交平台上特别指出一个反直觉的发现:窗口大小128是「最佳甜点值」。实验证明,盲目扩大窗口(如增至512)反而会导致性能下降。同时她强调,在实施该机制时,sink values 是维持性能的关键,绝不可省略。


另一个黑科技是轻量级多 Token 预测 (MTP)。

传统模型生成文本时一次只能吐一个 token,就像打字员一个字一个字敲。MiMo-V2-Flash 通过原生集成的 MTP 模块,能并行预测多个 token,一次性猜出接下来好几个 token。

实测平均能接受2.8到3.6个 token,推理速度直接提升2到2.6倍,不仅在推理时管用,训练阶段也能加速采样,减少 GPU 空转,属于一箭双雕。


罗福莉提到,在三层 MTP 设置下,他们观察到平均接受长度超过3,编码任务速度提升约2.5倍。它有效解决了小批量 On-Policy 强化学习中「长尾样本」带来的 GPU 空闲时间浪费问题。

啥叫长尾样本?就是那些特别难、特别慢的任务,拖着其他任务一起等,GPU 就在那干瞪眼。MTP 把这个问题给解了,极大提高了效率。

不过罗福莉也坦诚,这次因为时间紧迫没能把 MTP 完整集成进 RL 训练循环,但它与该流程高度契合。小米已经把三层 MTP 开源了,方便大家在自己的项目中使用与开发。

算力只用1/50,性能如何不打折?

预训练阶段,新模型使用 FP8混合精度,在27万亿 token 数据上完成训练,原生支持32k 序列长度。

FP8混合精度是一种压缩数值表示的技术,能在保持精度的同时减少显存占用和加速训练。这种训练方式在业界并不常见,需要对底层框架进行深度优化。

而在后训练阶段,小米整了个大活,提出了多教师在线策略蒸馏 (MOPD)。

传统的监督微调加强化学习管线,不仅训练不稳定,算力消耗还贼高。MOPD 的思路是让学生模型在自己的策略分布上采样,然后由多个专家教师在每个 token 位置提供密集的奖励信号。

通俗点说就是,学生模型自己写作业,老师在每个字上都给评分,不用等写完整篇才打分。这样一来,学生模型能快速从教师那里学到精髓,而且训练过程稳定得多。

最夸张的是效率提升,MOPD 只需要传统方法1/50的算力,就能让学生模型达到教师性能峰值。这意味着小米能用更少的资源,更快地迭代模型。

而且 MOPD 支持灵活接入新教师,学生模型成长后还能反过来当教师,形成「教与学」的闭环自我进化。今天的学生,明天的老师,后天又能教出更强的学生,套娃玩法属实有点东西。

用罗福莉的话来说,他们借鉴 Thinking Machine 的 On-Policy Distillation 方法,将多个强化学习模型进行融合,结果带来了惊人的效率提升。这为构建一个自我强化循环系统奠定了基础,学生模型可以逐步进化,最终成为更强的教师模型。


在智能体强化学习扩展上,小米 MiMo-V2-Flash 研究团队基于真实 GitHub issue 构建了超过10万个可验证任务,自动化流水线跑在 Kubernetes 集群上,并发能开10000多个 Pod,环境部署成功率70%。

针对网页开发任务,还专门搞了个多模态验证器,通过录制视频而非静态截图来验证代码执行结果,直接减少视觉幻觉,确保功能正确。

对于开发者而言,MiMo-V2-Flash 能与 Claude Code、Cursor、Cline 等主流开发环境无缝配合,256k 的超长上下文窗口支持数百轮智能体交互与工具调用。

256k 是什么概念? 大概相当于一本中等篇幅的小说,或者几十页技术文档。这意味着开发者可以把 MiMo-V2-Flash 直接融入现有工作流,不需要额外适配,拿来就用。

小米还把所有推理代码贡献给了 SGLang,并在 LMSYS 博客分享了推理优化经验。

技术报告公开了完整模型细节,模型权重 (包括 MiMo-V2-Flash-Base) 在 Hugging Face 上以 MIT 许可协议发布。这种全面开源的态度,在国内大厂里属实少见。

目前 MiMo-V2-Flash 已经在 API Platform 限时免费开放,开发者可以直接上手体验。


小米的 AI 野心,不止于手机助手

MiMo-V2-Flash 的发布,标志着小米在 AI 赛道上的全面发力。

罗福莉在社交平台上透露了更多信息,「MiMo-V2-Flash 已正式上线。这只是我们 AGI 路线图上的第二步。」第二步就已经这么猛了,那后面还有啥大招?想想就有点期待。

当然,小米在技术报告中也坦诚,MiMo-V2-Flash 与最强的闭源模型相比仍有差距。但他们的计划很明确,通过扩大模型规模与训练算力来缩小差距,同时继续探索更稳健、更高效的智能体架构。


MOPD 框架下教师模型与学生模型的迭代共进化,也为未来的能力提升留足了空间。

把视角拉高来看,背后是小米对整个 AI 生态的一次战略押注。手机、IoT、汽车,小米的硬件生态需要一个强大的 AI 底座,MiMo-V2-Flash 显然就是小米为全硬件生态准备的那块基石。

就像十四年前小米手机用1999元重新定义了旗舰机的价格标准,如今 MiMo-V2-Flash 正在用白菜价的成本、73.4% 的 SWE-Bench 得分,重新定义开源大模型的性能标准。

这一次,属于开源模型的「小米时刻」真的来了。

HuggingFace 模型地址:
http://hf.co/XiaomiMiMo/MiMo-V2-Flash
技术报道地址:
http://github.com/XiaomiMiMo/MiMo-V2-Flash/blob/main/paper.pdf

欢迎加入 APPSO AI 社群,一起畅聊 AI 产品,获取,解锁更多 AI 新知

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
夫妻“夜夜笙歌”不是梦!掌握这些“技巧”,让妻子“爽”翻天!

夫妻“夜夜笙歌”不是梦!掌握这些“技巧”,让妻子“爽”翻天!

精彩分享快乐
2026-01-23 06:40:03
突传噩耗!香港知名女星宣布父亲离世,每天全身疼痛死亡或是解脱

突传噩耗!香港知名女星宣布父亲离世,每天全身疼痛死亡或是解脱

兴史兴谈
2026-01-22 08:26:17
演员马晓峰患癌后遗症说话不清,老友王一楠姚安濂家宴探望

演员马晓峰患癌后遗症说话不清,老友王一楠姚安濂家宴探望

孤酒老巷QA
2026-01-21 13:52:02
回国了我才敢说:委内瑞拉,是我去过的所有国家中,最被看轻的!

回国了我才敢说:委内瑞拉,是我去过的所有国家中,最被看轻的!

阿纂看事
2026-01-09 09:48:35
中国在联合国48小时内两度否决日本,朝鲜表态,日回应

中国在联合国48小时内两度否决日本,朝鲜表态,日回应

米老鼠的世界
2026-01-23 05:41:18
深圳“满级小孩哥”一口气拉20个引体向上 老师拦都拦不住

深圳“满级小孩哥”一口气拉20个引体向上 老师拦都拦不住

南方都市报
2026-01-22 23:42:27
瓦林卡鏖战四个半小时挺进第三轮!德约距离全新纪录仅一步之遥

瓦林卡鏖战四个半小时挺进第三轮!德约距离全新纪录仅一步之遥

网球之家
2026-01-22 22:17:20
西红柿立大功!医生研究发现:老人吃西红柿,或能缓解4种症状

西红柿立大功!医生研究发现:老人吃西红柿,或能缓解4种症状

医学原创故事会
2026-01-21 21:50:30
国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

像梦一场a
2026-01-21 20:10:16
广州扩容猜想:这几个地方最可能被圈中,谁将成最大赢家?

广州扩容猜想:这几个地方最可能被圈中,谁将成最大赢家?

椰青美食分享
2026-01-23 00:32:43
今天挤破头要考上的编制,十年后可能会变成你人生最难爬出的坑。

今天挤破头要考上的编制,十年后可能会变成你人生最难爬出的坑。

流苏晚晴
2026-01-22 18:28:28
酒色人间,才是生命鲜活的来头

酒色人间,才是生命鲜活的来头

青苹果sht
2026-01-16 05:36:37
审批通过!他要来山东开演唱会了

审批通过!他要来山东开演唱会了

济宁人
2026-01-22 00:08:53
秦岚这张早期照片真的绝了,美到我心巴上啦

秦岚这张早期照片真的绝了,美到我心巴上啦

喜欢历史的阿繁
2026-01-20 07:58:48
前湖人后卫以赛亚·托马斯批评里奇·保罗,关于里夫斯交易的言论

前湖人后卫以赛亚·托马斯批评里奇·保罗,关于里夫斯交易的言论

好火子
2026-01-23 04:04:18
10亿身家换不来10分钟!刚签大单就突然猝死,他的悲剧戳中多少人

10亿身家换不来10分钟!刚签大单就突然猝死,他的悲剧戳中多少人

叮当当科技
2026-01-21 00:02:16
北京朝阳区卫健委已介入嫣然天使儿童医院欠租纠纷,房东代理律师:考虑向法院申请将网友捐款偿还房租

北京朝阳区卫健委已介入嫣然天使儿童医院欠租纠纷,房东代理律师:考虑向法院申请将网友捐款偿还房租

新民晚报
2026-01-22 14:38:49
“中产阶级”及格线诞生!全国只有3320万户,你达标了吗?

“中产阶级”及格线诞生!全国只有3320万户,你达标了吗?

李云飞Afey
2026-01-01 12:52:31
中纪委明确饭局红线:公职人员,这5类饭局别碰

中纪委明确饭局红线:公职人员,这5类饭局别碰

娱乐督察中
2026-01-16 16:25:33
贝克汉姆亲家的继承之战!10个子女17亿家产,妮可拉分不到多少钱

贝克汉姆亲家的继承之战!10个子女17亿家产,妮可拉分不到多少钱

有范又有料
2026-01-21 17:53:26
2026-01-23 07:19:00
AppSo incentive-icons
AppSo
让智能手机更好用的秘密
6030文章数 26745关注度
往期回顾 全部

科技要闻

几千亿只是开胃菜,AI基建还得再砸几万亿

头条要闻

特朗普起诉美国最大银行 索赔至少50亿美元

头条要闻

特朗普起诉美国最大银行 索赔至少50亿美元

体育要闻

跑个步而已,他们在燃什么?

娱乐要闻

车银优赚800亿 涉嫌逃税200亿!

财经要闻

西贝拿到“救命钱”,然后呢

汽车要闻

配备多块娱乐屏 极氪8X内饰曝光

态度原创

本地
房产
家居
教育
公开课

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

房产要闻

开年王炸!四重政策红利加码,广州置业窗口期迈入倒计时!

家居要闻

法式风情 南洋中古居

教育要闻

上海警校招生3大条件!身高视力不过关必看

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版