网易首页 > 网易号 > 正文 申请入驻

小米双模型正式开源!MiMo-V2.5-Pro无中断肝出“macOS”

0
分享至

闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

先别聊什么参数、benchmark了,来看个狠活——

米版“macOS Sequoia”桌面系统(doge)。



开机动画、用户登录、窗口管理、Dock栏缩放、Spotlight搜索、明暗显示风格、Launchpad启动台,全都有。

还自带54个原生应用,打开计算器能算账,打开日历能看日子,打开地图能查地址,打开备忘录能写东西,Grapher还能画3D函数图……拖一拖转一转,挺像那么回事。



甚至!还有个能真实冲浪的Safari浏览器,好你个“Aqqle”(狗头.jpg)。



关键这个系统是AI 4个小时全程无中断、无人类接管,就这么一直肝出来的。

没错,用的就是主打长程任务、模糊指令遵循,跻身国产Agent第一梯队的小米MiMo‑V2.5 Pro



小米最新发布的MiMo‑V2.5系列,包含Pro旗舰Agent、全模态基座、TTS语音合成、ASR语音识别四大模型,综合实力对标国际顶尖水准。



就在今天凌晨,MiMo-V2.5系列模型(包含base版)已经正式官宣开源,权重全量开放

4个月,从入场到进入开源第一梯队,小米这位“超速”选手,咱得扒一扒。

国际顶模的饭桌,它坐上去了

先看看成绩单。

首先,新一代模型在通用智能体能力、复杂软件工程与长程任务三大核心维度,相较前代MiMo-V2-Pro实现显著跃升。

国际竞技场上,在Coding Agent、SWE-Bench Pro、GDPVal-AA等多项权威基准测试中成绩逼近Claude Opus 4.6、GPT-5.4等顶尖闭源模型,甚至大幅超越Gemini 3.1 Pro。

这么看下来,MiMo‑V2.5-Pro不仅跻身国产开源第一梯队,而且已经跟Claude Opus 4.6、GPT-5.4等国际顶模坐在一张桌子上吃饭了。



要说划个重点,小米这次升级,最主要的是长周期任务和模糊指令遵循能力。

官方数据显示,它可以稳定支撑超千次工具调用的长周期任务,自主完成人类专家数天甚至数周的高难度工作。

就拿北大SysY项目来说,从零写一个完整编译器这种级别的复杂工程,MiMo‑V2.5-Pro自己吭哧吭哧就能从头肝到尾,词法分析、语法分析、中间代码生成、RISC-V后端、性能优化……全包。

4.3小时、672次工具调用,任务中间都能不崩、不跑偏、不失忆,拿到233/233的满分。



还有个事儿必须提一嘴——Token效率

在ClawEval标准Agent任务中,MiMo单轨迹只用约7万Token,就能达到64%的Pass³通过率。

而Claude Opus 4.6、Gemini 3.1 Pro、GPT-5.4,普遍在12-18万Token。

同样的能力,一样的效果,MiMo直接省了40%-60%的成本



这“Token半功倍”实打实的省钱能力,咱还真得点个赞。



不只代码强,小米模型的语音能力也齐活了。

V2.5家族里的TTS支持文本描述造音色、零样本克隆,不用上传参考音频,直接用文字描述就能生成想要的声线;


视频地址:https://mp.weixin.qq.com/s/TX5_KfchdvfWGd0iltwcdw

ASR拿到中英SOTA,粤语、川语、吴语、闽南语都能识别,连带伴奏的歌词都能精准转写。



而且,MiMo-V2.5-Pro和MiMo-V2.5都标配了1M上下文窗口,音频模型也大幅进化,从基座到TTS、ASR全栈升级,一个不落。

好好好,小米这波根本不是单点突围,这是直接端出了一整套Agent全家桶啊……

那它到底有多能跑?咱上实测!

实测,真不虚!

必须得来扒一下开头那个macOS系统的代码层,毕竟效果是真行。

整个项目由React 18+TypeScript+Zustand+Tailwind CSS以及Vite构建,68个组件撑起了54个原生应用。



XcodeApp里面塞了一个真实可浏览的网页引擎、包含完整的国际象棋逻辑的小游戏,支持3D函数绘图的Grapher等等。



窗口管理系统也不是简单的弹个框,做了一套完整的窗口状态机:拖拽、缩放、最小化、最大化、焦点切换、z-index层级管理、还复刻了macOS标志性的Traffic Lights三色灯逻辑。

4个小时,MiMo-V2.5 Pro自己把这套架构搭起来、把54个应用一个个填满、把窗口管理的状态同步理顺。

全程无中断、无人类接管,这编程能力属实是不虚,真把人类程序员给解放了。

然后,我把模型接到了龙虾里,给了一个超长提示词,让它从零开发了一个3D像素风农场模拟游戏。



什么3D场景搭建、像素风格美术、作物生长系统、天气循环、玩家交互逻辑……全都给我塞进去。

MiMo-V2.5 Pro一路肝下来,从架构到核心玩法,工程量大环节多的农场给我搞定了。



最终交出来的版本质感很足。画面里是三种不同颜色划分的农场区域,外围还点缀着像素风花草点缀氛围;

商店里能买到胡萝卜、番茄、南瓜三种作物,游戏里不仅有晴雨交替的天气变化,还做了实时更新的金币计数和像素小人的体力条。



那就开始种地吧!

进游戏第一件事,先锄地。扛着锄头走到空地上,DuangDuangDuang几下,一块耕地就出来了。

然后去商店买种子,番茄、小麦、胡萝卜……选完往兜里一揣,回到地里一颗颗种下去。

种完浇水,看着小苗苗冒头,作物成熟之后会有闪光效果,这时候就能收获了,收割完再去商店卖掉,金币叮叮当当到账了~



从场景装饰到核心玩法,一套完整闭环直接拉满,种地→浇水→收获→卖钱→再买种子→再种……好,循环起来停不下,赛博种地也太上头了!!

接下来,我用MiMo-V2.5做了一个山野风格治愈系自然漫游数字手账本。

和小游戏不一样,咱这次就给了一句大白话:

帮我做个山野风格的治愈系网站,像一本旅行手账,自然、安静、有呼吸感,那种逃离城市走进旷野的感觉。

没给配色、没给字体、没给布局、没给动效方案,啥都没给。



这类任务考验的就是模糊指令理解了,山野到底是个啥感觉?治愈系配色要怎么搭?

MiMo-V2.5的理解是:大地色系、手写感字体、墨水质感、以及柔和的动画。



于是,我就得到了一个细节拉满、内容丰富的手账。

山峦背景做视差,滚动的时候远近山层拉出纵深感,画面上还飘着小粒子。鼠标一挪,柔和光晕就跟过来了。

复选框点击还有弹跳动画,全文滚动的时候每个元素都是淡入淡出,氛围感满满。



甚至最后的手账本还有交互功能,行囊里的装备可以标记选择,这个小设计属于意外之喜了。



没告诉它具体用什么颜色、什么字体,它自己从山野这个词里读懂了我要的氛围,自行完成了交互、视觉和动效。

这种模糊指令遵循能力,最适合普通人上手,不用把提示词写成PRD(产品需求文档),大白话也能出好东西。

代码能力看完了,语音这块儿咱也得试试!

让MiMo-V2.5-TTS一个人撑起一台戏,分别生成了三种角色声音,年轻理性女生音、中年夜市老板音、吃货少年音,来场减肥辩论!


视频地址:https://mp.weixin.qq.com/s/TX5_KfchdvfWGd0iltwcdw

出来的效果嘛……各有各的味儿,毫不串戏~

最后试试ASR语音识别。

丢了一段粤语过去,转写结果基本准确,只有最后一句的“欢迎来到香港”的“来”听错了,不过无伤大雅,识别度达到99.999%。


视频地址:https://mp.weixin.qq.com/s/TX5_KfchdvfWGd0iltwcdw

只能说,小米这波语音能力补齐的姿势,属实优雅。

4个月,它拿出了真东西

效果看完了,最后咱聊聊这支团队。

小米AI团队这波节奏,确实有点超出预期,从去年年底V2系列进场,到现在V2.5冲到开源第一梯队,前后也就4个月时间。

放在行业里,正常节奏基本上是8-12个月,小米相当于直接把周期砍了一半。

快也就算了,它东西还齐,旗舰、全模态、全链路语音模型一口气全更完。

好好好,“赶工期”赶出顶尖全家桶,也是头一回见(doge) 。



当然了,咱用户虽然看中模型能力,但性价比咱也真的很在乎。

小米这次全系升级到1M上下文,但凭借着超高Token效率,计费规则反而简化了。



1M和256K采取同样的Credit倍率,Pro从4x降到2x,标准版从2x降到1x。

加上夜间再打8折(北京时间00:00~08:00)Token Plan用户Credits全量重置,这组合拳打下来,就俩字——

普惠。让普通用户和开发者都能低成本体验高阶AI能力。

这不,国外开发者马上种草了。



技术做得好,落地普及也得跟上。小米显然懂这个道理,于是在打折之外,又端出MiMo Orbit这个开发者扶持计划。

这个计划分两块:

一块是百万亿Token创造者激励计划,面向AI开发者发放100万亿Token,完全免费。全球个人开发者、团队、企业都能申请参与。

而且小米方面会认真评估每份申请,按需发放,确保Token给到真正需要的人手里。

另一块是面向全球新兴Agent框架,提供起步阶段的专项支持。

不管你的框架做到什么阶段、用户规模多大,MiMo都愿意当你的底层模型引擎。

不仅限免接入,还会搞定底层适配技术的技术支持,帮你把用户体验门槛拉低到……几乎没有门槛。

我看明白了,这是个“手牵手我们一起走,创造幸福的生活~”的大动作(期待.jpg)。



放在当下这个节点看,其实也不难理解——

国际上几家家底厚的模型已经把生态铺得很稳,开发者习惯基本固定,后来者想挤进去并不容易。国产模型想要站稳,速度、实力、诚意三样缺一不可。

小米的打法很明确:用更快的迭代抢时间,用更强的能力留用户,用真金白银降低大家的尝试成本。

算不算“弯道超车”不好说,但至少态度和动作都很干脆。

至于能不能真正站稳,虽然最后还是得开发者说了算,但就这份答卷来看,小米这支AI团队是真·All in。

下一个4个月,它会掏出什么呢?我先蹲一波~

体验地址:https://aistudio.xiaomimimo.com/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
终于懂国足为何臭了!看看这满地行李,再看看C罗。

终于懂国足为何臭了!看看这满地行李,再看看C罗。

林子说事
2026-06-22 16:27:36
太子集团“军师”日本被捕!陈志案加紧收网,跨国黑产帝国全面崩塌

太子集团“军师”日本被捕!陈志案加紧收网,跨国黑产帝国全面崩塌

新浪财经
2026-06-22 19:40:13
再次反转!135票对50票!匈牙利直接修宪,新法让欧尔班再别想选

再次反转!135票对50票!匈牙利直接修宪,新法让欧尔班再别想选

忠于法纪
2026-06-23 09:50:26
张之臻爆大冷门0-2不敌低排名选手,止步温网男单资格赛第一轮

张之臻爆大冷门0-2不敌低排名选手,止步温网男单资格赛第一轮

凌空倒钩
2026-06-23 04:31:14
“开家长会怎么办?”另类小情侣被嘲,孩子出生自带“满背”!

“开家长会怎么办?”另类小情侣被嘲,孩子出生自带“满背”!

林林先生
2026-06-21 10:10:03
儿媳卧病在床5年,公公悉心照料,一天护士发现一纸条却吓得报警

儿媳卧病在床5年,公公悉心照料,一天护士发现一纸条却吓得报警

罪案洞察者
2025-03-29 16:45:04
赵高:我不是翻案,就是想跟你们念叨几句……

赵高:我不是翻案,就是想跟你们念叨几句……

奥卡姆剃历史
2026-06-23 10:02:24
刘青山有多奢侈?开进口轿车,为吃顿饺子,派人去北京运韭菜

刘青山有多奢侈?开进口轿车,为吃顿饺子,派人去北京运韭菜

人生录
2026-06-10 19:21:18
社评:孟加拉国总理访华,少数印媒不必耿耿于怀

社评:孟加拉国总理访华,少数印媒不必耿耿于怀

环球网资讯
2026-06-23 00:51:17
以色列开战以来最惨重创!王牌36师师部被精准斩首,高级军官团灭

以色列开战以来最惨重创!王牌36师师部被精准斩首,高级军官团灭

扬子的故事屋
2026-06-22 13:52:48
今年618,手机厂商全军覆没……

今年618,手机厂商全军覆没……

黑马公社
2026-06-22 11:49:51
小叔子急需45万,男人要求妻子卖房相助,妻子:宁愿离婚,也不卖

小叔子急需45万,男人要求妻子卖房相助,妻子:宁愿离婚,也不卖

多久情感
2026-06-22 09:06:27
皇马、巴萨、马竞队长联手也赢不了,乌拉圭小组出局?

皇马、巴萨、马竞队长联手也赢不了,乌拉圭小组出局?

小潌拍客在北漂
2026-06-23 08:37:28
高市以“难保工作时间”回应丑闻质询引发舆论哗然

高市以“难保工作时间”回应丑闻质询引发舆论哗然

新华社
2026-06-22 20:01:02
西班牙边境,有多离谱?查资料时,我一度怀疑自己点错了页面

西班牙边境,有多离谱?查资料时,我一度怀疑自己点错了页面

清沐执笔
2026-06-22 17:22:11
脸都吹肿了!曼联传奇怒怼图赫尔:英格兰世界杯赢球也配吹?

脸都吹肿了!曼联传奇怒怼图赫尔:英格兰世界杯赢球也配吹?

奶盖熊本熊
2026-06-23 05:52:21
你无意中发现了不得的事?网友:大保健里遇见嫂子

你无意中发现了不得的事?网友:大保健里遇见嫂子

夜深爱杂谈
2026-05-28 07:59:33
“敢打,我就敢送!”曾放出狠话鼻子朝天的郭台铭,如今怎么样了

“敢打,我就敢送!”曾放出狠话鼻子朝天的郭台铭,如今怎么样了

秋姐居
2026-06-17 19:28:51
多名院士呼吁快停止食用,吃一口等于14斤塑料袋,女子因肾衰走了

多名院士呼吁快停止食用,吃一口等于14斤塑料袋,女子因肾衰走了

路医生健康科普
2026-06-20 17:05:07
哈特刚把300万绝杀用球揣回家,就被联盟召回!球员再也没法私藏

哈特刚把300万绝杀用球揣回家,就被联盟召回!球员再也没法私藏

奕辰说球
2026-06-22 10:55:28
2026-06-23 10:44:49
量子位 incentive-icons
量子位
追踪人工智能动态
12825文章数 176502关注度
往期回顾 全部

数码要闻

曝带摄像头的AirPods推迟至2027年底发布 售价或高于249美元

头条要闻

以色列总理、国防部长和国防军总参谋长发表联合声明

头条要闻

以色列总理、国防部长和国防军总参谋长发表联合声明

体育要闻

哈兰德国家队52场59球 世界杯狂刷6大纪录

娱乐要闻

喜剧大师曝光肖战拍戏状态!

财经要闻

智谱万亿市值,国产Anthropic真来了?

科技要闻

48名中国开发者联名举报苹果

汽车要闻

华为智驾ADS限时优惠月底结束 7月1日前下订立省3000元

态度原创

本地
时尚
数码
亲子
公开课

本地新闻

吃一次广东龙舟饭,才懂什么是豪华盛宴

今年夏天一定要拥有的6条绝美裙子,太好看了!

数码要闻

NVIDIA VR NVL4系统2026Q4上市:科学计算模拟性能是GH四倍

亲子要闻

普通家庭如何做早教?低成本也能做到高质量

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版