网易首页 > 网易号 > 正文 申请入驻

AI写代码竟比大学生快?小米新模型,四小时搞定数周课业!

0
分享至

智东西4月23日报道,刚刚,小米MiMo大模型一口气官宣4款新模型:旗舰推理模型MiMo-V2.5、全模态Agent模型V2.5-Pro开启公测、即将开源;V2.5-TTS Series、V2.5-ASR即将推出。



与上一代模型类似,MiMo-V2.5全系列同样是为智能体场景打造,MiMo-V2.5-Pro专为长难Agent任务打造,MiMo-V2.5可覆盖绝大多数通用Agent场景。

小米还贴心为用户提供了官方使用指南:MiMo-V2.5支持原生全模态Agent能力,涵盖图像、音频与视频,相比Pro版模型平均推理速度更快,更适应对时延敏感的任务。



除性能外,此次小米MiMo新模型还有一大升级点是更高的Token效率。根据官方信息,在拿到智能体基准榜单ClawEval相同分数的情况下:

MiMo-V2.5-Pro相比Kimi本周发布的开源旗舰多模态智能体模型Kimi K2.6节省了42% Token;MiMo-V2.5相比Meta本月初发布的闭源多模态推理模型Muse Spark节省了50% Token。



智东西体验了MiMo-V2.5-Pro,让其“制作一个3D横版格斗游戏”,MiMo-V2.5-Pro在几分钟内、写了1123行代码,就生成了“龙虎格斗游戏”。该游戏界面的血条、双方角色名、倒计时、对战提示清晰,还包含命中火花、格挡碎片、镜头震动+命中停顿等反馈系统,具备一定可玩性,但人物角色造型简单,除颜色和帽子几乎没差异。



龙虎格斗游戏界面

有意思的是,今年3月,小米MiMo-V2-Pro曾以匿名模型Hunter Alpha的身份现身OpenRouter平台,一度被开发者误认为是即将发布的DeepSeek V4。如今小米新一代MiMo-V2.5推出,又正值DeepSeek V4被传出将于本周发布。

Xiaomi MiMo开放平台:

Xiaomi MiMo Studio体验地址:

小米官方称,MiMo-V2.5-Pro是小米MiMo迄今最强大模型,在通用智能体能力、复杂软件工程以及长程任务等维度上,能与Claude Opus 4.6、GPT-5.4等全球顶尖Agent模型相当,相较上一代模型MiMo-V2-Pro提升。



基于小米MiMo团队开发的评估套件MiMo Coding Bench,MiMo-V2.5-Pro与Claude Opus 4.6的差距进一步缩小,得分分别为73.7分和77.1分,MiMo-V2-Pro是71.5分。



有推特网友用此前的网红问题实测了MiMo-V2.5-Pro,其问题是“我想去洗车,洗车店离我50米远,我应该走着去还是开车去”,MiMo-V2.5-Pro不负众望,给出了正确答案。



小米MiMo放出了几个MiMo-V2.5-Pro的实操案例。

首先是“用Rust实现完整的SysY编译器”。这一任务的难点在于,模型需独立完成词法分析器、语法分析器、AST、Koopa IR代码生成、RISC-V汇编后端,以及性能优化。

在实际操作中,该模型采用逐层搭建整个编译器的方式,其先搭完整流水线骨架再逐层攻克。在各项的具体分数中,模型在Koopa IR、RISC-V后端、性能优化上都拿到了满分,首次编译实现了59%的冷启动通过率,这意味着在跑任何测试之前,架构是对的。在第512轮,该模型一次重构令lv9/riscv回退了两个测试点;模型自行诊断、恢复、继续推进。

这一任务是北京大学《编译原理》课程项目,北大本科生通常需要数周时间才能完成,MiMo-V2.5-Pro用时4.3小时、经过672次工具调用完成,在隐藏测试集上取得满分233分。





第三个案例是模拟电路EDA任务,其需求是“基于台积电180nm CMOS工艺,从零开始设计并优化一款完整的翻转电压跟随器低压差线性稳压器(FVF-LDO)”。

完成任务期间,该模型需要确定功率晶体管尺寸、调整补偿网络并选择合适偏置电压,以使相位裕度、线路调整率、负载调整率、静态电流、电源抑制比和瞬态响应六个指标同时符合规格。

经验丰富的模拟电路设计师通常需要花费数天时间才能完成此类项目。研究人员将MiMo-V2.5-Pro连接到ngspice仿真循环中,并使用Claude Code作为仿真框架,经过大约一个小时的闭环迭代,其就生成了一个满足所有目标指标的设计,并且下面显示的四个指标比其初始版本提高了一个数量级:



MiMo-V2.5是专为智能体场景打造的原生全模态模型,能通过同时看、听、读,并根据感知到的信息采取行动。

该模型此次有两个关键升级点:Agent能力全面超越MiMo-V2-Pro、多模态感知全面超越MiMo-V2-Omni,MiMo-V2-Pro是小米MiMo系列上一代旗舰基座大模型、MiMo-V2-Omni是上一代全模态Agent模型。

其中,在面向AI智能体的端到端可信评测基准Claw-Eval中,MiMo-V2.5表现超过MiMo-V2-Pro,同时API成本降低约50%;在关于跨模态推理、视频理解、图表分析等的基准测试VideoMME、CharXiv、MMMU-Pro等评测中,MiMo-V2.5表现逼近甚至超越了Claude Opus 4.6、Gemini 3 Pro、GPT-5.4等闭源模型。



在编程方面,小米内部的MiMo编程基准测试显示,MiMo-V2.5在日常编程任务中超越了Gemini 3.1 Pro,与Claude Opus 4.6仍有明显差距。



伴随MiMo-V2.5系列发布,小米还同步优化了其订阅式API调用套餐MiMo Token Plan,该计划允许用户使用MiMo系列8款模型,分别是旗舰推理模型MiMo-V2-Pro、MiMo-V2.5-Pro,全能多模态模型MiMo-V2-Omni、MiMo-V2.5,语音合成模型MiMo-V2-TTS、MiMo-V2.5-TTS、MiMo-V2.5-TTS-VoiceClone、MiMo-V2.5-TTS-VoiceDesign,后三个模型待发布。

新模型的Credits计费方式为:

MiMo-V2.5:1x(消耗1 Token=1 Credit)

MiMo-V2.5-Pro:2x(消耗1 Token=2 Credits)

作为对比,MiMo Token Plan刚发布时的计费方式为:



此外,MiMo Token Plan还会提供夜间专属优惠速率,每天00:00~08:00,所有模型Credits消耗速率在原有基础上再打8折。

在付费模式上,其此前预告的连续包月、包年订阅也已上线。连续包月中,老用户开通自动续费享次月7折,新用户享次月77折,包年订阅中,一次订阅享全年88折,包年至高可减948.96元。



截至北京时间4月22日22:00前,所有已购买Token Plan用户Credits额度将全部重置清零,但不重置套餐计时。



小米MiMo V2.5系列的升级围绕着智能体场景性能提升及更高Token效率两大关键,其在保障长链推理、工具调用、多任务协同等核心智能体性能的同时,大幅提升Token使用效率,降低算力与推理成本,或证明轻量化模型既能实现媲美超大模型的智能体表现,又能兼顾实用与普惠。

此次,小米MiMo旗舰模型再升级,也意味着其作为终端硬件厂商,正将自研底层大模型、系统级权限、全生态服务进行深度绑定与融合,打造真正意义上的系统级原生智能体,加速其人车家全场景AI的规模化落地。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为什么女朋友觉得年入百万是很简单的事呢?网友:认知不够

为什么女朋友觉得年入百万是很简单的事呢?网友:认知不够

霹雳炮
2026-04-27 22:11:24
醪糟再次被关注!医生发现:高血脂患者喝醪糟,不用多久4大变化

醪糟再次被关注!医生发现:高血脂患者喝醪糟,不用多久4大变化

芹姐说生活
2026-04-19 15:52:53
一个波斯青年立志让美国人都变成穆斯林,没想到---

一个波斯青年立志让美国人都变成穆斯林,没想到---

通往远方的路
2026-04-30 13:02:24
宋希濂晚年透露:如果蒋介石同意将30万人撤到缅甸,后果不堪设想

宋希濂晚年透露:如果蒋介石同意将30万人撤到缅甸,后果不堪设想

鹤羽说个事
2026-04-29 22:29:51
溥仪这气质哪像傀儡?抛开立场,那时的溥仪骨子里依然是傲慢的!

溥仪这气质哪像傀儡?抛开立场,那时的溥仪骨子里依然是傲慢的!

史之铭
2026-04-28 22:35:50
李湘瘦脱相了,这腰身哪像当妈的,直接跟王诗龄站成了姐妹花。

李湘瘦脱相了,这腰身哪像当妈的,直接跟王诗龄站成了姐妹花。

科学发掘
2026-04-28 08:59:52
火湖对决会进入抢七大战吗?杜兰特复出或帮助湖人晋级西部半决赛

火湖对决会进入抢七大战吗?杜兰特复出或帮助湖人晋级西部半决赛

姜大叔侃球
2026-04-30 13:32:41
马筱梅变了,直播回应自己情绪,说出玥箖现状,称应该和婆婆学习

马筱梅变了,直播回应自己情绪,说出玥箖现状,称应该和婆婆学习

刘森森
2026-04-30 11:32:33
央视主持人大换血!四人淘汰三人晋级、董卿接班人位置毋庸置疑

央视主持人大换血!四人淘汰三人晋级、董卿接班人位置毋庸置疑

观察鉴娱
2026-04-30 10:48:46
公开晒结婚证!赵露思:我会一直一直保护你的幸福

公开晒结婚证!赵露思:我会一直一直保护你的幸福

黔乡小姊妹
2026-04-28 08:16:52
今天,又一车企宣布涨价!

今天,又一车企宣布涨价!

电动知家
2026-04-30 13:26:28
耻辱2-3!湖人连败,里夫斯16中4,詹姆斯创纪录,火箭要改写历史

耻辱2-3!湖人连败,里夫斯16中4,詹姆斯创纪录,火箭要改写历史

老侃侃球
2026-04-30 12:56:37
王思聪是真颓了?被拍到在洛杉矶,整个人都“垮了”

王思聪是真颓了?被拍到在洛杉矶,整个人都“垮了”

西楼知趣杂谈
2026-04-28 22:09:13
视频丨特朗普称乌克兰在军事上已被击败

视频丨特朗普称乌克兰在军事上已被击败

环球网资讯
2026-04-30 07:15:27
以色列明白大势已去,最好的办法就是“献祭”内塔尼亚胡?

以色列明白大势已去,最好的办法就是“献祭”内塔尼亚胡?

聊历史的阿稼
2026-04-30 09:55:38
员工在厕所玩手机,照片被发到400多人的大群......

员工在厕所玩手机,照片被发到400多人的大群......

环球时报国际
2026-04-29 21:19:36
湖南一男子连续自驾5小时后突然头晕呕吐、说话含糊不清,送医后诊断为急性脑梗死,专家:假期别“特种兵”式出游

湖南一男子连续自驾5小时后突然头晕呕吐、说话含糊不清,送医后诊断为急性脑梗死,专家:假期别“特种兵”式出游

台州交通广播
2026-04-30 13:47:21
辛纳击败19岁天才获封新一代纪录收割机,德约一逆天纪录危险了?

辛纳击败19岁天才获封新一代纪录收割机,德约一逆天纪录危险了?

网球之家
2026-04-30 09:25:09
第三方 iPhone 17 Pro Max 出现罕见大降价

第三方 iPhone 17 Pro Max 出现罕见大降价

XCiOS俱乐部
2026-04-30 08:34:38
居然还有中国人定居朝鲜?这里面藏着太多不为人知的辛酸!

居然还有中国人定居朝鲜?这里面藏着太多不为人知的辛酸!

天下霸奇
2026-04-30 07:59:22
2026-04-30 14:16:49
補懂事的孩紙
補懂事的孩紙
珍惜现在:活在当下的智慧
561文章数 200关注度
往期回顾 全部

科技要闻

四巨头财报齐发:AI已经不只是风口

头条要闻

"上海最通透爸爸"去世 女儿:他退休20多年这辈子不亏

头条要闻

"上海最通透爸爸"去世 女儿:他退休20多年这辈子不亏

体育要闻

骑士天王山:哈登、莫布里和……施罗德?

娱乐要闻

孙杨妈妈被曝!过往言行被扒大开眼界

财经要闻

安世之乱,闻泰帝国近黄昏?

汽车要闻

上汽一季报出炉 在低增长周期里守住基本盘

态度原创

房产
家居
艺术
游戏
军事航空

房产要闻

熬了6年,涨了2亿,三亚核心区这块地再次上架

家居要闻

灵动实用 生活艺术场

艺术要闻

安东·爱德华·基尔德鲁普:19世纪丹麦风景画家

国产大作与质量独占压阵!九月PS5游戏阵容炸裂

军事要闻

意大利议会批准:捐赠航母给印度尼西亚

无障碍浏览 进入关怀版