网易首页 > 网易号 > 正文 申请入驻

小米深夜正式上线三款全新自研大模型:旗舰MiMo-V2-Pro、全模态基座Omni、语音合成TTS,可限时免费体验一周

0
分享至

IT之家3 月 19 日消息,今天凌晨,小米宣布推出三款大模型 —— MiMo-V2-Pro & Omni & TTS。目前,这些模型已经登陆 Xiaomi miclaw、MiMo Studio、金山办公、小米浏览器,通过 OpenClaw、OpenCode、KiloCode、Blackbox、Cline 接入,可限时免费体验一周。


官方对各模型的介绍如下:

小米面向 Agent 时代的旗舰基座模型:Xiaomi MiMo-V2-Pro

Xiaomi MiMo-V2-Pro 专为现实世界中高强度的 Agent 工作场景而打造。其拥有超过 1T 的总参数量(42B 激活参数),采用创新的混合注意力架构,并支持 1M 超长上下文长度。小米还在更为广泛的 Agent 场景中持续 Scaling 算力,进一步拓展了智能的动作空间,实现了从 Coding 到 Claw 的重要泛化。在 Artificial Analysis 排行榜上,MiMo-V2-Pro 位列全球第八,国内第二。


在 OpenClaw、Claude Code 等智能体框架中,MiMo-V2-Pro 能够在无人工干预的条件下完成复杂工作流编排、长程规划与精准工具调用,并持续可靠地交付最终结果。整体使用体感已超越 Claude Sonnet 4.6,逼近 Opus 4.6,但模型 API 定价仅为其 1/5,降低了前沿智能的使用门槛。

MiMo-V2-Pro 专为 Agent 场景深度优化。其针对复杂多样的 Agent Scaffold 进行 SFT & RL,具备更强的工具调用与多步推理能力。在 OpenClaw 标准评测榜单 PinchBench、ClawEval 上,MiMo-V2-Pro 效果处于全球顶尖。同时,凭借 1M 上下文窗口,MiMo-V2-Pro 能够从容支撑高强度的真实 Claw 复杂应用流。


MiMo-V2-Pro 能够参与更严肃的代码工程构建。内部工程师评测显示,其体感已接近 Claude Opus 4.6,并展现出高阶的代码智能:拥有更出色的系统设计与任务规划能力、更优雅的代码风格,以及更高效直接的问题解决路径。

MiMo-V2-Pro 模型现已正式开放 API 服务,支持 1M 上下文长度,并根据使用量分段计价:

256K 上下文以内:输入 $1 / 百万 tokens,输出 $3 / 百万 tokens

1M 上下文以内:输入 $2 / 百万 tokens,输出 $6 / 百万 tokens

访问 https://platform.xiaomimimo.com,即刻接入 API。

MiMo Claw 模块现已全面打通金山 WebOffice 生态。原生支持 Word、Excel、PPT、PDF 四大主流格式,无缝覆盖超 95% 的日常文档类型。

Xiaomi MiMo 底层推理引擎与金山办公生态实现框架级集成。WPS 灵犀现已接入 MiMo-V2-Pro 模型,向灵犀 Claw 提问或布置任务,办公更高效。

小米面向 Agent 时代的全模态基座模型:Xiaomi MiMo-V2-Omni

其专为现实世界中复杂的多模态交互与执行场景而生,可无缝接入各种 Agent 框架,实现了从理解到操控的跨越,大幅降低了全模态 Agent 的落地门槛。


音频理解方面,支持从环境声分类、多说话人分离、音频-视觉联合推理,到超过 10 小时连续长音频的深度理解。综合表现超越 Gemini 3 Pro,是当前最强的音频理解基座模型之一。

图像理解方面,MiMo-V2-Omni 展现出强大的多学科视觉推理与复杂图表分析能力,超越 Claude Opus 4.6,逼近 Gemini 3 Pro 等顶尖闭源模型水平。

视频理解方面,支持原生音视频联合输入,实现真正的多模态视频理解。通过创新的视频预训练,模型具备强大的情境感知与未来推理能力。

MiMo-V2-Omni 能够跨模态理解复杂环境、自主制定并执行计划、在遇到异常时实时修正策略,最终端到端地交付完整结果。

MiMo-V2-Omni 模型现已正式开放 API 服务,支持 256K 上下文长度,输入 $0.4 / 百万 tokens,输出 $2 / 百万 tokens。

访问 https://platform.xiaomimimo.com,即刻接入 API。

此外,MiMo-V2-Omni 联合 OpenClaw、OpenCode、KiloCode、Blackbox 及 Cline 等五大 Agent 开发框架团队,为全球开发者提供为期一周的限时免费接口支持。

专为 Agent 时代的全模态交互而生:Xiaomi MiMo-V2-TTS 语音合成大模型

Xiaomi MiMo-V2-TTS 是小米自主研发的语音合成大模型。它基于自研 Audio Tokenizer 和多码本语音-文本联合建模架构,经过上亿小时语音数据的大规模预训练与多维度强化学习,实现了高度可控的多粒度语音风格控制。MiMo-V2-TTS 支持从整体风格定调到局部情绪表达的精准调节,能在同一句话内完成语气转折和情感递变;真实还原人类说话的自然韵律;在唱歌时,也能准确表达音高和节奏,自然且富有表现力。

在训练过程中,MiMo-V2-TTS 首先通过超大规模语音-文本混合预训练,在海量数据中习得了强大的跨模态对齐与理解生成的统一能力;在此基础上,通过少量高质量监督数据的微调,模型获得了可泛化的多粒度与多风格指令控制能力。

为进一步激发模型在大规模预训练中积累的高表现力语音生成潜力,小米引入了多维度强化学习,兼顾了稳定性与表现力。具体而言,MiMo-V2-TTS 在强化学习阶段,围绕更自然的韵律、更稳定的音质、更准确的字词表达、更高质量的音色克隆以及不同场景下恰当的语气和表达方式等多个维度持续优化。得益于多层码本建模架构,模型在高保真的离散 token 空间中对语音进行建模,充分保留了原始语音中的丰富信息,使强化学习阶段能够直接利用语音相关奖励信号对模型进行优化,从而让多维奖励信号更有效地作用于生成过程。

MiMo-V2-TTS 支持从整体到局部的多层次语音风格控制。用户可通过自然语言指令设定整体语音基调,同时对句内局部片段进行细粒度的情绪调节,实现同一语句中语气转折与情感递变的自然过渡。

该模型还具备丰富的多元表达能力:支持多种方言的自然发音,可进行角色扮演式的风格化演绎,更能实现高质量的歌声合成 —— 让同一个模型既能说、能演、也能唱,支持东北话、四川话、河南话、粤语、台湾腔等多种方言。

来源:IT之家、小米科技

(来源:荆楚网微信公众号)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
当年揭露“三鹿奶粉”的上海记者,4年后辞职,17年后变成这样了

当年揭露“三鹿奶粉”的上海记者,4年后辞职,17年后变成这样了

凡知
2026-07-01 10:22:40
注意!高温持续烘烤广东全省 7月初台风或将携大风暴雨突袭

注意!高温持续烘烤广东全省 7月初台风或将携大风暴雨突袭

21世纪经济报道
2026-07-01 16:11:26
“光储市值一哥”市值跌破3000亿元,早盘蒸发600亿元

“光储市值一哥”市值跌破3000亿元,早盘蒸发600亿元

第一财经资讯
2026-07-01 10:57:57
广州东站一女子疑因进站问题与车站人员起冲突砸摔对讲机,多方回应

广州东站一女子疑因进站问题与车站人员起冲突砸摔对讲机,多方回应

潇湘晨报
2026-07-01 15:35:11
问界M5买两年异味不散:门店两次测甲醛超标,厂家一测就“合格”!市监局回应:当年没抽检同批次车辆

问界M5买两年异味不散:门店两次测甲醛超标,厂家一测就“合格”!市监局回应:当年没抽检同批次车辆

中国山东网
2026-06-29 09:25:07
名记:科比死的时候、湖人悲痛!是詹姆斯团队所有人!

名记:科比死的时候、湖人悲痛!是詹姆斯团队所有人!

历史第一人梅西
2026-07-01 11:02:57
没有这种食物,你的肌肉将消失!医生:55岁后恢复肌力的8种食物

没有这种食物,你的肌肉将消失!医生:55岁后恢复肌力的8种食物

垚垚分享健康
2026-06-30 21:25:03
《百年孤独》:永远不要太操心你的孩子,也不要操心你的父母,你所有的操心基本上是白费,每个人都有自己的三生因果

《百年孤独》:永远不要太操心你的孩子,也不要操心你的父母,你所有的操心基本上是白费,每个人都有自己的三生因果

心理观察局
2026-07-01 07:27:21
堪称吃绝户!新婚一年离婚分割财产,上海男子分得女方6800多万​

堪称吃绝户!新婚一年离婚分割财产,上海男子分得女方6800多万​

火山詩话
2026-06-30 09:01:21
一女子出差3月,她养了8年的狗每晚对衣柜狂叫,丈夫忍无可忍砸开柜门,谁料,里面的东西却让他浑身发抖…

一女子出差3月,她养了8年的狗每晚对衣柜狂叫,丈夫忍无可忍砸开柜门,谁料,里面的东西却让他浑身发抖…

二胡的岁月如歌
2026-06-30 20:58:22
2026高考出现反常一幕:国防科大暴跌,另一所军校却涨了102分

2026高考出现反常一幕:国防科大暴跌,另一所军校却涨了102分

妍妍教育日记
2026-06-29 19:27:46
单局2-11惨败心态不崩!蒯曼3-1力克华裔老将,下轮大战韩国一姐

单局2-11惨败心态不崩!蒯曼3-1力克华裔老将,下轮大战韩国一姐

钉钉陌上花开
2026-07-01 10:41:57
48小时内!高市开始反击:召见中国大使后,日本又爆发一个噩耗

48小时内!高市开始反击:召见中国大使后,日本又爆发一个噩耗

羽逸地之光
2026-06-30 17:15:53
果然早有准备?詹姆斯确定离队后,湖人迅速谈成两笔补强

果然早有准备?詹姆斯确定离队后,湖人迅速谈成两笔补强

移动挡拆
2026-07-01 15:20:22
外媒:库尔图瓦等比利时老将开会自救,主教练没有参与

外媒:库尔图瓦等比利时老将开会自救,主教练没有参与

懂球帝
2026-07-01 15:49:14
洋人的恶意高薪

洋人的恶意高薪

难得君
2026-06-30 18:03:01
死亡人数破千!欧洲正式摊牌,宁可社会崩溃也不让中国办成一件事

死亡人数破千!欧洲正式摊牌,宁可社会崩溃也不让中国办成一件事

标体
2026-07-01 13:47:51
倒计时2天!男篮传来坏消息,事关赵继伟,郭士强或紧急调整名单

倒计时2天!男篮传来坏消息,事关赵继伟,郭士强或紧急调整名单

萌兰聊个球
2026-07-01 10:53:17
要不是世界杯,恐怕没人知道,中国在52万人的佛得角投入了多少

要不是世界杯,恐怕没人知道,中国在52万人的佛得角投入了多少

铭记历史呀
2026-07-01 00:45:09
蔚来、小米、理想、小鹏等,6月份各品牌交付量大盘点

蔚来、小米、理想、小鹏等,6月份各品牌交付量大盘点

科技锋说
2026-07-01 13:36:28
2026-07-01 17:07:00
极目新闻 incentive-icons
极目新闻
全球眼,中国心,瞭望者,思想家
399373文章数 953425关注度
往期回顾 全部

数码要闻

Nothing Ear(3a)真无线耳机将于7月7日发布

头条要闻

女生考驾照留下心理阴影 还被练车的"人情世故"整崩溃

头条要闻

女生考驾照留下心理阴影 还被练车的"人情世故"整崩溃

体育要闻

卖球衣救子的门将,把德国扑出了世界杯

娱乐要闻

张凌赫:我连心疼你都隔着时差

财经要闻

新氧贷款:宣传年化15%,实际顶格24%

科技要闻

Claude Code被曝“植入木马”识别中国用户

汽车要闻

交付持续攀升再破纪录 零跑6月全球交付93376台

态度原创

时尚
数码
房产
手机
公开课

Meiinpsn的穿衣风格,清新又叛逆

数码要闻

九州风神推出冰域420一体式水冷散热器,649元

房产要闻

洋房盛大交付,中海丨南海·叁號院献映世界海岸的人居答案

手机要闻

AI原子工作台加持!vivo X Fold6重塑移动生产力

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版