今天,小米正式发布了自家的开源大模型:MiMo-V2-Flash。
![]()
从官方透露的信息来看,该模型是一个总参数达到309B的MoE模型,活跃参数达到了15B。它能够以每秒150 Token的速度实现快速推理,更是能够将成本控制在每百万token输入0.1美元/输出0.3美元,使用成本极低。
![]()
而MiMo的性能同样不俗,在多数基准测试中其性能都达到了K2 Thinking和DeepSeek V3.2 Thinking级别,
专项测试中,MiMo在AIME 2025 数学竞赛和 GPQA-Diamond 科学知识测试中都拿下了开源大模型前二的好成绩。特别是编程能力,其SWE-bench Verified得分达到73.4%,领先于所有开源大模型,得分直逼GPT-5-High。
![]()
能有这样的成绩,是因为小米才用了“多教师在线策略蒸馏 (MOPD)”技术,也就是在训练中,模拟学生做题和教师批改的过程,在解题时分为多个节点,随时进行批改,这就大大提高了效率,不用得到最终结果才去判断。
因此,MOPD能够使用更少的资源,达到更高效、准确的大模型。
![]()
小米已经向公众开启了MiMo开放平台,可自由查看开发文档,也为开发者提供了API接口。目前,MiMo-V2-Flash能与Claude Code、Cursor、Cline等主流开发环境无缝配合,256k的超长上下文窗口支持数百轮智能体交互与工具调用,而且,目前API都可免费使用,不用额外付费。
![]()
那么,对于普通用户呢?我们也可以使用它的在线AI聊天服务,只需打开官网即可免费使用(https://aistudio.xiaomimimo.com),支持深度思考和联网搜索功能,与我们熟知的DeepSeek等AI工具类似,上手没有任何门槛。
![]()
据我实测,MiMo在基本的陪聊方面,很快速、友善地回答用户提问,这点完全没有问题。另外,在编程方面也有着非常不错的表现,能够快速输出结果。
![]()
另外,MiMo已经能够理解用户需求并帮助用户完成一些基础工作。只是,目前暂时无法输出图片和音频、视频,但是在文本理解和表达方面,已经很强了。
MiMo也大方地承认:“我目前还不能直接输出图片、音频、视频。我的核心能力集中在文本理解和生成上,专注于提供准确的对话和信息处理”。如果有相关需求,MiMo能够输出相关的脚本、分镜、创意等辅助用户自行完成。
如今的MiMo还是一个“新生儿”,希望未来的它,会越来越完善吧!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.