来源:市场资讯
(来源:燧原科技Enflame)
![]()
2026年4月28日,小米正式发布 MiMo-V2.5-Pro 系列模型,并于同日正式开源。燧原科技已同步完成对 MiMo-V2.5-Pro的 Day-0 极速适配,成为首批实现适配的国产算力厂商之一。
MiMo-V2.5-Pro是小米迄今最强大的模型,可支撑1T超大参数量、以及1M 超长上下文的高吞吐推理。在通用智能体能力、复杂软件工程以及长程任务等维度上,它已能与全球顶尖 Agent 模型(Claude Opus 4.6、GPT-5.4 等 )正面较量,相较上一代 MiMo-V2-Pro 实现了全方位跃升。此外,该模型在 Agent 场景下的指令遵循能力也明显提升——既能精准捕捉上下文中的隐性要求,又能在超长周期内保持逻辑一致。适用于大型项目编程、数据分析等企业级应用场景,也适用于接入OpenClaw、Hermes Agent、Claude Code 等 Agent 框架。
![]()
与顶级闭源模型的性能比较
在实际适配过程中,燧原科技依托自研软硬件架构,持续提升算子覆盖与生态兼容能力,实现模型性能与算力效率的高效匹配。通过底层算子优化与软硬件协同加速,MiMo-V2.5-Pro已在燧原L600的平台上实现高吞吐、低延迟的稳定运行,并在复杂任务与长序列场景下保持优异表现。
硬件支撑
燧原L600拥有超大显存、超高带宽,原生支持FP8精度,通过单机八卡全互联的OGX形态可支撑 MiMo-V2.5-Pro 的1T超大参数量、以及1M 超长上下文的高吞吐推理。
软件优化
基于驭算TopsRider软件栈,兼容 vLLM / PyTorch / SGLang 等主流 AI 框架。借助SGLang 推理框架定制化调度策略,结合 Triton 算子重构与融合,以及PD分离架构的核心优化,有效缩短前沿大模型迁移适配周期,实现模型性能的大幅提升,兼顾低延迟、高吞吐与低显存占用的需求,适配不同场景的部署需求。
此次燧原科技对 Xiaomi MiMo-V2.5-Pro实现Day‑0适配,标志着双方在 “国产算力 + 国产大模型” 深度协同的道路上迈出关键一步,进一步夯实国产化 AI 算力底座,以自主研发的软硬一体化能力,助力国产大模型高效落地,为国产 AI规模化应用提供强劲支撑,共同推动全球 AI 生态的开放融合与繁荣发展。
开发者可访问以下链接体验:
MiMo 开放平台:
platform.xiaomimimo.com
燧原科技开发者社区:
https://ai.gitee.com/compute/enflame
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.