网易首页 > 网易号 > 正文 申请入驻

小米的大模型,就问你快不快吧

0
分享至

大家好,我是 Ai 学习的老章

最近大模型世界打破消停

  • 谷歌发布了 Gemini 3 Flash,更轻,更便宜,N 个 Benchmark 上超越 Gemini 3 Pro

  • 小米开源了 MoE 模型 MiMo-V2-Flash,号称编程能力可以与 Claude Sonnet 4.5 一较高下

我看了一下小米这个 MiMo-V2-Flash,也试用了一下,但。。。

先看官方宣传

最突出的是:极致速度


** 亮点**: ⚙️ 模型参数:总参数 309B,激活参数 15B。
️ 混合注意力:5:1 交错的 128 窗口 SWA + 全局 | 256K 上下文
⚔️ 在通用基准测试中与 DeepSeek-V3.2 相匹配,但延迟更低
SWE-Bench :73.4% | SWE-Bench 多语言:71.7% — 开源模型的新 SOTA
速度:150 输出标记/秒

资源:

模型权重:http://hf.co/XiaomiMiMo/MiMo-V2-Flash
博客文章:http://mimo.xiaomi.com/blog/mimo-v2-flash
技术报告:http://github.com/XiaomiMiMo/MiMo-V2-Flash/blob/main/paper.pdf
AI 工坊:http://aistudio.xiaomimimo.com

架构方面:

→ 使用混合注意力:滑动窗口 + 全局,比例为 5:1
→ 8 混合块(5 个滑动窗口注意力层 → 1 个全局)
→ 128 个标记滑动窗口
→ 256 位专家,每令牌 8 位活跃专家
→ 原生训练 32K, 扩展到支持 256K 上下文


从 Deepseek 离职之后加入小米的罗福莉也注册了推特,详细介绍了模型细节:


说实话我是看不懂,就是吃了一个瓜,有 Kimi 工程师锐评一波后被官方账号拉黑了,小米大模型团队格局属实有点小了


再附一个图,依然是突出:速度快、价格低


到底跑分成绩呢,N 个 Benchmark 上拳打 Kimi- K2,脚踢 DeepSeek-V3.2


体现 Code Agent 能力的 SWE-Bench Multilingual 更是遥遥领先

这个图更形象


但是我看了一些评测,总结就是:很快,但是能力一般


小米:你就说快不快吧


我也去测试了一下我经常使用测试模型阅读理解和编码能力的题目,结果如下

不如 Kimi K2 Thinking


阅读理解,没有识别出4次背影

最后是本地部署,我看了 313GB 的模型文件后直接放弃幻想了


所有推理代码现在都可在 SGLang 中找到 — 从发布之日起完全开源。

SGLang 部署模型在 H200(单节点)上的结果依然是:快得很
预填充: ~50K 令牌/秒 | TTFT < 1 秒
解码(3 层 MTP,16K 上下文):5K–15K 每秒标记 | 每请求 115–151 TPS



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
那年我接嫂子回家,路过苞米地她突然对我说:你家香火得靠你了

那年我接嫂子回家,路过苞米地她突然对我说:你家香火得靠你了

云端小院
2026-01-21 10:36:14
村干部为啥扎堆辞职?不是不想干,是真扛不住了!

村干部为啥扎堆辞职?不是不想干,是真扛不住了!

复转这些年
2026-01-21 23:12:39
老蒋曾说:亡于日本为亡国奴,亡于共产党,则为奴亦不可得

老蒋曾说:亡于日本为亡国奴,亡于共产党,则为奴亦不可得

老范谈史
2026-01-05 21:19:06
突发!曼联突袭AC米兰!前切尔西旧将回归稳了?

突发!曼联突袭AC米兰!前切尔西旧将回归稳了?

奶盖熊本熊
2026-01-22 05:49:41
14岁张某某死亡,龙安区联合工作组通报:继母李某某有重大作案嫌疑,已被控制

14岁张某某死亡,龙安区联合工作组通报:继母李某某有重大作案嫌疑,已被控制

新京报政事儿
2026-01-21 22:13:01
罗永浩所持锤子科技713万元股权被冻结

罗永浩所持锤子科技713万元股权被冻结

中新经纬
2026-01-22 10:22:03
新一轮雨雪即将抵达武汉

新一轮雨雪即将抵达武汉

鲁中晨报
2026-01-21 15:11:45
我们聊聊一个新群体——零负债人群。

我们聊聊一个新群体——零负债人群。

流苏晚晴
2026-01-16 17:57:29
田朴珺可能到最后都没想明白,王石只是老了,不是傻了。

田朴珺可能到最后都没想明白,王石只是老了,不是傻了。

随笔视频o
2026-01-21 16:19:12
贾玲巴黎周“一脸男相”!不爱笑也没梨涡眼神犀利,梳大背头好酷

贾玲巴黎周“一脸男相”!不爱笑也没梨涡眼神犀利,梳大背头好酷

轩逸阿II
2026-01-20 07:54:29
55年大授衔,国军班长出身的他自报大校,罗荣桓称你想多了

55年大授衔,国军班长出身的他自报大校,罗荣桓称你想多了

万年历史老号
2026-01-19 03:30:30
回顾许家印被抓捕现场,奋力反抗,怒吼不已,被抓捕人员抬出去

回顾许家印被抓捕现场,奋力反抗,怒吼不已,被抓捕人员抬出去

干史人
2026-01-08 22:47:00
马斯克发文送别,xAI华人联创、Grok主架构师杨格因病退出

马斯克发文送别,xAI华人联创、Grok主架构师杨格因病退出

智东西
2026-01-21 18:38:26
湖南第一庸官,好面子导致政府负债1000亿,为政绩骗刘强东100亿

湖南第一庸官,好面子导致政府负债1000亿,为政绩骗刘强东100亿

芊芊子吟
2026-01-15 10:20:03
河南拟调整分时电价

河南拟调整分时电价

大象新闻
2026-01-21 11:33:03
李湘风波再发酵!家境被扒底朝天,父母身份曝光,原来何炅没说错

李湘风波再发酵!家境被扒底朝天,父母身份曝光,原来何炅没说错

叨唠
2026-01-22 05:13:32
莲花控股向嫣然天使儿童医院捐赠52万元

莲花控股向嫣然天使儿童医院捐赠52万元

界面新闻
2026-01-22 09:21:52
我结扎10年,42岁妻子突然怀孕,我没闹,亲子鉴定结果让我懵了

我结扎10年,42岁妻子突然怀孕,我没闹,亲子鉴定结果让我懵了

一口娱乐
2026-01-22 00:08:52
欧冠积分榜:阿森纳、拜仁已提前出线,皇马、利物浦同积15分

欧冠积分榜:阿森纳、拜仁已提前出线,皇马、利物浦同积15分

懂球帝
2026-01-22 06:17:20
王菲还是太体面,一招打脸陈光标,谁是真善谁是伪善再也藏不住了

王菲还是太体面,一招打脸陈光标,谁是真善谁是伪善再也藏不住了

木子默
2026-01-21 17:29:07
2026-01-22 11:12:49
机器学习与Python社区 incentive-icons
机器学习与Python社区
机器学习算法与Python
3245文章数 11083关注度
往期回顾 全部

科技要闻

日系彩电时代“彻底落幕”

头条要闻

张建龙被查 曾回应"三北防护林挡风是否导致雾霾加重"

头条要闻

张建龙被查 曾回应"三北防护林挡风是否导致雾霾加重"

体育要闻

珍妮回应爆料:湖人不感激詹姆斯付出绝非事实

娱乐要闻

钟丽缇土耳其高空落泪 与张伦硕拥吻

财经要闻

股东资格确权存纠纷 前总裁状告申通快递

汽车要闻

今年集中上市 旅行车的春天可能真要来了

态度原创

时尚
本地
艺术
房产
数码

缔造仙女梦的人,去了天堂继续缝制星光✨

本地新闻

云游辽宁|漫步千年小城晨昏,“康”复好心情

艺术要闻

一场雪,飘进了唐诗

房产要闻

那个砸下400亿的绿地,又要杀回海南了!

数码要闻

“最强游戏处理器”AMD锐龙7 9850X3D开启国行预售

无障碍浏览 进入关怀版