网易首页 > 网易号 > 正文 申请入驻

罗福莉小米首秀直击核心!定调下一代模型方向

0
分享至



2025年小米人车家全生态合作伙伴大会上,一个名字和一款模型同时引爆AI圈。被传“雷军花千万年薪挖来”的AI大牛罗福莉,首次以小米MiMo大模型负责人的身份公开亮相,带来了小米新一代自研大语言模型MiMo-V2-Flash——不仅性能对标顶尖开源模型,还以“3090亿总参数+150亿活跃参数”的MoE架构实现极致效率,更关键的是,它刚发布就全线开源。



在大模型赛道还在比拼“参数越大越厉害”的当下,小米反其道而行之,用“跑得快、跑得久、被高频调用也跑得起”的设计理念,给行业浇了一盆清醒剂。这款模型背后,既有罗福莉团队的技术取舍,更藏着小米对AGI(通用人工智能)的独特思考:智能不是“读”出来的,而是“活”出来的。

一、幕后推手:从顶会学霸到小米AI掌舵人

要理解MiMo-V2-Flash的创新逻辑,先得认识它的“操盘手”罗福莉。这位北大计算机硕士出身的技术大牛,学生时代就创下“一次性在国际顶会ACL中标8篇论文”的纪录,其中2篇以第一作者身份发表,一度冲上知乎热搜,成为AI圈公认的“潜力股”。



毕业后,罗福莉先后加盟阿里巴巴达摩院、DeepSeek母公司幻方量化,在幻方期间深度参与了DeepSeek-V2等爆款模型的研发,积累了从基础研究到工程落地的全链条经验。2025年11月,她正式官宣加入小米,这次大会是她入职后的首次公开演讲。



尽管略显紧张,但罗福莉条理清晰地传递了核心观点:“大模型解码了人类思维的文本投影,却没真正理解物理世界”。正是这种清醒的认知,让MiMo-V2-Flash跳出了“参数竞赛”的怪圈,走上了“实用主义”的道路。

二、技术拆解:为什么它能“又快又便宜”?

普通人可能看不懂“3090亿总参数”“150亿活跃参数”的差距,但只要记住一个核心:MiMo-V2-Flash用更小的“运行成本”,实现了和顶尖模型相当的性能。这背后是两大关键技术的支撑:

1.MoE架构:只“点亮”需要的部分

MiMo-V2-Flash采用了当下最先进但工程难度极高的MoE(混合专家)架构。简单说,这个模型就像一个“专家团队”,总共有3090亿个“专家”(参数),但处理任务时,只需要150亿个“相关专家”上阵,其他专家可以“休息”。

这种设计的好处显而易见:既保留了大模型的综合能力,又大大降低了推理时的算力消耗。打个比方,这就像请了一支全能乐队,但演出时只需要根据歌曲风格,安排对应的乐手上场,既保证了演出质量,又节省了场地和设备成本。

2.MTP技术:让输出速度“翻倍”

如果说MoE架构解决了“轻量化”问题,那么MTP(多词元预测)技术就解决了“速度”问题。罗福莉团队在预训练和微调阶段都加入了MTP层,推理时更是采用三层MTP并行推理,让模型输出速度直接提升2-2.6倍。



根据社区测试数据,MiMo-V2-Flash在单机环境下,每秒能处理5000-15000个token(相当于2-7.5万字),单请求输出速度也能达到150token/s(约75字/秒)。对比来看,它的推理速度是DeepSeek-V3.2的3倍左右,而成本却更低;和综合能力相近的Gemini2.5Pro相比,成本直接低了20倍。

除此之外,小米还创新了HybridAttention(混合注意力)结构和MOPD(多教师在线蒸馏)范式,前者兼顾了长短文本处理能力和推理效率,后者则让模型在强化学习阶段快速吸收多个“专家模型”的优点,用更少的算力实现能力升级。

三、实测实力:在核心赛道冲进“第一梯队”

光有技术创新还不够,模型好不好用,得用数据说话。小米官方公布了MiMo-V2-Flash在7项主流评测中的成绩,对手包括开源的DeepSeek-V3.2、K2-Thinking,以及闭源的ClaudeSonnet4.5、GPT-5(High)等顶尖模型。

结果显示,MiMo-V2-Flash在Agent(智能体)、代码、工具调用、复杂任务执行这四大核心场景中,已经跻身全球第一梯队。尤其在权威的SWE-Bench软件工程测试中,它以71.7%的准确率拿下多语言模式第一,证明了其在实际工业场景中的实用价值。



对于开发者和企业来说,这意味着什么?以前需要高昂成本才能接入的顶尖模型能力,现在通过开源的MiMo-V2-Flash就能免费获得。无论是WebCoding、IDE工具集成,还是智能终端的Agent交互,都能以极低的成本实现高效部署。



四、行业启示:开源+实用,小米的AGI路线图

罗福莉在演讲中反复强调:“这只是我们在AGI路线图上的第二步”。这句话的背后,是小米对AI未来的清晰判断:

首先,大模型的竞争已经从“预训练规模”转向“后训练效率”。随着Agent场景的普及,模型需要持续通过强化学习迭代升级,稳定、可扩展的训练体系比单纯的参数规模更重要。

其次,开源是缩短技术差距的关键。在罗福莉看来,开源不只是共享代码和权重,更是一种“分布式技术加速机制”。通过开源,小米能汇聚全球开发者的力量,共同优化模型,让AGI更快走向普惠。

最后,下一代智能体必须“落地现实”。当前大模型之所以会出现“具身幻觉”,比如不懂重力、不理解时空关系,核心是因为它们只从文本中学习,没有真正和物理世界交互。罗福莉认为,未来的智能体需要构建“统一的世界模型”,从“回答问题”转向“完成任务”,从“文本模拟”走向“实体交互”。

结语:效率革命背后的AI新方向

MiMo-V2-Flash的发布,不仅是小米在AI赛道的一次重要突破,更给整个行业带来了新的思考:大模型的终极目标不是“更聪明”,而是“更好用”。当其他厂商还在比拼参数规模时,小米已经用工程优化实现了“性价比拉满”的效果,这或许就是未来大模型的核心竞争力。

随着开源生态的完善和Agent场景的普及,MiMo-V2-Flash可能会成为更多开发者和企业的首选基座模型。而罗福莉提出的“智能要在交互中活出来”的理念,也预示着AI行业将从“文本大模型”时代,逐步迈向“具身智能”时代。

对于普通人来说,这意味着未来的智能设备会更懂需求、响应更快、使用成本更低——或许不久后,我们在小米手机、智能眼镜、汽车里感受到的AI交互,都将源自这个“跑得快、用得起”的大模型。而这,只是小米AGI路线图的第二步,更精彩的还在后面。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
干就对了!决赛怎么打日本?安东尼奥心里早有准备!看他吐露心声

干就对了!决赛怎么打日本?安东尼奥心里早有准备!看他吐露心声

越岭寻踪
2026-01-21 10:25:37
2026:国产手机厂商重回战国时代?

2026:国产手机厂商重回战国时代?

节点财经
2026-01-20 20:43:21
U23国足更衣室狂欢!集体跳舞转圈圈 黄博文:蒯纪闻干嘛呢 上啊

U23国足更衣室狂欢!集体跳舞转圈圈 黄博文:蒯纪闻干嘛呢 上啊

念洲
2026-01-21 02:19:16
韩国总统:向朝鲜放飞无人机属于严重违法行为,须彻查并严惩

韩国总统:向朝鲜放飞无人机属于严重违法行为,须彻查并严惩

第一财经资讯
2026-01-20 10:39:32
贝克汉姆儿媳晒娘家5.3亿庄园,70岁超模母亲也很美,碾压了婆家

贝克汉姆儿媳晒娘家5.3亿庄园,70岁超模母亲也很美,碾压了婆家

笑傲春秋
2026-01-20 13:52:11
43岁跑友钟长运去世,距全马终点200米突发疾病,儿子正读高三

43岁跑友钟长运去世,距全马终点200米突发疾病,儿子正读高三

离离言几许
2026-01-20 20:51:31
2026年韩国最低时薪10320韩元!最低月薪是…

2026年韩国最低时薪10320韩元!最低月薪是…

奋斗在韩国
2026-01-04 14:03:39
这幅对比图,你看懂了吗

这幅对比图,你看懂了吗

武器纵论
2026-01-20 12:55:05
孔祥明的聪明之处在于离开聂卫平后,没有被第一次的失败婚姻打倒

孔祥明的聪明之处在于离开聂卫平后,没有被第一次的失败婚姻打倒

南权先生
2026-01-20 15:57:17
女子连生三娃都患脑瘫,被丈夫骂是扫把星,再嫁生娃后还原真相

女子连生三娃都患脑瘫,被丈夫骂是扫把星,再嫁生娃后还原真相

秀秀情感课堂
2026-01-16 16:05:06
知名央企迎来最终审判!全烂透了,9个董监高无一清白,强制清退

知名央企迎来最终审判!全烂透了,9个董监高无一清白,强制清退

慕名而来只为你
2026-01-20 05:59:04
Netflix调整收购方案,827亿美元全现金并购华纳兄弟

Netflix调整收购方案,827亿美元全现金并购华纳兄弟

环球网资讯
2026-01-21 11:01:30
皖南事变新四军9000余人近乎覆没,陈毅麾下9个团为何未遭重创?

皖南事变新四军9000余人近乎覆没,陈毅麾下9个团为何未遭重创?

磊子讲史
2026-01-05 11:10:23
新能源车报废迎重大变革!车电必须一体报废 电池不能单独卖

新能源车报废迎重大变革!车电必须一体报废 电池不能单独卖

快科技
2026-01-19 23:15:05
三大虎将啃不下黄维兵团,刘邓向粟裕求救,粟裕再派一员虎将

三大虎将啃不下黄维兵团,刘邓向粟裕求救,粟裕再派一员虎将

顾史
2025-12-30 10:35:00
养老金并轨完成!事退6000元企退3000元,并轨后差距缩小了吗?

养老金并轨完成!事退6000元企退3000元,并轨后差距缩小了吗?

猫叔东山再起
2025-11-28 09:40:03
马晓春悼念聂棋圣,解释自己为何没有到现场送别

马晓春悼念聂棋圣,解释自己为何没有到现场送别

月满大江流
2026-01-20 16:55:10
明明是最低级的小怪,换个颜色直接成超级BOSS

明明是最低级的小怪,换个颜色直接成超级BOSS

街机时代
2026-01-20 10:05:03
恩爱29年遭遇背叛,陈凯歌的“喜新厌旧”终成悲剧

恩爱29年遭遇背叛,陈凯歌的“喜新厌旧”终成悲剧

阿废冷眼观察所
2026-01-17 10:37:27
新德里确认要增购114架“阵风”,倒逼巴基斯坦祭出歼-35

新德里确认要增购114架“阵风”,倒逼巴基斯坦祭出歼-35

子桑说
2026-01-21 10:53:31
2026-01-21 11:36:49
魏家东 incentive-icons
魏家东
一个人的营销商学院!
2277文章数 12134关注度
往期回顾 全部

科技要闻

中芯国际等巨头集体提价,8英寸芯片最高涨20%

头条要闻

中学食堂承包商举报校领导2年拿走300万现金 官方通报

头条要闻

中学食堂承包商举报校领导2年拿走300万现金 官方通报

体育要闻

如果NBA只剩下最后一个传统中锋

娱乐要闻

李亚鹏2天获1291万网友力挺

财经要闻

拆解涉税黑中介虚开套路

汽车要闻

奇瑞张贵兵:墨甲不做秀技术的企业 只做痛点终结者

态度原创

游戏
本地
家居
手机
数码

《光环:战役进化》登陆PS5原因:玩家数量多 扩展新粉丝

本地新闻

云游辽宁|漫步千年小城晨昏,“康”复好心情

家居要闻

褪去浮华 触达松弛与欣喜

手机要闻

realme真我Neo8手机官宣搭载同档罕见5000万潜望长焦

数码要闻

消息称谷歌料Chromebook今年出货持平2025年,仍为1950万台

无障碍浏览 进入关怀版