网易首页 > 网易号 > 正文 申请入驻

Meta MobileLLM-R1模型,不到1B参数,用1/10的训练就超越了Qwen3

0
分享至

机器之心报道

编辑:泽南、杨文

与其他全开源模型相比,性能提升2-5倍。

小参数模型也进入了 R1 时代,这次开源出新技术的是 Meta。

本周五,Meta AI 团队正式发布了 MobileLLM-R1。

  • HuggingFace 链接:https://huggingface.co/collections/facebook/mobilellm-r1-68c4597b104fac45f28f448e
  • 试用链接:https://huggingface.co/spaces/akhaliq/MobileLLM-R1-950M

这是 MobileLLM 的全新高效推理模型系列,包含两类模型:基础模型 MobileLLM-R1-140M-base、MobileLLM-R1-360M-base、MobileLLM-R1-950M-base 和它们相应的最终模型版。

它们不是通用的聊天模型,而是监督微调 (SFT) 模型,专门针对数学、编程(Python、C++)和科学问题进行训练。

除了模型本身之外,Meta 还发布了完整的训练方案和数据源,以确保可重复性并支持进一步的研究。

值得注意的是,该系列参数最大的 MobileLLM-R1 950M 模型仅使用约 2T 高质量 token 进行预训练,总训练 token 量少于 5T,但在 MATH、GSM8K、MMLU 和 LiveCodeBench 基准测试中,其性能与使用 36T token 进行训练的 Qwen3 0.6B 相当或更佳。

与现有的完全开源模型相比,尽管参数规模明显更小,MobileLLM-R1 950M 模型在 MATH 基准上的准确率也比 Olmo 1.24B 模型高出约五倍,比 SmolLM2 1.7B 模型高出约两倍。此外,MobileLLM-R1 950M 在编码基准测试中的表现远超 Olmo 1.24B 和 SmolLM2 1.7B ,在完全开源模型中创下了新的最高水平。

Token 效率的比较如下:

后训练比较:

模型架构:

MobileLLM-R1 的发布引起了机器学习社区的讨论。人们欢迎通义、Meta 等顶尖大模型团队基于小体量模型的探索。这一方向的训练成本较为低廉,可以更加方便尝试各类最新论文提出的技术,更重要的是,模型体量的下降也意味着它可以覆盖更多端侧设备,实现更大面积的落地。

随着训练成本普遍下降,我们将会得到更好的模型。

背后三位华人作者

在 MobileLLM-R1 系列发布的同时,背后的作者们也正式亮相,他们表示,该工作的研发时间有一年之久。该项目由华人领衔。

Zechun Liu

Zechun Liu 是 Meta AI 的研究科学家,专注于大模型和基础模型的高效部署与优化。

她的研究涉及大语言模型的预训练与后训练,神经网络架构设计与搜索,量化、剪枝与稀疏性,知识蒸馏以及高效的视觉 - 语言模型等,目标是在计算资源有限的环境中实现高性能模型的推理和部署。

2016 年,她在复旦大学获得本科学位,2019 年至 2021 年在卡内基梅隆大学担任访问学者,导师为 Marios Savvides 教授和 Eric Xing(邢波)教授。2021 年 6 月获得香港科技大学的博士学位,师从 Kwang-Ting Tim CHENG 教授。

Zechun Liu 在顶级会议和期刊上发表了 20 多篇论文,其论文引用量达到了数千次。

Ernie Chang

Ernie Chang 是 Meta AI 的研究科学家,专注于自然语言处理、多模态学习和高效模型部署等领域。

他于 2023 年 2 月加入 Meta,参与了多个前沿项目的研究和开发。

在他的研究中,Ernie Chang 参与了多个重要的项目和论文。例如,他是《Agent-as-a-Judge: Evaluate Agents with Agents》一文的共同作者,该论文提出了一种新的评估方法,通过代理模型对其他代理模型进行评估,从而提高评估效率和准确性。

此外,他还参与了《MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases》的研究,该研究致力于优化小语言模型,以适应移动设备上的应用需求。

Ernie Chang 的研究兴趣包括多语言处理、多模态系统等。

Changsheng Zhao(赵常盛)

Changsheng Zhao 是 Meta AI 的研究科学家,专注于自然语言处理、深度学习和大语言模型的高效部署与优化。

他本科毕业于北京大学,后在哥伦比亚大学攻读硕士学位,毕业后去了三星美国研究员担任研究员,2021 年加入 Meta。

在 Meta,Changsheng Zhao 参与了多个前沿研究项目,主要集中在模型量化、神经网络架构和多模态系统等领域。 部分代表性工作包括:

  • ParetoQ: Scaling Laws in Extremely Low-bit LLM Quantization:探讨极低比特量化在大语言模型中的缩放定律,帮助平衡模型大小与准确率。
  • Llama Guard 3-1B-INT4:参与开发 Meta 的开源 Llama Guard 模型变体,这是一个紧凑高效的 1B 参数 INT4 量化版本,于 2024 年 Meta Connect 活动中开源,用于 AI 安全和内容过滤。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美军司令:一旦台海战争打响,6个航母战斗群2个陆战师将全都出动

美军司令:一旦台海战争打响,6个航母战斗群2个陆战师将全都出动

霁寒飘雪
2026-03-26 09:54:09
被“最强地级市”猛追,“第一省会”如何守位?

被“最强地级市”猛追,“第一省会”如何守位?

每日经济新闻
2026-03-26 22:56:02
香港知名女神罕见露面,讲话异常缓慢、眼神涣散,被指行为怪异

香港知名女神罕见露面,讲话异常缓慢、眼神涣散,被指行为怪异

TVB的四小花
2026-03-26 09:43:00
痛别张雪峰!峰学蔚来接班人确定,事业将继续

痛别张雪峰!峰学蔚来接班人确定,事业将继续

大熊欢乐坊
2026-03-26 19:17:05
日裔巴西教授:中国成功的关键,是没让食利主义吃掉工业

日裔巴西教授:中国成功的关键,是没让食利主义吃掉工业

琨玉秋霜
2026-03-26 16:15:02
郑裕彤家族为什么不自救?不是说香港豪门隐形资产很多么?

郑裕彤家族为什么不自救?不是说香港豪门隐形资产很多么?

担扑
2026-03-26 17:02:51
亲身跑完500公里高速,才懂电车和油车差距有多大,选错车太糟心

亲身跑完500公里高速,才懂电车和油车差距有多大,选错车太糟心

老特有话说
2026-03-24 15:07:23
英伟达革了自己的命:智能体进化7天,干掉所有算子工程师、GPU专家

英伟达革了自己的命:智能体进化7天,干掉所有算子工程师、GPU专家

机器之心Pro
2026-03-26 11:35:16
因祸得福!烧129年的地下火被灭,新疆凭空多了个“金饭碗”

因祸得福!烧129年的地下火被灭,新疆凭空多了个“金饭碗”

刘蕳爱下厨
2026-03-24 17:29:01
出大事了,特朗普通报全球,美头号敌人已亮相,担心的事即将发生

出大事了,特朗普通报全球,美头号敌人已亮相,担心的事即将发生

策略述
2026-03-26 13:45:17
重磅!伊朗已回复15点停火协议,最关键的48小时来了

重磅!伊朗已回复15点停火协议,最关键的48小时来了

风风顺
2026-03-27 03:15:05
捡漏了!全球纯电SUV续航650km,从近20万降到13万多,放弃比亚迪

捡漏了!全球纯电SUV续航650km,从近20万降到13万多,放弃比亚迪

隔壁说车老王
2026-03-27 07:39:17
清纯得不像动作片女一号!

清纯得不像动作片女一号!

贵圈真乱
2026-03-26 11:33:33
14亿人集体买房,为什么最后买出了一个烂摊子?

14亿人集体买房,为什么最后买出了一个烂摊子?

流苏晚晴
2026-03-25 18:14:02
一审重判整整17年,柯文哲当庭最后一搏,藏着赖清德最担心的结局

一审重判整整17年,柯文哲当庭最后一搏,藏着赖清德最担心的结局

李健政观察
2026-03-26 18:16:56
快扔掉!戴一天,辐射量相当于拍117次胸片

快扔掉!戴一天,辐射量相当于拍117次胸片

FM93浙江交通之声
2025-10-28 00:01:43
特朗普:我一点儿也不着急

特朗普:我一点儿也不着急

极目新闻
2026-03-27 07:24:53
美国悬赏1000万美金,通缉一中国四川小伙,他到底做了什么?

美国悬赏1000万美金,通缉一中国四川小伙,他到底做了什么?

趣文说娱
2026-03-26 18:11:01
魔术连续两季横扫国王终结6连败 班凯罗30+9+7德罗赞33+6+11

魔术连续两季横扫国王终结6连败 班凯罗30+9+7德罗赞33+6+11

醉卧浮生
2026-03-27 09:36:26
汪伪政权的最后一年(四)

汪伪政权的最后一年(四)

真实抗战故事
2026-03-27 10:14:00
2026-03-27 10:52:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12611文章数 142595关注度
往期回顾 全部

科技要闻

OpenAI果断砍掉"成人模式",死磕生产力

头条要闻

媒体:内塔尼亚胡夫人为两个儿子诉苦 加沙儿童怎么看

头条要闻

媒体:内塔尼亚胡夫人为两个儿子诉苦 加沙儿童怎么看

体育要闻

近29战23胜!这支黄蜂有多强?

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

很反常!油价向上,黄金向下

汽车要闻

线控底盘+千问上车 智己LS8预售权益价25.98万起

态度原创

健康
教育
家居
艺术
公开课

转头就晕的耳石症,能开车上班吗?

教育要闻

从72分到141分!数学提分的关键,不是天赋,更不是题海

家居要闻

傍海而居 静观蝴蝶海

艺术要闻

2025“殊相”——中国油画学会创作研修作品展 | 作品选刊(一)

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版