网易首页 > 网易号 > 正文 申请入驻

颠覆LLM格局!AI2新模型OLMo2,训练过程全公开,数据架构双升级

0
分享至

新智元报道

编辑:peter东 乔杨

【新智元导读】非营利研究机构AI2近日推出的完全开放模型OLMo 2,在同等大小模型中取得了最优性能,且该模型不止开放权重,还十分大方地公开了训练数据和方法。

最近,非营利研究机构AI2上新了OLMo2系列模型,他们称之为「迄今为止最好的完全开源模型」。

OLMo 2系列包含7B和13B两个型号,相比如Llama 3.1和Qwen 2.5等开源模型达到了同等甚至更优的性能,同时FLOPS计算量更少,在性能和计算效率之间取得了极佳的平衡,为开源LLM开辟了新的可能性。

不同大小开源模型的性能对比,OLMo 2的表现优于同参数规模模型

在多个下游任务上,OLMo 2展现出了强大的泛化能力和适应能力。在10个基准上,OLMo-2-13B的性能全面超越了Llama-2-13B,OLMo-2-8B的基准均分也超过了Llama-3.1-8B。

训练过程全公开

不同于Llama、Qwen这类只开源模型权重的项目,这次AI2也秉持了一贯的开源风格,即不止发布了训练好的OLMo 2模型权重,还公开了训练数据、代码、训练过程。这无疑为之后的LLM的研究和应用提供了宝贵的资源。

论文地址:https://arxiv.org/pdf/2501.00656

OLMo 2的训练过程分为3个阶段,分别是预训练、中期训练和后期的指令调优。预训练数据混合了高质量的网页数据、代码数据和学术论文数据等。

在预训练阶段,OLMo 2通过多种技术改进了训练稳定性,例如过滤重复的n-gram、使用更好的初始化方法、架构改进和超参数调整。这确保了模型在训练过程中不会出现崩溃或损失激增,从而提高了最终模型的性能。

预训练使用的高质量数据集

中期训练阶段使用高质量的领域特定数据(例如数学数据),以及合成数据,来增强模型的能力,特别是在数学任务上的表现;加上微退火技术评估以及选择高质量的数据源,进一步优化了中期训练的效果。

中期训练使用的高质量数据集

最后的指令调优阶段,研究人员基于Tülu 3的指令调优方法,开发了OLMo 2-Instruct模型,专注于使用许可数据,并扩展最终阶段的强化学习与可验证奖励(RLVR)。

此外,监督微调(SFT)、直接偏好优化(DPO)和RLVR等多阶段训练,显著提高了模型的指令跟随能力和生成质量。

OLMo 2的开源是全方位的,包括所有用于复制和扩展这些模型所需的训练和评估代码、数据集、模型检查点、日志及超参数的选择等,相比只开源权重,使更多研究人员和开发者能够使用和改进这些模型。

通过开源所有组件,OLMo 2促进了对语言模型行为和使用的理解和研究,促进语言模型研究的透明度和可重复性,这些足以成为之后研究所依赖的基础设施。

OLMo 2 7B和13B模型的训练过程中的超参数

多管齐下造就「低碳」LLM

在大规模语言模型训练中,计算资源和环境影响是不可忽视的因素。Deepseek V3能够以20分之一的成本进行训练,而OLMo 2团队也通过减少主机-设备同步、数据预处理、数据缓存等多种方法降低了训练成本,并取得了显著的成效。

OLMo 2的训练主要在两个集群上进行:Jupiter和Augusta。Jupiter集群配备了128个节点,每个节点有8张H100,总共1024个GPU;Augusta集群由160个A3 Mega虚拟机组成,每个虚拟机也有8张H100,总共1280个GPU。

OLMo 2的7B模型在4.05万亿token上进行训练,13B模型在5.6万亿token上进行训练。训练时间取决于模型的参数规模和训练数据量。

同时为了降低能源消耗,团队使用水冷系统来降低GPU的温度和功耗,从而提高训练效率并降低电力成本。

这些措施加在一起,相比训练同大小的Llama 3.1所消耗的1022MWh电力,OLMo 2 7B训练过程中总计只消耗了131MWh的电力,相当于只有约10分之一的耗电量,显著降低了训练过程消耗的算力,能源及碳足迹。

OLMo 和Llama训练能耗的对比

OLMo 2的发布,标志着开源LLM的持续进步,为相关领域的研究建立一个新生态系统。在这个生态系统中,新的训练方法和技术需要被理解和分享。

参考资料:

https://allenai.org/blog/olmo2

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
包养情人无数,娶初中同学女儿为妻,玩老婆闺蜜,嗜色如命的富豪

包养情人无数,娶初中同学女儿为妻,玩老婆闺蜜,嗜色如命的富豪

佳佳说奇事故事
2025-09-14 15:02:20
“跳梁小丑”李玉刚跌下神坛,不再被大家宽容,梅葆玖:永不原谅

“跳梁小丑”李玉刚跌下神坛,不再被大家宽容,梅葆玖:永不原谅

诗意世界
2025-08-13 16:24:00
中超24轮积分榜:前3突破50分,9队破30分提前保级,降级4选2

中超24轮积分榜:前3突破50分,9队破30分提前保级,降级4选2

中超伪球迷
2025-09-14 21:35:17
莫言:当一个人不尊重你的时候,收起你的大方,不要愤怒和难过

莫言:当一个人不尊重你的时候,收起你的大方,不要愤怒和难过

清风拂心
2025-09-13 11:15:08
女子坐高铁弄丢价值13.8万元的手镯!连续搜寻未果,4天后民警在坐垫底下找到

女子坐高铁弄丢价值13.8万元的手镯!连续搜寻未果,4天后民警在坐垫底下找到

极目新闻
2025-09-14 11:36:27
罗永浩vs西贝,是一个智商鉴定器

罗永浩vs西贝,是一个智商鉴定器

自由的海报
2025-09-13 12:23:14
朝鲜副国级高官叛逃脱北,曝光金家秘闻:酒池肉林、80万买轩尼诗

朝鲜副国级高官叛逃脱北,曝光金家秘闻:酒池肉林、80万买轩尼诗

猫眼观史
2024-03-25 14:31:14
NBA快船队球星莱昂纳德被爆签阴阳合同,联盟已启动调查程序

NBA快船队球星莱昂纳德被爆签阴阳合同,联盟已启动调查程序

环球网资讯
2025-09-15 07:13:08
江苏男子进厂打工5个月,钱都花临时妻子身上,原配在家省吃俭用

江苏男子进厂打工5个月,钱都花临时妻子身上,原配在家省吃俭用

大苏专栏
2025-09-14 23:33:55
大瓜!木子美重出江湖曝猛料:著名女主持人和11位大哥“叠罗汉”

大瓜!木子美重出江湖曝猛料:著名女主持人和11位大哥“叠罗汉”

壹月情感
2025-09-02 22:07:58
互撕、故障!中德车企慕尼黑对弈,百年BBA慌了?

互撕、故障!中德车企慕尼黑对弈,百年BBA慌了?

凤凰网财经
2025-09-12 22:35:07
借你丈夫用用!山西女子向闺蜜借丈夫一用,并承诺会给10万感谢费

借你丈夫用用!山西女子向闺蜜借丈夫一用,并承诺会给10万感谢费

百态人间
2025-09-13 16:15:30
1米92的潘展乐和张子宇惊喜同框,瞬间变最萌身高差

1米92的潘展乐和张子宇惊喜同框,瞬间变最萌身高差

懂球帝
2025-09-14 09:03:22
厨师戴大金链子炒菜,贾国龙睡不着,才两天,西贝无人生意惨淡

厨师戴大金链子炒菜,贾国龙睡不着,才两天,西贝无人生意惨淡

小彭聊社会
2025-09-15 01:01:48
人民日报、新华社、央视集体发文

人民日报、新华社、央视集体发文

政知新媒体
2025-09-14 21:30:16
不打了!曝暂时退出NBA!首轮19号秀天才大中锋

不打了!曝暂时退出NBA!首轮19号秀天才大中锋

篮球实战宝典
2025-09-14 12:52:24
特朗普三招连发,37国联手围攻中国,中方的反击震惊全球!

特朗普三招连发,37国联手围攻中国,中方的反击震惊全球!

谈天谈地谈天地
2025-09-14 09:35:43
A股:最新底部筹码峰集中的个股名单一览

A股:最新底部筹码峰集中的个股名单一览

A股数据表
2025-09-14 17:23:23
西贝北京最大门店,“堂食客流降七成以上”!罗永浩深夜发声:西贝的事情可以告一段落了,我要忙正事了

西贝北京最大门店,“堂食客流降七成以上”!罗永浩深夜发声:西贝的事情可以告一段落了,我要忙正事了

中国基金报
2025-09-14 10:38:50
0-4惨遭王楚钦横扫!无缘澳门站夺冠,雨果赛后采访尽显高情商!

0-4惨遭王楚钦横扫!无缘澳门站夺冠,雨果赛后采访尽显高情商!

田先生篮球
2025-09-14 22:28:13
2025-09-15 08:23:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13445文章数 66150关注度
往期回顾 全部

科技要闻

AI眼镜能否成为下一代人机互动的超级入口?

头条要闻

NASA叫嚣美国"一定会在中国之前登月" 前局长当众拆台

头条要闻

NASA叫嚣美国"一定会在中国之前登月" 前局长当众拆台

体育要闻

利物浦1-0绝杀十人伯恩利 萨拉赫95分钟点射

娱乐要闻

花泽香菜官宣离婚 结束与老公5年婚姻

财经要闻

西贝贾国龙,“错”得离谱

汽车要闻

混动狂潮 835马力V12 阿斯顿·马丁的最后浪漫

态度原创

艺术
数码
游戏
家居
军事航空

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

数码要闻

传苹果智能眼镜将于2026年底至2027年初上市 暂不支持AR功能

PS商店现大量AI劣质游戏 玩家笑称谷歌商店有对手了

家居要闻

原木风格 温馨舒适氛围

军事要闻

俄无人机飞入波兰 美国务卿:不可接受

无障碍浏览 进入关怀版