网易首页 > 网易号 > 正文 申请入驻

颠覆LLM格局!AI2新模型OLMo2,训练过程全公开,数据架构双升级

0
分享至

新智元报道

编辑:peter东 乔杨

【新智元导读】非营利研究机构AI2近日推出的完全开放模型OLMo 2,在同等大小模型中取得了最优性能,且该模型不止开放权重,还十分大方地公开了训练数据和方法。

最近,非营利研究机构AI2上新了OLMo2系列模型,他们称之为「迄今为止最好的完全开源模型」。

OLMo 2系列包含7B和13B两个型号,相比如Llama 3.1和Qwen 2.5等开源模型达到了同等甚至更优的性能,同时FLOPS计算量更少,在性能和计算效率之间取得了极佳的平衡,为开源LLM开辟了新的可能性。

不同大小开源模型的性能对比,OLMo 2的表现优于同参数规模模型

在多个下游任务上,OLMo 2展现出了强大的泛化能力和适应能力。在10个基准上,OLMo-2-13B的性能全面超越了Llama-2-13B,OLMo-2-8B的基准均分也超过了Llama-3.1-8B。

训练过程全公开

不同于Llama、Qwen这类只开源模型权重的项目,这次AI2也秉持了一贯的开源风格,即不止发布了训练好的OLMo 2模型权重,还公开了训练数据、代码、训练过程。这无疑为之后的LLM的研究和应用提供了宝贵的资源。

论文地址:https://arxiv.org/pdf/2501.00656

OLMo 2的训练过程分为3个阶段,分别是预训练、中期训练和后期的指令调优。预训练数据混合了高质量的网页数据、代码数据和学术论文数据等。

在预训练阶段,OLMo 2通过多种技术改进了训练稳定性,例如过滤重复的n-gram、使用更好的初始化方法、架构改进和超参数调整。这确保了模型在训练过程中不会出现崩溃或损失激增,从而提高了最终模型的性能。

预训练使用的高质量数据集

中期训练阶段使用高质量的领域特定数据(例如数学数据),以及合成数据,来增强模型的能力,特别是在数学任务上的表现;加上微退火技术评估以及选择高质量的数据源,进一步优化了中期训练的效果。

中期训练使用的高质量数据集

最后的指令调优阶段,研究人员基于Tülu 3的指令调优方法,开发了OLMo 2-Instruct模型,专注于使用许可数据,并扩展最终阶段的强化学习与可验证奖励(RLVR)。

此外,监督微调(SFT)、直接偏好优化(DPO)和RLVR等多阶段训练,显著提高了模型的指令跟随能力和生成质量。

OLMo 2的开源是全方位的,包括所有用于复制和扩展这些模型所需的训练和评估代码、数据集、模型检查点、日志及超参数的选择等,相比只开源权重,使更多研究人员和开发者能够使用和改进这些模型。

通过开源所有组件,OLMo 2促进了对语言模型行为和使用的理解和研究,促进语言模型研究的透明度和可重复性,这些足以成为之后研究所依赖的基础设施。

OLMo 2 7B和13B模型的训练过程中的超参数

多管齐下造就「低碳」LLM

在大规模语言模型训练中,计算资源和环境影响是不可忽视的因素。Deepseek V3能够以20分之一的成本进行训练,而OLMo 2团队也通过减少主机-设备同步、数据预处理、数据缓存等多种方法降低了训练成本,并取得了显著的成效。

OLMo 2的训练主要在两个集群上进行:Jupiter和Augusta。Jupiter集群配备了128个节点,每个节点有8张H100,总共1024个GPU;Augusta集群由160个A3 Mega虚拟机组成,每个虚拟机也有8张H100,总共1280个GPU。

OLMo 2的7B模型在4.05万亿token上进行训练,13B模型在5.6万亿token上进行训练。训练时间取决于模型的参数规模和训练数据量。

同时为了降低能源消耗,团队使用水冷系统来降低GPU的温度和功耗,从而提高训练效率并降低电力成本。

这些措施加在一起,相比训练同大小的Llama 3.1所消耗的1022MWh电力,OLMo 2 7B训练过程中总计只消耗了131MWh的电力,相当于只有约10分之一的耗电量,显著降低了训练过程消耗的算力,能源及碳足迹。

OLMo 和Llama训练能耗的对比

OLMo 2的发布,标志着开源LLM的持续进步,为相关领域的研究建立一个新生态系统。在这个生态系统中,新的训练方法和技术需要被理解和分享。

参考资料:

https://allenai.org/blog/olmo2

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
别被新闻给误导了,这才是高市早苗的真相

别被新闻给误导了,这才是高市早苗的真相

少年一白
2025-11-18 12:03:56
曝唐嫣罗晋婚变!两人已分居一年半,无商业关联,85花全军覆没

曝唐嫣罗晋婚变!两人已分居一年半,无商业关联,85花全军覆没

叶公子
2025-11-19 16:01:43
江苏科技大学被骗惨了:高中生成头牌教授,还想参评院士

江苏科技大学被骗惨了:高中生成头牌教授,还想参评院士

上峰视点
2025-11-19 11:04:22
徐静雨:这一战是杨瀚森的立身之战,不会再被轻易下放了

徐静雨:这一战是杨瀚森的立身之战,不会再被轻易下放了

懂球帝
2025-11-19 15:17:09
受贿、滥用职权,还涉嫌洗钱!江西省人大常委会原副主任洪礼和被公诉,曾被批“对待群众态度恶劣”

受贿、滥用职权,还涉嫌洗钱!江西省人大常委会原副主任洪礼和被公诉,曾被批“对待群众态度恶劣”

鲁中晨报
2025-11-19 10:45:08
中日谈判完毕,日本官员灰溜溜离场,高市危机升级!美国撤导弹!

中日谈判完毕,日本官员灰溜溜离场,高市危机升级!美国撤导弹!

时时有聊
2025-11-18 21:01:34
10位正部级任组长,新一批中央督察组全部进驻,举报方式公开

10位正部级任组长,新一批中央督察组全部进驻,举报方式公开

新京报政事儿
2025-11-19 15:36:39
杨瀚森替补9+5+3开拓者不敌太阳3连败,夏普29分布克19+6+5

杨瀚森替补9+5+3开拓者不敌太阳3连败,夏普29分布克19+6+5

湖人崛起
2025-11-19 14:30:17
排面!40岁C罗造访白宫+微笑握手特朗普,美国总统宣布:他是GOAT

排面!40岁C罗造访白宫+微笑握手特朗普,美国总统宣布:他是GOAT

我爱英超
2025-11-19 07:10:18
“纷争”结束了?9系车迎来收官之作

“纷争”结束了?9系车迎来收官之作

汽车公社
2025-11-19 08:34:27
马斯克与C罗现身白宫,一同出席特朗普与沙特王储的晚宴,美媒体人:马斯克或重返白宫

马斯克与C罗现身白宫,一同出席特朗普与沙特王储的晚宴,美媒体人:马斯克或重返白宫

鲁中晨报
2025-11-19 11:07:10
詹姆斯复出首秀:11+12助攻创多项历史第一 吐舌大笑提前打卡

詹姆斯复出首秀:11+12助攻创多项历史第一 吐舌大笑提前打卡

醉卧浮生
2025-11-19 14:00:57
10余名台湾同胞在意大利餐厅点5份披萨遭老板讽刺,当地华人团结反击致闭门歇业,旅行团:一共13个人,还点了多杯饮料

10余名台湾同胞在意大利餐厅点5份披萨遭老板讽刺,当地华人团结反击致闭门歇业,旅行团:一共13个人,还点了多杯饮料

极目新闻
2025-11-19 15:35:21
100个张家界“野人”,要断了全国减肥营的财路

100个张家界“野人”,要断了全国减肥营的财路

金错刀
2025-11-19 10:03:00
10个月违法赚近9000万,最终被罚1.77亿!涉事人疑是DeepSeek创始人旗下公司核心员工

10个月违法赚近9000万,最终被罚1.77亿!涉事人疑是DeepSeek创始人旗下公司核心员工

可达鸭面面观
2025-11-19 08:59:19
又反转!曝喻恩泰出轨美女律师,两人挽手回酒店,女方美照曝光!

又反转!曝喻恩泰出轨美女律师,两人挽手回酒店,女方美照曝光!

古希腊掌管月桂的神
2025-11-19 10:00:32
大批中国人依然执意去日本旅游,被日媒追问后,他们的回答太扎心

大批中国人依然执意去日本旅游,被日媒追问后,他们的回答太扎心

以茶带书
2025-11-19 12:26:38
国际模特大赛广东总冠军小姐曝光,广东网友纷纷向全国人民道歉

国际模特大赛广东总冠军小姐曝光,广东网友纷纷向全国人民道歉

七月生活情感驿站
2025-11-19 13:38:10
半小时收费4170元!女大学生网购“上门开锁”遭遇天价账单

半小时收费4170元!女大学生网购“上门开锁”遭遇天价账单

潇湘晨报
2025-11-18 23:47:14
小米股价跌破40港元,卢伟冰预计明年汽车业务毛利率或下滑

小米股价跌破40港元,卢伟冰预计明年汽车业务毛利率或下滑

界面新闻
2025-11-19 10:57:11
2025-11-19 17:08:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13904文章数 66273关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

网红"橙子姐姐"被指在柬失联多日 柬方通报:其已被捕

头条要闻

网红"橙子姐姐"被指在柬失联多日 柬方通报:其已被捕

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

又反转!曝喻恩泰出轨美女律师

财经要闻

黄金税改两周,水贝低价神话终结?

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

教育
家居
时尚
本地
亲子

教育要闻

这道根式方程,很多学生画蛇添足,拜拜丢掉2分

家居要闻

水岸美学 书香人文生活

陈嘉桦,不慌不忙的惊艳

本地新闻

第十二届影展携手重庆来福士丨两江交汇,光影共生

亲子要闻

马筱梅解释为什么箖箖保姆是男生,sam是大s亲选,汪小菲不忍辞退

无障碍浏览 进入关怀版