网易首页 > 网易号 > 正文 申请入驻

Meta 的优化平台 Ax 1.0 能够简化大语言模型和系统优化

0
分享至


作者 | Sergio De Simone

译者 | 张卫滨

如今已进入稳定状态的 Ax 是 Meta 推出的一个 开源平台,它的目标是帮助研究人员和工程师将机器学习应用于 复杂且资源密集型的实验场景。过去几年中,Meta 已广泛使用 Ax 来改进 AI 模型、加速机器学习研究、调优生产基础设施等。

Ax 特别针对那些需要理解和优化 AI 模型或其他具有复杂配置系统的研究人员。Meta 的研究人员指出,在这类场景中,可能的配置组合数量极其庞大,几乎不可能通过线性方式高效地逐一评估。解决方案是采用自适应实验(adaptive experimentation),即系统会按顺序自动评估配置,并利用先前评估结果中的洞察来指导对解空间的探索。

自适应实验非常强大,但实施起来很有挑战性。这类实验不仅需要借助先进的机器学习方法驱动优化过程,还依赖专门的基础设施来管理实验状态、自动化编排流程、提供有效的分析与诊断等功能。

Meta 在内部使用 Ax 解决的问题包括:机器学习中的超参数优化与神经架构搜索、为训练 AI 模型发现最优的数据混合比例、基础设施调优、编译器标记(compiler flags)优化等。

其中一项尤为引人注目的应用是大语言模型(LLM)。Meta 研究人员已提供了全面的 介绍,展示了如何利用 Ax 来编写更有效的提示词(prompts)、选择最高效的样例供 AI 遵循等场景。

优化过程中还存在另外一项挑战,那就是研究人员通常希望在满足约束条件和安全边界的前提下,同时优化多个目标指标。Meta 研究人员举了一个例子,他们曾使用 Ax 进行“多目标优化”,即在提升机器学习模型准确率的同时,尽可能降低其资源消耗。

除了优化本身,Meta 研究人员强调,Ax 还是一个深入理解被优化系统的高效工具:

Ax 提供了一整套分析功能(如图表、表格等),帮助用户了解优化进展、通过帕累托前沿(Pareto frontier)观察不同指标间的权衡、可视化一两个参数在整个输入空间中的影响,并通过敏感性分析(sensitivity analysis)解释每个输入参数对最终结果的贡献程度。

Ax 基于 PyTorch 和 BoTorch,采用贝叶斯优化(Bayesian optimization)方法迭代测试候选配置。它使用一个代理模型(surrogate model)来识别下一个最值得评估的配置,并不断重复该过程,直到达成目标或耗尽计算预算。典型的代理模型是高斯过程(Gaussian Process),因为它能从极少量数据点中做出带有不确定性量化(uncertainty quantification)的预测而被广泛采用。

Meta 研究人员特别强调了 Ax 中具有表述性的 API,使其能够探索复杂的搜索空间,同时处理多个目标、约束条件和含噪声的观测结果。除此之外,Ax 支持并行评估多个不同的配置,并可在任意时刻中止实验。Ax 的一大优势在于提供了合理的默认设置,让非优化专家也能轻松使用高级的技术。

Ax 并不是唯一的开源黑盒自适应优化平台。其他可选方案 包括 SMAC、Nevergrad、Optuna、Dragonfly 等。Meta 研究人员表示,Ax 提供了更广泛的功能,例如支持对参数和结果施加约束、处理带噪声的测量数据等。此外,Ax 以及许多同类工具均可与 Ray Tune、Hydra 等编排框架集成使用。

Meta's Optimization Platform Ax 1.0 Streamlines LLM and System Optimization(https://www.infoq.com/news/2025/12/ax-hyperparameter-optimization/)

声明:本文为 InfoQ 翻译,未经许可禁止转载。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
报应来了,李在明登机离沪前,中方禁令先起效,菲日统一对华战线

报应来了,李在明登机离沪前,中方禁令先起效,菲日统一对华战线

时时有聊
2026-01-07 20:45:12
1986年陈永贵病逝,追悼会规格成难题,邓小平只说了一句话,全场安静

1986年陈永贵病逝,追悼会规格成难题,邓小平只说了一句话,全场安静

寄史言志
2026-01-04 16:34:31
超级网红,卖了天价

超级网红,卖了天价

中国新闻周刊
2026-01-08 07:54:07
26年央视春晚嘉宾名单曝光,牛鬼蛇神混子引争议

26年央视春晚嘉宾名单曝光,牛鬼蛇神混子引争议

杜鱂手工制作
2026-01-06 18:48:05
女大学生餐馆讹钱后续:正脸曝光很漂亮 家人轮番找店主 目的曝光

女大学生餐馆讹钱后续:正脸曝光很漂亮 家人轮番找店主 目的曝光

鋭娱之乐
2026-01-08 08:34:40
女子开车碾压草场后续:扬言撞死牧民,真实身份被扒,公司被牵连

女子开车碾压草场后续:扬言撞死牧民,真实身份被扒,公司被牵连

奇思妙想草叶君
2026-01-07 23:56:24
深圳一高速今年或将免费通行!

深圳一高速今年或将免费通行!

深圳晚报
2026-01-07 22:10:45
就换个LOGO?格力海报被抄袭,怒喊友商:“抄得挺像的,下次别抄了”

就换个LOGO?格力海报被抄袭,怒喊友商:“抄得挺像的,下次别抄了”

LOGO研究所
2026-01-08 09:32:19
武汉大学女教授献血事件,它们的行为不翻车都难

武汉大学女教授献血事件,它们的行为不翻车都难

吴女士
2026-01-07 12:44:51
皇帝英明神武,百姓过得挺苦

皇帝英明神武,百姓过得挺苦

我是历史其实挺有趣
2026-01-07 09:25:12
泽连斯基引发的链式反应:俄罗斯的盟友接连倒下

泽连斯基引发的链式反应:俄罗斯的盟友接连倒下

高博新视野
2026-01-07 18:42:18
拒20分逆转!雷霆加时险胜爵士 亚历山大46+6+6献绝平球

拒20分逆转!雷霆加时险胜爵士 亚历山大46+6+6献绝平球

醉卧浮生
2026-01-08 11:49:07
暴增87%,岚图凭何让豪华党“变心”?

暴增87%,岚图凭何让豪华党“变心”?

大侠上车
2026-01-07 16:15:28
库明加交易接近达成,爆勇士篮网6换3交易方案,库里第5冠有戏了

库明加交易接近达成,爆勇士篮网6换3交易方案,库里第5冠有戏了

篮球看比赛
2026-01-08 12:19:00
被压制!火箭三分16中3落后10分:杜兰特苦撑,杨瀚森3分3板

被压制!火箭三分16中3落后10分:杜兰特苦撑,杨瀚森3分3板

体坛小李
2026-01-08 12:19:06
中方支持委内瑞拉人民对自己国家的领土与自然资源享有完全主权,委内瑞拉外长:感谢中方支持

中方支持委内瑞拉人民对自己国家的领土与自然资源享有完全主权,委内瑞拉外长:感谢中方支持

环球网资讯
2026-01-08 11:57:05
李慧琼当选香港特别行政区第八届立法会主席

李慧琼当选香港特别行政区第八届立法会主席

界面新闻
2026-01-08 12:17:34
黄仁勋的“物理AI”,对中国制造来说真不是好消息

黄仁勋的“物理AI”,对中国制造来说真不是好消息

星海情报局
2026-01-07 18:34:49
河北农村怎么才能不挨冻?大V:在河北农村盖着16斤棉被,鼻子被冻伤

河北农村怎么才能不挨冻?大V:在河北农村盖着16斤棉被,鼻子被冻伤

六子吃凉粉
2026-01-08 08:39:04
农民日报关于河北农民取暖难的稿,为啥不见了?

农民日报关于河北农民取暖难的稿,为啥不见了?

笔杆论道
2026-01-08 07:02:14
2026-01-08 13:04:49
InfoQ incentive-icons
InfoQ
有内容的技术社区媒体
11913文章数 51688关注度
往期回顾 全部

科技要闻

雷军:现在听到营销这两个字都有点恶心

头条要闻

委内瑞拉外长:感谢中方支持

头条要闻

委内瑞拉外长:感谢中方支持

体育要闻

约基奇倒下后,一位故人邪魅一笑

娱乐要闻

2026春节档将有六部电影强势上映

财经要闻

微软CTO韦青:未来人类会花钱"戒手机"

汽车要闻

不谈颠覆与奇迹,智驾企业还能聊点什么?

态度原创

数码
房产
健康
公开课
军事航空

数码要闻

CES微星携手英特尔硬核升级,第三代Ultra重塑AI PC

房产要闻

三亚新房,又全国第一了!

这些新疗法,让化疗不再那么痛苦

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普提出将美国军费提升至1.5万亿美元

无障碍浏览 进入关怀版