网易首页 > 网易号 > 正文 申请入驻

AutoGluon助手:多智能体协作实现零代码AutoML

0
分享至


在2024年Kaggle AutoML大奖赛上,这是一项奖金75,000美元的竞赛,汇集了数百支队伍,包括顶级AutoML从业者和Kaggle大师级选手,我们的全自动框架获得第10名,成为竞赛中唯一获得积分的自动化智能体。这一成就验证了我们一直在探索的问题:我们能否不仅消除AutoML中通常涉及的模型选择和超参数调优,还能消除编码本身?

自动机器学习的承诺一直是普及化。然而,大多数AutoML工具仍要求用户编写代码、准备数据结构并理解机器学习工作流程。对于没有编程背景的领域专家——分析实验数据的科学家、构建预测模型的分析师,或处理图像集合的研究人员——这种编码要求造成了不必要的障碍。

我们设计AutoGluon助手来消除这一障碍。该系统基于MLZero构建,这是一个由大语言模型驱动的新型多智能体系统,AutoGluon助手能够将自然语言描述转换为跨表格、图像、文本和时间序列数据的训练好的机器学习模型。该系统在我们的多模态AutoML智能体基准测试中实现了92%的成功率,在外部MLE-bench Lite测试中达到86%的成功率,在成功率和解决方案质量方面都表现领先。

多智能体架构解决现实世界的机器学习挑战

传统的AutoML工具假设输入是干净、结构化的,用户能够正确调用API。而现实世界的机器学习问题始于更复杂的情况:模糊的数据文件、不明确的任务定义,以及可能不知道自己需要分类还是回归的用户。MLZero通过多智能体架构解决这个问题,其中由亚马逊Bedrock的大语言模型驱动的专业组件协作,将原始输入转换为可行的解决方案。

例如,考虑一位医学研究人员上传带有分割掩码的胸部X光图像,将目标描述为"在X光片中定位疾病区域"。感知模块识别出这是像素级分割任务,语义记忆选择AutoGluon的MultiModalPredictor进行语义分割,迭代编码模块生成并完善代码。当初始尝试遇到掩码格式不兼容问题时,情节记忆提供调试上下文来调整预处理和后处理,成功训练出分割模型——研究人员无需编写任何代码。

该系统包含四个核心模块:感知、语义记忆、情节记忆和迭代编码。感知模块解释任意数据输入,解析文件结构和内容以构建结构化理解,无论格式不一致或命名模糊。当用户提供没有明确目标变量指示的CSV文件时,感知模块分析列分布和语义来推断任务结构。

语义记忆模块通过机器学习库的知识丰富系统,维护关于AutoGluon能力、API模式和最佳实践的结构化信息。语义记忆使系统能够根据任务特征选择适当的工具,而不需要用户知道语义分割任务需要在AutoGluon Multimodal中使用SAM模型。

情节记忆维护按时间顺序的执行记录,跟踪系统尝试过什么、什么成功了、什么失败了。当代码执行产生错误时,该模块通过显示相关的先前尝试及其结果来提供调试上下文。这解决了机器学习开发的迭代性质,解决方案通过完善而不是完整出现。

迭代编码模块实现了具有反馈循环和增强记忆的改进过程。生成的代码执行,产生结果或错误,并为后续尝试提供信息。这个过程持续到成功执行或达到最大迭代限制,需要时可选择每次迭代的用户输入进行指导。该架构在保持高度自动化的同时保留了人工监督的灵活性。

通过这个综合系统,MLZero弥合了嘈杂原始数据与复杂机器学习解决方案之间的差距。多智能体协作模式在各种模态中都被证明是有效的,因为该架构分离了在单智能体系统中传统上交织的关注点——理解数据、了解能力、跟踪历史和生成代码。

基准测试验证系统性能

为了根据既定的外部标准验证我们的系统,我们首先在MLE-bench Lite上进行了评估。该基准测试由来自以往Kaggle竞赛的21个不同挑战组成,允许我们直接将模型性能与其他领先自动化系统进行比较。我们的模型达到了最高成功率86%,意味着它成功完成并提交了21个挑战中18个的有效解决方案。它在整体解决方案质量方面获得第一名,平均排名为1.43,而第二名智能体为2.36。我们的智能体赢得了六枚金牌,在基准测试的挑战中总奖牌数超过了所有竞争对手。

在现有基准测试上证明模型能力后,我们在自己的多模态AutoML智能体基准测试上进一步测试,这是一个更具挑战性的测试套件,包含25个不同的任务,数据集处理程度较低,数据更接近原始形式,噪声更多、格式不一致性和模糊性更大。该基准测试包含多种数据模态(表格、图像、文本、文档)和问题类型(分类、回归、检索、语义分割)以及具有挑战性的数据结构(多语言、多表格和大规模数据集)。AutoGluon助手(作为MLZero)在所有任务中实现了92%的成功率。当使用紧凑的80亿参数大语言模型实现时,系统仍实现了45.3%的成功率,比许多更大、更消耗资源的智能体更有效。

灵活的集成与协作

AutoGluon助手支持多种交互模式以适应不同的用户偏好和工作流程。用户可以通过命令行界面调用系统进行快速自动化任务,通过Python API集成到现有数据管道中,通过Web UI进行可视化交互和监控,或者使用模型上下文协议(MCP)将其与其他智能体工具集成。这种灵活性确保无论用户偏好脚本、图形界面还是程序化控制,都能访问相同的底层自动化功能。

系统还支持可选的每次迭代用户输入,允许领域专家在迭代改进过程中注入专业知识,同时保持日常使用的自动化。例如,在处理医学影像数据时,专家可能会指导系统采用特定于其扫描协议的自定义标准化。情节记忆跟踪这些干预以及系统生成的尝试,创造了一个协作动态,其中自动化处理机械复杂性,而用户在拥有相关见解时提供战略指导。

该系统是开源的,可在Github上获得,技术细节发表在我们的NeurIPS 2025论文中。

Q&A

Q1:AutoGluon助手是什么?它能做什么?

A:AutoGluon助手是基于MLZero的零代码自动机器学习系统,由大语言模型驱动的多智能体协作架构构建。它能够将自然语言描述直接转换为训练好的机器学习模型,支持表格、图像、文本和时间序列等多种数据类型,无需用户编写任何代码。

Q2:MLZero的多智能体架构是如何工作的?

A:MLZero包含四个核心模块:感知模块解释数据输入和任务定义;语义记忆模块存储机器学习库知识;情节记忆模块跟踪执行历史;迭代编码模块生成和完善代码。这些模块协作将原始数据转换为完整的机器学习解决方案。

Q3:AutoGluon助手在基准测试中表现如何?

A:在MLE-bench Lite基准测试中,AutoGluon助手达到86%的成功率,获得第一名;在多模态AutoML智能体基准测试中达到92%成功率。即使使用80亿参数的紧凑模型,仍能实现45.3%的成功率,超越许多大型智能体系统。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
黄仁勋去吃炸酱面!大热天穿皮衣,站在门口大口吃面条

黄仁勋去吃炸酱面!大热天穿皮衣,站在门口大口吃面条

西楼知趣杂谈
2026-05-15 13:59:38
陪伴上海人18年,沪上知名百货公告:6月底闭店!购物卡处理方案公布

陪伴上海人18年,沪上知名百货公告:6月底闭店!购物卡处理方案公布

上观新闻
2026-05-15 21:28:06
中国气象局升级重大气象灾害(暴雨、强对流)四级应急响应为三级

中国气象局升级重大气象灾害(暴雨、强对流)四级应急响应为三级

新京报
2026-05-15 18:53:21
曝央视与国际足联谈判成功!7.4亿买下世界杯转播权 1天内签约

曝央视与国际足联谈判成功!7.4亿买下世界杯转播权 1天内签约

念洲
2026-05-15 07:46:29
血亏!大阪世博会190台电动巴士全部报废,巨亏67亿日元

血亏!大阪世博会190台电动巴士全部报废,巨亏67亿日元

颤抖的熊猫
2026-05-15 10:41:43
人民大会堂国宴服务员惊艳刷屏:相貌大方,气质端庄,太美了!

人民大会堂国宴服务员惊艳刷屏:相貌大方,气质端庄,太美了!

手工制作阿歼
2026-05-16 00:11:27
普通家庭最大的通病,是把托举的顺序搞反了

普通家庭最大的通病,是把托举的顺序搞反了

洞见
2026-05-15 10:08:02
惊现夜市闹剧!30岁高颜值少妇当众脱内裤套男子嘴,丈夫全程目睹

惊现夜市闹剧!30岁高颜值少妇当众脱内裤套男子嘴,丈夫全程目睹

老猫观点
2026-05-15 07:34:04
快讯!西方精英高层没喝茅台,喝的竟然是它!

快讯!西方精英高层没喝茅台,喝的竟然是它!

达文西看世界
2026-05-15 10:51:53
已成功瘦了 30斤,我发现提高代谢关键吃法是:早餐吃够蛋白质

已成功瘦了 30斤,我发现提高代谢关键吃法是:早餐吃够蛋白质

新时代的两性情感
2026-05-15 10:08:20
全球媒体聚焦 | 外媒:美国总统特朗普结束访华 中美向世界传递“稳定预期”

全球媒体聚焦 | 外媒:美国总统特朗普结束访华 中美向世界传递“稳定预期”

中国网
2026-05-15 20:22:05
痛别 | 突发讣告!巨星陨落!

痛别 | 突发讣告!巨星陨落!

天津广播
2026-05-16 00:16:42
特朗普结束访华,大赞中南海景致:若待得惯都不想走

特朗普结束访华,大赞中南海景致:若待得惯都不想走

澎湃新闻
2026-05-15 18:28:12
日本睡不着了!特朗普对华签的一系列协议,把日本的路全堵死了!

日本睡不着了!特朗普对华签的一系列协议,把日本的路全堵死了!

青青子衿
2026-05-15 20:05:25
雷老板昨夜吃大席,股票今天遇大跌

雷老板昨夜吃大席,股票今天遇大跌

不主流讲话
2026-05-15 16:10:40
保时捷中国高管喊话被抄袭无奈,罗永浩怒怼:论流氓谁能跟保时捷比,新能源抄了保时捷的,不是只有那个谁和那个谁吗

保时捷中国高管喊话被抄袭无奈,罗永浩怒怼:论流氓谁能跟保时捷比,新能源抄了保时捷的,不是只有那个谁和那个谁吗

大风新闻
2026-05-15 12:21:07
这一刻我才明白:为什么男人都爱看篮球直播,而不愿看马拉松直播

这一刻我才明白:为什么男人都爱看篮球直播,而不愿看马拉松直播

马拉松跑步健身
2026-05-15 19:59:38
“兰州瓜农刺死城管案”终审维持原判,当事人:考虑申诉

“兰州瓜农刺死城管案”终审维持原判,当事人:考虑申诉

新京报
2026-05-15 20:10:21
新能源概念通胀退潮后,谁在裸泳?

新能源概念通胀退潮后,谁在裸泳?

虎嗅APP
2026-04-23 22:36:41
特朗普访华晚宴,雷军是座上宾,为什么?

特朗普访华晚宴,雷军是座上宾,为什么?

二月禾
2026-05-15 11:18:14
2026-05-16 04:15:00
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
18478文章数 49705关注度
往期回顾 全部

科技要闻

直降千元起步!苹果华为率先开启618让利

头条要闻

黄仁勋在北京喝豆汁痛苦皱眉 问“这是什么东西”

头条要闻

黄仁勋在北京喝豆汁痛苦皱眉 问“这是什么东西”

体育要闻

德约科维奇买的球队,从第6级联赛升入法甲

娱乐要闻

方媛为何要来《桃花坞6》没苦硬吃?

财经要闻

腾讯掉队,马化腾戳破真相

汽车要闻

高尔夫GTI刷新纽北纪录 ID. Polo GTI迎全球首秀

态度原创

本地
家居
教育
旅游
亲子

本地新闻

用苏绣的方式,打开江西婺源

家居要闻

110㎡淡而有致的生活表达

教育要闻

儿子不让用水刷鞋,无知家长被嘲:非要孩子考不上大学,你才高兴

旅游要闻

藏在沈阳闹市的金色秘境!2 万㎡油菜花全开,地铁直达还免费

亲子要闻

孕妇补钙怕刺激怎么选?液体钙无添加配方实测,蓝帽认证更靠谱

无障碍浏览 进入关怀版