网易首页 > 网易号 > 正文 申请入驻

​GPT充当大脑,指挥多模型完成各类任务,通用系统AutoML-GPT来了

0
分享至

机器之心报道

编辑:马梓文、小舟

使用 ChatGPT 实现通用人工智能,思路打开了。

当前,AI 模型虽然已经涉及非常广泛的应用领域,但大部分 AI 模型是为特定任务而设计的,它们往往需要大量的人力来完成正确的模型架构、优化算法和超参数。ChatGPT、GPT-4 爆火之后,人们看到了大型语言模型(LLM)在文本理解、生成、互动、推理等方面的巨大潜力。一些研究者尝试利用 LLM 探索通往通用人工智能(AGI)的新道路。

近期,来自德克萨斯州大学奥斯汀分校的研究者提出一种新思路 —— 开发任务导向型 prompt,利用 LLM 实现训练 pipeline 的自动化,并基于此思路推出新型系统 AutoML-GPT。

论文地址:

https://papers.labml.ai/paper/35151be0eb2011edb95839eec3084ddd

AutoML-GPT 使用 GPT 作为各种 AI 模型之间的桥梁,并用优化过的超参数来动态训练模型。AutoML-GPT 动态地接收来自 Model Card [Mitchell et al., 2019] 和 Data Card [Gebru et al., 2021] 的用户请求,并组成相应的 prompt 段落。最后,AutoML-GPT 借助该 prompt 段落自动进行多项实验,包括处理数据、构建模型架构、调整超参数和预测训练日志。

AutoML-GPT 通过最大限度地利用其强大的 NLP 能力和现有的人工智能模型,解决了各种测试和数据集中复杂的 AI 任务。大量实验和消融研究表明,AutoML-GPT 对许多人工智能任务(包括 CV 任务、NLP 任务)是通用的、有效的。

AutoML-GPT 简介

AutoML-GPT 是一个依赖数据和模型信息来格式化 prompt 输入段落的协作系统。其中,LLM 作为控制器,多个专家模型作为协作的执行者。AutoML-GPT 的工作流程包括四个阶段:数据处理、模型架构设计、超参数调整和训练日志生成。

具体来说,AutoML-GPT 的工作机制如下:

  • 通过 Model Card 和 Data Card 生成固定格式的 prompt 段落
  • 构建训练 pipeline,在选定的数据集和模型架构上处理用户需求
  • 生成性能训练日志并调整超参数
  • 根据自动建议的(auto-suggested)超参数调整模型

输入分解

AutoML-GPT 的第一阶段是让 LLM 接受用户输入。为了提高 LLM 的性能并生成有效的 prompt,该研究对输入 prompt 采用特定的指令。这些指令包括三个部分:Data Card、Model Card、评估指标和附加要求。

如下图 2 所示,Data Card 的关键部分由数据集名称、输入数据集类型(如图像数据或文本数据)、标签空间(如类别或分辨率)和默认评估指标组成。

如下图 3 所示,Model Card 由模型名称、模型结构、模型描述和架构超参数组成。通过提供这些信息,Model Card 能告知 LLM 整个机器学习系统使用了哪些模型,以及用户对模型架构的偏好。

除了 Data Card 和 Model Card,用户还可以选择请求更多的评估基准、评估指标或任何约束。AutoML-GPT 将这些任务规范作为高级指令提供给 LLM,用于相应地分析用户需求。

当有一系列需要处理的任务时,AutoML-GPT 需要为每个任务匹配相应的模型。为了达到这一目标,首先系统需要获得 Model Card 和用户输入中的模型描述。

然后,AutoML-GPT 使用 in-context 任务 - 模型分配机制,动态地为任务分配模型。这种方法通过将模型描述和对用户需求的更好理解结合起来,实现了增量模型(incremental model)访问,并提供了更大的开放性和灵活性。

用预测训练日志调整超参数

AutoML-GPT 根据 Data Card 和 Model Card 设置超参数,并通过生成超参数的训练日志来预测性能。该系统自动进行训练并返回训练日志。在数据集上的模型性能训练日志记录了训练过程中收集的各种指标和信息,这有助于了解模型训练进展,找出潜在问题,以及评估所选架构、超参数和优化方法的有效性。

实验

为了评估 AutoML-GPT 的性能,该研究使用 ChatGPT(OpenAI 的 GPT-4 版本)来实现它,并进行多项实验从多个角度展示了 AutoML-GPT 的效果。

下图 4 展示了使用 AutoML-GPT 在未知数据集上训练的结果:

下图 5 展示了 AutoML-GPT 在 COCO 数据集上完成目标检测任务的过程:

下图 6 展示了 AutoML-GPT 在 NQ 开放数据集(Natural Questions Open dataset,[Kwiatkowski et al., 2019])上的实验结果:

该研究还使用 XGBoost 在 UCI Adult 数据集 [Dua and Graff, 2017] 上评估了 AutoML-GPT,以探究其在分类任务上的性能,实验结果如下图 7 所示:

感兴趣的读者可以阅读论文原文,了解更多研究细节。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
阿根廷外长向中国求援,中方6个字回应让人震惊

阿根廷外长向中国求援,中方6个字回应让人震惊

说天说地说实事
2024-04-29 21:20:27
停牌了!2个跌停后3500万资金抄底,再吃6个跌停,已亏损1000万

停牌了!2个跌停后3500万资金抄底,再吃6个跌停,已亏损1000万

股海风云大作手
2024-04-30 08:45:23
湖南恶警被执行死刑,画面曝光,临刑前戴镣铐含泪与妻子告别

湖南恶警被执行死刑,画面曝光,临刑前戴镣铐含泪与妻子告别

纪实录
2024-02-19 21:56:55
赞助来了?记者:今晚京津之战,津门虎队胸前会出现“泰达”字样

赞助来了?记者:今晚京津之战,津门虎队胸前会出现“泰达”字样

直播吧
2024-04-30 11:35:31
越闹越大!网友纷纷去郭晶晶账号下留言:请严查西安跳水世界杯!

越闹越大!网友纷纷去郭晶晶账号下留言:请严查西安跳水世界杯!

娱乐八卦木木子
2024-04-30 14:09:02
伊朗一场导弹雨,同时炸醒3个国家:若来的是中国导弹将毫无胜算

伊朗一场导弹雨,同时炸醒3个国家:若来的是中国导弹将毫无胜算

娱乐圈小胡椒
2024-04-29 10:49:36
冉莹颖浴室照曝光!冉莹颖身材太好了,网友:邹市明这能忍住吗?

冉莹颖浴室照曝光!冉莹颖身材太好了,网友:邹市明这能忍住吗?

拳击时空
2024-04-29 06:21:09
城管打伤一个老人,大批警察包围城管办公室,坚决抓打老人的城管

城管打伤一个老人,大批警察包围城管办公室,坚决抓打老人的城管

乔生桂
2024-04-28 09:31:07
欧文缺阵,东契奇感到责任重大

欧文缺阵,东契奇感到责任重大

小马哥谈体育
2024-04-30 11:14:57
郭晶晶高圆圆等参加品牌活动,郭晶晶稳坐C位,端庄大气

郭晶晶高圆圆等参加品牌活动,郭晶晶稳坐C位,端庄大气

话娱论影
2024-04-30 14:57:04
大S这次血亏!具俊晔DJ秀开演前5天票还没卖光,场地简陋像厂房!

大S这次血亏!具俊晔DJ秀开演前5天票还没卖光,场地简陋像厂房!

西瓜爱娱娱
2024-04-29 15:34:55
支付宝突然更新,结果把全国网友都看傻了

支付宝突然更新,结果把全国网友都看傻了

锋潮评测
2024-04-29 16:39:22
爱之心养老公寓被诈骗老人诉七部门案二审遭驳回:无利害关系

爱之心养老公寓被诈骗老人诉七部门案二审遭驳回:无利害关系

澎湃新闻
2024-04-30 07:40:43
华为一季度实现营收1784.5亿元 净利润196.5亿元

华为一季度实现营收1784.5亿元 净利润196.5亿元

财联社
2024-04-30 17:46:14
安徽33岁农村网红每天直播吃肥肉, 吸粉800万, 如今老得像60岁

安徽33岁农村网红每天直播吃肥肉, 吸粉800万, 如今老得像60岁

鸿片剧制
2024-04-30 09:52:57
福瑞泰克何德何能与博世并列?挂羊头卖狗肉,变相地偷工减料?

福瑞泰克何德何能与博世并列?挂羊头卖狗肉,变相地偷工减料?

CAD画家
2024-04-30 07:00:10
高圆圆母女公园骑车,素颜状态爆棚,女儿Rhea扎双马尾似赵又廷

高圆圆母女公园骑车,素颜状态爆棚,女儿Rhea扎双马尾似赵又廷

柠檬有娱乐
2024-04-30 10:10:41
你的老师都做过什么惊为天人的事情?网友:从此全校的人惊为天人

你的老师都做过什么惊为天人的事情?网友:从此全校的人惊为天人

兰妮搞笑分享
2024-04-14 05:44:28
日元,崩了?!美日联手玩的金融战,夹击中国?

日元,崩了?!美日联手玩的金融战,夹击中国?

刘晓博说楼市
2024-04-29 17:53:48
16年湖南女子怀孕已6月,却被大姑姐暴打,当晚娘家上门教其做人

16年湖南女子怀孕已6月,却被大姑姐暴打,当晚娘家上门教其做人

朝暮书屋
2024-04-26 17:11:33
2024-04-30 20:42:44
机器之心Pro
机器之心Pro
专业的人工智能媒体
8947文章数 141898关注度
往期回顾 全部

科技要闻

华为一季度营收1784.5亿 净利196.5亿

头条要闻

博主称买到常州机场的无主行李箱 还坚称"绝不是剧本"

头条要闻

博主称买到常州机场的无主行李箱 还坚称"绝不是剧本"

体育要闻

穆雷,绝杀了一个时代

娱乐要闻

黄子韬被曝求婚徐艺洋 大量亲密照曝光

财经要闻

查道炯:中国经济的外部挑战与应对思考

汽车要闻

越野老炮最爱 哈弗新H9新增2.4T柴油机

态度原创

手机
教育
时尚
公开课
军事航空

手机要闻

华为Pura 70系列出国太好用了 出境易+天际通 五一出境游畅行无阻

教育要闻

TTS新传评论赏析:毕业论文必须手抄?批评式评论这么写!

老公姐、媳妇哥,抖音正在流行「性转夫妻」

公开课

父亲年龄越大孩子越不聪明?

军事要闻

以官员:以总理求助拜登阻止逮捕令

无障碍浏览 进入关怀版