网易首页 > 网易科技 > 网易科技 > 正文

速度放缓!OpenAI新旗舰模型进步幅度没那么大

0
分享至

11月11日消息,尽管使用聊天机器人ChatGPT等人工智能产品的人数在激增,但支撑这些技术的底层模块的改进速度似乎正在放缓。为此,ChatGPT的开发者OpenAI正在开发新技术,以增强大语言模型等核心模块,从而应对这一挑战。

OpenAI即将推出的旗舰模型“猎户座”(Orion)所面临的挑战突显了公司当前遇到的难题。今年5月,OpenAI首席执行官萨姆·奥特曼(Sam Altman)在内部透露,他预计正在训练中的猎户座将显著优于一年前发布的上一代旗舰模型。据知情人士称,尽管猎户座的训练进度仅完成20%,但其智能和任务完成能力已与GPT-4不相上下。

不过,一些使用或测试过猎户座的OpenAI员工表示,尽管其性能确实超越了前代模型,但提升幅度远不及从GPT-3到GPT-4的跃升。一些研究人员指出,猎户座在处理特定任务时未必稳定优于前代模型。一位员工表示,猎户座在语言任务上表现出色,但在编码等任务中可能不如之前的模型。这种情况可能会带来问题,因为与OpenAI近期发布的其他模型相比,猎户座在数据中心的运行成本更高。

猎户座的表现正在考验人工智能领域的核心假设——缩放定律,即只要数据量和计算能力持续增加,大语言模型就能不断改进。面对GPT改进速度放缓带来的挑战,业界似乎正将重点转向初始训练后的模型优化,这可能会产生一种新的缩放定律。

Facebook母公司Meta首席执行官马克·扎克伯格(Mark Zuckerberg)在内的一些科技领袖认为,即使在技术未能进一步突破的最坏情况下,基于当前技术仍然有很大的开发空间来创建面向消费者和企业的产品。

OpenAI正在应对竞争对手Anthropic的威胁,将更多的代码编写功能嵌入其模型中,并开发能够模拟人类操作计算机的软件,以完成涉及浏览器和应用程序操作的白领任务,如点击、光标移动和文本输入等。

这些产品属于能够执行多步骤任务的AI代理范畴,其革命性可能与ChatGPT的首次发布相当。

扎克伯格、奥特曼及其他人工智能开发者的高管表示,他们尚未触及传统缩放定律的极限。也因此,包括OpenAI在内的公司依旧投资数十亿美元建设数据中心,以尽可能提高预训练模型的性能。

然而,OpenAI研究员诺姆·布朗(Noam Brown)在上月的TEDAI大会上提出警告,认为开发更先进的模型可能在经济上变得不可持续。他表示:“我们真的会投入数千亿甚至万亿美元来训练模型吗?缩放模式在某个时刻会失效。”

在公开发布猎户座之前,OpenAI仍需完成复杂的安全测试。据员工透露,猎户座可能会在明年初发布,并可能放弃传统的“GPT”命名方式,以突显大语言模型改进的新特性。对此,OpenAI发言人未予置评。

数据匮乏成为模型训练的瓶颈

OpenAI的员工和研究人员指出,GPT进步放缓的原因之一在于高质量文本和其他数据的供应日益减少。大语言模型在预训练阶段需要这些数据来理解世界和不同概念之间的关系,以解决如撰写博文或修复编码错误等问题。

近年来,大语言模型主要依赖于网站、书籍等来源的公开文本数据进行预训练,但开发者已几乎耗尽了这类数据的潜力。为此,OpenAI组建了由曾负责预训练的尼克·赖德(Nick Ryder)领导的基础团队,致力于研究如何应对数据短缺问题,并探索缩放定律的持续适用性。

据OpenAI员工透露,猎户座部分使用了由其他OpenAI模型(如GPT-4和最近发布的推理模型)生成的AI数据进行训练。然而,这种合成数据也带来了新问题,可能导致猎户座在某些方面与前代模型过于相似。

OpenAI的研究人员正在利用其他工具,通过改进特定任务的处理方式来优化模型后期的表现。他们采用一种称为强化学习的方法,让模型从大量已正确解决的问题中学习,如数学和编码问题。

此外,研究人员还邀请人类评估员在编码或问题解决任务上测试预训练模型,并对其答案进行评分,这有助于研究人员调整模型,使其在写作和编码等请求上的表现更佳。这一过程称为带有人类反馈的强化学习,也曾帮助过早期的AI模型改进。

OpenAI及其他AI开发商通常依赖初创公司,如Scale AI和Turing,来管理成千上万名承包商,以处理这些评估工作。

OpenAI还开发了一种名为o1的推理模型,该模型在回答前会花费更多时间“思考”训练数据,这一过程称为测试时间计算。这意味着,即使不改变底层模型,给o1分配更多计算资源,也可以持续提高其响应质量。据知情人士透露,即使底层模型改进速度较慢,若OpenAI能保持持续改进,仍然可以实现更好的推理效果。

“这为模型扩展开辟了新维度,”布朗在TED大会上说。他补充道,研究人员可以通过“每次查询成本从1美分提高到10美分”来提升模型响应质量。

奥特曼也强调了推理模型的重要性,认为它可与大语言模型结合使用。“我希望推理能力能够解锁我们多年未能实现的突破,比如让模型在科学研究和复杂代码编写中做出贡献,”奥特曼在一场应用开发者活动中表示。

在最近接受Y Combinator首席执行官陈嘉兴(Garry Tan)采访时,奥特曼透露:“我们基本上知道如何实现通用人工智能——一种能达到人类能力的技术,其中一部分是创造性地运用现有模型。”

数学家和科学家们表示,o1对他们的研究工作有帮助,能作为合作伙伴提供反馈和启发。然而,据两位知情员工透露,由于o1的价格是非推理模型的六倍,因此其客户基础尚未普及。

突破瓶颈,提升推理能力

一些对AI开发商投资数千万美元的投资者疑虑大语言模型的改进速度是否开始趋于平稳。

风险投资家本·霍洛维茨(Ben Horowitz)在YouTube一段视频中表示:“我们正以相同的速度增加训练AI的图形处理单元,但在智能提升方面未见显著改善。”霍洛维茨的风投公司不仅是OpenAI的股东,还投资了Mistral和Safe Superintelligence等竞争对手。

霍洛维茨的同事马克·安德森(Marc Andreessen)在同一视频中指出:“许多聪明人在致力于突破瓶颈,探索如何提升推理能力。”

企业软件公司Databricks联合创始人兼主席伊翁·斯托伊卡(Ion Stoica)表示,大语言模型在某些方面可能已趋于稳定,但在其他领域仍有改进空间。他还开发了一个网站,供应用开发者评估不同的大语言模型。

斯托伊卡称,尽管AI在编码和解决复杂问题上不断进步,但在执行通用任务(如分析文本情感或描述医疗症状)时,进展似乎放缓。

“在常识性问题上,我们似乎看到大语言模型的表现趋于平稳。为实现进一步突破,我们需要更多的事实性数据,而合成数据帮助有限。”(小小)

延伸阅读
相关推荐
热点推荐
周润发1.95亿出售山顶豪宅,外景曝光得天独厚,降价2500万仍赚钱

周润发1.95亿出售山顶豪宅,外景曝光得天独厚,降价2500万仍赚钱

南城无双
2024-12-09 14:10:42
日本研究:红薯能杀死98%的癌细胞,还能降血糖?是科学还是谣言

日本研究:红薯能杀死98%的癌细胞,还能降血糖?是科学还是谣言

奇妙的本草
2024-12-07 18:00:02
美国不卖,中国也不买!高端芯片中美终于实现了“分道扬镳”

美国不卖,中国也不买!高端芯片中美终于实现了“分道扬镳”

Thurman在昆明
2024-12-09 16:47:28
叙利亚会进入黑罩袍时代吗?

叙利亚会进入黑罩袍时代吗?

听心堂
2024-12-09 09:23:31
西媒:“2025计划”或引发“第二次美国革命”

西媒:“2025计划”或引发“第二次美国革命”

参考消息
2024-12-08 17:25:10
小心!真的会炸!很多家庭都在用!千万注意——

小心!真的会炸!很多家庭都在用!千万注意——

BRTV新闻
2024-12-07 22:45:58
同事间的贫富差距有多离谱,网友:整个公司,就我骑电动车上班

同事间的贫富差距有多离谱,网友:整个公司,就我骑电动车上班

小未泡沫
2024-12-08 17:47:05
德国实验室开始为被新冠“疫苗”伤害的人提供检测

德国实验室开始为被新冠“疫苗”伤害的人提供检测

老佛爷Wu
2024-12-07 08:20:33
“最美书包”火了,价值“无价”,网友:有钱也难买到

“最美书包”火了,价值“无价”,网友:有钱也难买到

布谷妈妈
2024-12-06 20:55:07
太突然!来广营知名4S店发布公告!

太突然!来广营知名4S店发布公告!

来广营邻友圈
2024-12-09 14:20:21
长期以来我们对俄乌战争的一些错误认识

长期以来我们对俄乌战争的一些错误认识

不死好鸟
2024-12-09 08:43:54
美媒:伊朗驻叙大使警告称,阿萨德政权被推翻的后果将超出“美国控制范围”

美媒:伊朗驻叙大使警告称,阿萨德政权被推翻的后果将超出“美国控制范围”

环球网资讯
2024-12-09 12:41:37
叛军公布在宫殿中缴获的阿萨德照片,向叙第三大城市霍姆斯推进

叛军公布在宫殿中缴获的阿萨德照片,向叙第三大城市霍姆斯推进

桂系007
2024-12-06 05:19:56
俄罗斯撤军求助土耳其!失去叙利亚,俄罗斯能源战略未来或遭重创

俄罗斯撤军求助土耳其!失去叙利亚,俄罗斯能源战略未来或遭重创

鹰眼Defence
2024-12-09 16:36:59
历史给了香港50年风口,只不过自己把路走窄了!

历史给了香港50年风口,只不过自己把路走窄了!

谈芯说科技
2024-12-08 22:31:40
叙利亚阿萨德政权结束,对中国来说意味着什么?

叙利亚阿萨德政权结束,对中国来说意味着什么?

解筱文
2024-12-09 00:09:32
《我是刑警》大结局:顾局被判15年,秦川被调走,是偶然也是必然

《我是刑警》大结局:顾局被判15年,秦川被调走,是偶然也是必然

草本纪年
2024-12-09 13:23:13
发生了什么?一则重磅来袭,A50直线飙升,港股地产公司走强

发生了什么?一则重磅来袭,A50直线飙升,港股地产公司走强

数据宝
2024-12-09 16:19:00
琼瑶儿媳妇发飙了,疑正面刚平鑫涛三子女!

琼瑶儿媳妇发飙了,疑正面刚平鑫涛三子女!

每日新鲜事吖
2024-12-09 09:37:44
大V:阿萨德爷俩用50年把叙利亚干到了赤贫状态,评论区:责任全在美国

大V:阿萨德爷俩用50年把叙利亚干到了赤贫状态,评论区:责任全在美国

不掉线电波
2024-12-09 14:29:34
2024-12-09 17:35:00

科技要闻

马云罕见演讲:AI改变一切 但不能决定一切

头条要闻

琼瑶离世留"10亿巨额版权" 儿媳何琇琼发布10字声明

头条要闻

琼瑶离世留"10亿巨额版权" 儿媳何琇琼发布10字声明

体育要闻

30岁临时工被裁员 NBA的人情与现实

娱乐要闻

尖叫之夜,明星们的小心思全照出来了

财经要闻

半导体新攻防

汽车要闻

保时捷经销商精简背后 是战略升级

态度原创

亲子
家居
手机
艺术
房产

亲子要闻

妹妹趴在哥哥身上玩哥哥脸蛋,发现被拍后 笑得天真烂漫

家居要闻

逸韵雅居 打造闲适的空间氛围

手机要闻

科技一周大事(12 月 2 日-8日):苹果自研 5G 基带有望明年登场

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

房产要闻

聚力・向前|网易房产年末特别策划:2024房产大事记

无障碍浏览 进入关怀版
×