网易首页 > 网易号 > 正文 申请入驻

速递|OpenAI和Anthropic的新战场:训练AI操作企业软件,成本年飙80亿美元

0
分享至


图片来源:U
nsplash

Anthropic、OpenAI 等人工智能开发公司正在让大型语言模型"上班办公"。

  • Anthropic计划投资10亿美元创建企业应用克隆体,OpenAI预计到2030年在数据相关成本上支出80亿美元(包括人类专家费用和训练场建设)。

  • Anthropic和OpenAI正在使用“强化学习环境”(模拟企业应用)训练AI模型操作各种专业软件(如Salesforce、Zendesk、Cerner),聘请领域专家(时薪最高250美元)示范任务执行。

  • 通过训练AI成为“虚拟同事”,未来可销售能自动操作企业应用的智能体,或开发新版企业软件,开辟新的盈利渠道。

这些AI 模型正在学习使用从 Salesforce 的客户关系管理软件到 Zendesk 的客户支持系统,再到 Cerner 的医疗记录应用等各种工具。其目的是教会 AI 如何处理白领工作者所面临的一些复杂任务。

这种训练模式与AI 模型以往的任何训练都不同。研究人员为 AI 提供模拟应用程序进行交互练习,同时聘请各领域专家向模型示范如何操作这些应用。

这些技术的成本并不低廉。据一位知情人士透露,Anthropic 高管内部讨论过未来一年将斥资 10 亿美元打造这些"企业应用克隆体"——也被称为强化学习环境或训练场。

雇佣生物学、软件编程和医学等领域的人类专家来教导模型学习新知识及办公软件操作,其成本也日益攀升。

OpenAI 今年早些时候预测,计划今年在数据相关成本上支出约 10 亿美元(包括支付人类专家费用和强化学习训练场),2030年这一数字将攀升至80亿美元。

若取得成功,这些AI 训练方法或能帮助 OpenAI 和 Anthropic 突破传统训练技术近期遭遇的部分局限 。这也可能为其开辟新的盈利途径——通过销售能接管用户电脑并代其操作应用的智能体等职场软件,或利用 AI 开发流行企业应用的新版本。

Anthropic 公司 CEO 达里奥·阿莫代伊公开形容这类产品为“虚拟协作者”,旨在与人类并肩工作并使用相同的应用程序。然而,这说起来容易做起来难。

据负责图灵公司前沿数据计划的安舒尔·巴吉介绍,教导人工智能在 Salesforce 中筛选潜在客户、识别最有希望的客户并发送跟进邮件预约介绍会议,除了掌握Salesforce之外,还需要学习使用LinkedInCalendlyGmail等应用程序。图灵公司致力于帮助谷歌和 Anthropic 等企业优化其模型 。

他表示,为验证任务完成情况,图灵会将整体任务分解为多个小步骤,并制定评估标准来检查AI 模型是否正确执行每个步骤。

在Salesforce 的案例中,这种评分标准可能包括多个检查点,例如验证模型是否按最后联系日期筛选了 Salesforce 数据库、发送了带有 Calendly 链接的电子邮件,并将潜在客户的线索状态更新为"重新接洽"。

这类工作尚处早期阶段,但人工智能实验室似乎准备投入大量资金。Anthropic 高级研究员向至少一位投资者透露,目前该公司用于训练后优化(即初始训练后改进模型的方法)的预算中,只有不到 10%用于强化学习环境。但早期成果令人鼓舞,研究人员表示如果这种趋势持续,到明年强化学习环境的投入可能占到训练后预算的更高比例。

一个原因是聘请人类专家的成本不断攀升。Labelbox 是为 OpenAI 等 AI 开发商提供专家的几家知名公司之一,该公司在 7 月份表示,其约 20%的专家承包商时薪超过 90 美元,近 10%的专家时薪超过 120 美元。

该公司预测,未来一年半内,这两类专家的薪酬将上涨至每小时150250美元。

“强化学习环境”

Turing公司首席执行官乔纳森·西达尔特表示,该公司已构建了1000多个强化学习训练场,包括AirbnbZendeskMicrosoft Excel的模拟环境。西达尔特称,公司会将这些强化学习环境连同 100 至 500 个样本任务一起出售给客户——这些任务可供 AI 模型在模拟应用中尝试,同时提供验证模型是否正确完成任务的方法。

最近几个月,Turing的竞争对手包括ScaleSurgeMercorInvisible Technologies也开始提供强化学习环境服务,包括配备设计应用程序任务的人类专家。同时还涌现了一批专门向大型AI开发商出售强化学习环境的新创企业。

Surge 创始人兼首席执行官陈爱文表示,OpenAI 和 Anthropic 改进模型的方法"反映了人类的学习方式"。他称强化学习训练场"就像生活在现实世界中"。

除了强化学习环境外,AI 开发者们还在持续训练模型处理精心筛选的难题解答示例,比如高难度编程竞赛题目或博士级生物学问题 。这些问答对随后会被用于强化学习过程,以教授模型掌握这些领域的新技能或知识。

然而,随着人工智能模型性能的提升,数据标注公司已不再限于招聘硕士和博士在读学生,转而聘请在特定领域拥有多年经验的专业人士。例如,Turing 公司已聘请了美国国家航空航天局的数据科学家、为能源部项目工作的化学家、放射科医学住院医师以及私募股权领域的副总裁,利用特定应用程序完成实际任务,供人工智能观摩学习。

Bhagi 举例说,某 AI 开发者可能希望教会其模型理解税率假设变动如何影响 Excel 文件中贴现现金流分析的其余部分。为此,Turing 会要求其承包商解决这个 DCF 问题,最终得出可用于验证准确性的单一答案,例如股票价格。

随后,AI 开发者可以让其模型尝试同样的 DCF 任务数十次,筛选出模型计算结果与人类专家股价一致的案例,并基于这些示例进行训练,Bhagi 解释道。这种方法使模型开发者能快速获得大量正确的任务样本来训练 AI。

包括OpenAI 在内的顶尖 AI 开发者如今正寻求从医学到法律等各行各业收集类似案例。据一位知情人士透露,今年早些时候,OpenAI 一位高管私下表示,他们预计"整个经济"将演变成某种"强化学习训练场"。这意味着 AI 可能会通过记录各领域专业人士在日常设备上的工作方式进行训练。

参考资料

https://www.theinformation.com/articles/anthropic-openai-developing-ai-co-workers?rc=rpuplc

编译:ChatGPT

我们正在招募新一期的实习生

我们正在寻找有创造力的00后创业

关于Z Potentials

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
纽约机场一副手铐,如何震碎了神秘富豪的3000亿“假央企”

纽约机场一副手铐,如何震碎了神秘富豪的3000亿“假央企”

一号位故事
2026-03-29 07:47:30
国足VS喀麦隆:黄政宇坐镇中场,韦世豪林良铭领衔,张玉宁冲锋

国足VS喀麦隆:黄政宇坐镇中场,韦世豪林良铭领衔,张玉宁冲锋

零度眼看球
2026-03-30 07:21:43
道达尔的下注已经说明了5月的油价

道达尔的下注已经说明了5月的油价

凯利经济观察
2026-03-29 14:26:05
中国的“性萧条”时代,正式到来了

中国的“性萧条”时代,正式到来了

律法刑道
2025-12-15 08:28:58
郭麒麟白嫖网红外卖媛!

郭麒麟白嫖网红外卖媛!

八卦疯叔
2026-03-28 09:58:03
96岁外婆每天桃酥配糖水,子女急得网上求助,结果全“翻车”了!

96岁外婆每天桃酥配糖水,子女急得网上求助,结果全“翻车”了!

叮当当科技
2026-03-29 15:04:51
筹资超2200亿元,比亚迪开启新一轮扩张

筹资超2200亿元,比亚迪开启新一轮扩张

新浪财经
2026-03-29 21:16:02
“不交出手机号,无法完整购物?”知名连锁店遭吐槽,店员透露:原因很无奈…

“不交出手机号,无法完整购物?”知名连锁店遭吐槽,店员透露:原因很无奈…

上观新闻
2026-03-29 15:36:06
俄乌战场传来血的教训,我们最先进的歼20,不能再抱着火箭弹不放

俄乌战场传来血的教训,我们最先进的歼20,不能再抱着火箭弹不放

安安说
2026-03-28 11:54:14
伊朗还能扛多久?法国专家算了笔账:再打两到四个月,问题不大

伊朗还能扛多久?法国专家算了笔账:再打两到四个月,问题不大

透视到底
2026-03-27 08:50:37
人很朴素!93年女未婚先孕,孩子出生58天,征有房有车男士引热议

人很朴素!93年女未婚先孕,孩子出生58天,征有房有车男士引热议

火山詩话
2026-03-27 09:46:14
警惕!公知正在悄悄换掉我们的价值观:三件事正在瓦解社会根基

警惕!公知正在悄悄换掉我们的价值观:三件事正在瓦解社会根基

云景侃记
2026-03-26 14:56:36
特斯拉官网新优惠上线,直降 8000 元!

特斯拉官网新优惠上线,直降 8000 元!

花果科技
2026-03-29 10:31:58
1996年, 施瓦辛格在家中无事,和35岁200斤女佣发生不当关系

1996年, 施瓦辛格在家中无事,和35岁200斤女佣发生不当关系

南权先生
2026-01-20 15:49:53
伊朗最高领袖最新发声

伊朗最高领袖最新发声

第一财经资讯
2026-03-30 07:29:44
2020年女子当众扇儿子耳光,儿子直接跳楼,如今女子已自杀身亡

2020年女子当众扇儿子耳光,儿子直接跳楼,如今女子已自杀身亡

观察鉴娱
2026-03-18 09:09:10
无耻至极!用男性身体闯女性赛场,还好意思喊不公?!

无耻至极!用男性身体闯女性赛场,还好意思喊不公?!

柚子说球
2026-03-29 10:31:15
被关821天无罪,国家赔偿启动后被叫停,警方以骗贷为由再立案

被关821天无罪,国家赔偿启动后被叫停,警方以骗贷为由再立案

千千法言
2026-03-28 20:00:46
“专科男生古茗8小时”事件,被全网嘲笑:无知的人连装都不会装

“专科男生古茗8小时”事件,被全网嘲笑:无知的人连装都不会装

妍妍教育日记
2026-02-26 20:37:12
许家印遭受最大亏损的三个项目分别是什么?

许家印遭受最大亏损的三个项目分别是什么?

混沌录
2026-03-21 15:41:07
2026-03-30 07:55:00
ZPotentials
ZPotentials
我们与Z Potentials同频共振
71文章数 1关注度
往期回顾 全部

科技要闻

马斯克承认xAI"建错了",11位创始人均离职

头条要闻

伊朗外交部发言人:美国提出的建议非常极端且不合理

头条要闻

伊朗外交部发言人:美国提出的建议非常极端且不合理

体育要闻

绝杀卫冕冠军后,他单手指天把胜利献给父亲

娱乐要闻

汪峰定律再现!李荣浩喊话单依纯侵权

财经要闻

油价冲击,有些亚洲货币先扛不住了!

汽车要闻

岚图泰山X8配置曝光 四激光雷达/华为新一代座舱

态度原创

家居
教育
游戏
公开课
军事航空

家居要闻

曲线华尔兹 现代简约

教育要闻

来上课了——高考阅读难题大综合(细节+主旨+含义)(下)第4段

粉丝制作《生化危机》六女神婚纱照 都很美!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美两栖攻击舰载3500名增援到达

无障碍浏览 进入关怀版