网易首页 > 网易科技 > 网易科技 > 正文

本科生已不够,AI公司雇佣各领域专家训练大模型

0
分享至

9月29日消息,人工智能模型的性能在很大程度上依赖于其训练数据的质量。传统方法通常是雇用大量低成本劳动力对图像、文本等数据进行标注,以满足模型训练的基本需求。然而,这种方式容易导致模型在理解和生成信息时出现“幻觉”现象,即生成不准确或误导性的信息。为了解决这一问题,许多初创公司如今更倾向于聘请拥有高学历和专业背景的专家来参与模型训练,确保训练数据的准确性和深度,从而提升模型的整体表现。

以下为翻译全文:

早年,像ChatGPT及其竞争对手Cohere等人工智能模型要生成类似人类的反应,需要依赖大量低成本的人力团队,帮助模型区分基本事实,比如一张图像是汽车还是胡萝卜。

然而,随着竞争愈发激烈,对人工智能模型的升级已转变为一项高复杂度的专业任务,如今需要一个快速扩展的专业训练师网络。这些训练师涵盖从历史学家到科学家等专业人才,有些甚至拥有博士学位。

Cohere联合创始人Ivan Zhang在谈到其内部训练师队伍的变化时表示:“一年前,我们还可以雇佣本科生来大致教AI如何改进。而现在,我们有执业医师教模型如何在医疗环境中工作,还有金融分析师和会计师帮助模型在特定领域表现更好。”

为提升培训能力,估值已超50亿美元的Cohere与一家名为Invisible Tech的初创公司合作。Cohere是OpenAI的主要竞争对手之一,专注于为企业提供AI服务。

初创公司Invisible Tech雇佣了数千名远程培训师,并已成为AI行业的主要合作伙伴之一,为包括AI21和微软在内的多家人工智能公司提供训练服务,帮助减少被称为“幻觉”的AI错误现象。Invisible创始人弗朗西斯·佩德拉萨(Francis Pedraza)表示:“我们在全球100多个国家拥有5000多名具有博士、硕士学位及深厚专业知识的专家。”

根据任务的复杂程度和工作地点,Invisible的时薪最高可达40美元。其他公司如Outlier支付的时薪高达50美元,而Labelbox则为像量子物理这样的“高专业性”科目提供高达200美元的时薪,基础类任务起步价为15美元。

Invisible成立于2015年,最初主要为DoorDash等公司提供工作流程自动化服务,比如将外卖菜单数字化。然而,转折点出现在2022年春季,在ChatGPT公开发布前,OpenAI主动寻求与Invisible合作。

佩德拉萨回忆道:“OpenAI遇到了一个问题,早期版本的ChatGPT在回答问题时容易陷入‘幻觉’,其答案不可靠。为此,他们需要一个能够通过人类反馈来强化AI学习的先进训练伙伴。”

生成式人工智能依赖过去用于训练的数据生成新内容。然而,有时它无法区分真假信息,产生所谓的“幻觉”。一个例子发生在2023年,当时谷歌的聊天机器人在宣传视频中分享了关于哪个望远镜首次拍摄到太阳系外行星的不准确信息。

AI公司意识到,“幻觉”现象可能会影响生成式人工智能在商业领域的吸引力,因此他们正在尝试各种方法减少这种现象,其中包括利用人类训练师来教导AI区分事实与虚构。

自与OpenAI合作以来,Invisible迅速成为众多生成式AI公司的首选培训伙伴,其客户包括Cohere、AI21和微软等。尽管微软尚未正式确认合作关系,但Cohere和AI21已承认是Invisible的大客户。

佩德拉萨指出:“在人工智能行业,培训成本是企业的第二大支出,仅次于算力。而高质量的培训对于确保模型的准确性和可靠性至关重要。”

它是如何工作的?

OpenAI的生成式人工智能热潮背后有一个名为“人类数据团队”的团队支持。该团队与AI训练师合作,收集专业数据以训练ChatGPT等模型。

熟悉该公司流程的知情人士透露,OpenAI的研究人员设计了一系列实验,旨在解决诸如减少“幻觉”、优化写作风格等问题。他们与Invisible等供应商的AI训练师合作,根据需求收集和处理数据。

上述知情人士说,在任何时候,同时进行的实验项目都可能多达数十项,这些项目有的可以采用OpenAI的自研工具,也可以使用供应商提供的解决方案。

Invisible会根据AI公司的需求,雇佣具有相关学科背景的专家,无论是研究瑞典历史的学者还是金融建模专家,都可以为这些AI项目贡献力量,帮助减少AI公司管理大量训练师的负担。

佩德拉萨表示:“OpenAI拥有世界顶尖的计算机科学家,但他们不一定精通瑞典历史、化学或生物等专业领域的问题。”他补充说,仅OpenAI就有超过1000名合同工为其提供数据标注服务。

Cohere的Ivan Zhang亲自体验了Invisible训练师的能力,并成功教会Cohere的生成式AI模型如何从大数据集中提取相关信息。

竞争加剧

在AI训练数据集领域,Scale AI是Invisible的主要竞争对手。这家私营初创公司估值达140亿美元,不仅提供数据集服务,还开始为AI公司提供培训服务,并将OpenAI列为其客户之一。Scale AI没有回应置评请求。

相比之下,Invisible的资金募集显得更为保守,自2021年起开始盈利,仅获得了800万美元的主要资本。佩德拉萨表示:“我们70%的股权归团队所有,30%的股权归投资者。”他还透露,最近的公司估值已达5亿美元。

最早进入AI训练领域的培训师主要通过从事数据标注工作,要求相对较低,因此报酬也较低,有时每小时薪酬低至2美元,主要由非洲和亚洲国家的劳动者完成。

然而,随着AI技术的快速发展,对专业培训师的需求急剧上升,涵盖数十种语言和领域,创造了一个高薪利基市场。如今,来自各个学科的专家无需编程技能,也有机会成为AI培训师。

AI公司的需求正催生出更多提供类似服务的企业。Ivan Zhang说:“我的收件箱几乎被不断涌现的新公司所淹没,这些公司纷纷涌入人工智能训练服务市场。这的确是一个全新的领域,公司雇佣人类只是为了给我们这样的人工智能实验室创造数据。”(小小)

延伸阅读
相关推荐
热点推荐
微胖姐姐一身旗袍装时尚有型,开叉露腿显舒展,散发十足女人味

微胖姐姐一身旗袍装时尚有型,开叉露腿显舒展,散发十足女人味

小乔古装汉服
2025-12-14 18:37:27
“牡丹花下死,做鬼也风流”,这一次,74岁的张纪中彻底成了笑话

“牡丹花下死,做鬼也风流”,这一次,74岁的张纪中彻底成了笑话

洲洲影视娱评
2025-12-08 19:52:00
越南方面传出惊人消息日本已退出了越南的宁顺2号重大核电站项目

越南方面传出惊人消息日本已退出了越南的宁顺2号重大核电站项目

忠于法纪
2025-12-14 17:18:07
手机壳爱马仕一年狂卖36亿,凭什么成为年轻人追捧的轻奢新宠?

手机壳爱马仕一年狂卖36亿,凭什么成为年轻人追捧的轻奢新宠?

大眼瞄世界
2025-12-01 10:38:20
翁帆面相开始变了,字字不提杨振宁,却句句戳进自己的心窝里

翁帆面相开始变了,字字不提杨振宁,却句句戳进自己的心窝里

林子说事
2025-12-13 14:56:04
模特小姐姐白色短款T恤搭配蓝色高腰瑜伽裤,让你美出新高度

模特小姐姐白色短款T恤搭配蓝色高腰瑜伽裤,让你美出新高度

小乔古装汉服
2025-12-14 18:50:51
扎哈罗娃回怼欧盟涉俄提议:离开地球吧,俄方可提供火箭

扎哈罗娃回怼欧盟涉俄提议:离开地球吧,俄方可提供火箭

环球网资讯
2025-12-13 21:46:49
他因病不满足军衔晋升,45岁开始离休,休养了整整45年,享年90岁

他因病不满足军衔晋升,45岁开始离休,休养了整整45年,享年90岁

抽象派大师
2025-12-14 18:19:12
佩通坦访问柬埔寨时,在洪森家中举行晚宴后留下的照片。

佩通坦访问柬埔寨时,在洪森家中举行晚宴后留下的照片。

南权先生
2025-12-13 16:50:24
Space X的护城河

Space X的护城河

华尔街见闻官方
2025-12-14 18:56:27
成堆外国人尸体散落战场,乌军7万女兵杀进战场:女子敢死队反击

成堆外国人尸体散落战场,乌军7万女兵杀进战场:女子敢死队反击

阿伧说事
2025-12-04 05:25:51
自绝后路不到24小时,范曾担心的事发生,遭殃的何止小50岁的娇妻

自绝后路不到24小时,范曾担心的事发生,遭殃的何止小50岁的娇妻

阿纂看事
2025-12-12 10:08:39
2025年收官在即,开始走十年大运的三个星座,机会正在向你靠近

2025年收官在即,开始走十年大运的三个星座,机会正在向你靠近

小晴星座说
2025-12-14 17:31:43
高二女生偷尝禁果:在校产子,孩子父亲的身份披露后震惊所有人

高二女生偷尝禁果:在校产子,孩子父亲的身份披露后震惊所有人

米米大肉
2023-12-17 12:30:31
40亿资产留给独子!范曾内心早已看透一切,一家三口温馨甜蜜

40亿资产留给独子!范曾内心早已看透一切,一家三口温馨甜蜜

林雁飞
2025-12-13 18:06:17
白岩松力挺“最快女护士”,呼吁医院把她调到工会,应鼓励她参赛

白岩松力挺“最快女护士”,呼吁医院把她调到工会,应鼓励她参赛

米修体育
2025-12-14 17:02:00
郑丽文掀桌子,向大陆紧急交底,国民党最大毒瘤曝光,内外夹击?

郑丽文掀桌子,向大陆紧急交底,国民党最大毒瘤曝光,内外夹击?

冷夜说
2025-12-14 11:29:04
25-21!这就是伦纳德的改变,快船是否交易他已有答案

25-21!这就是伦纳德的改变,快船是否交易他已有答案

奕辰说球
2025-12-13 23:11:55
窦骁香港参加帆船赛被偶遇!包成这样还挡不住星味,太抢眼了

窦骁香港参加帆船赛被偶遇!包成这样还挡不住星味,太抢眼了

今古深日报
2025-12-14 11:49:30
何晴追悼会细节曝光!不公开对外吊唁,工人曝暖心细节,并鼓励他

何晴追悼会细节曝光!不公开对外吊唁,工人曝暖心细节,并鼓励他

裕丰娱间说
2025-12-14 16:18:47
2025-12-14 20:00:49

科技要闻

当人形机器人有了App Store,宇树在赌什么

头条要闻

何晴唯一儿子已从中戏毕业 不久前和父亲合体亮相杂志

头条要闻

何晴唯一儿子已从中戏毕业 不久前和父亲合体亮相杂志

体育要闻

马刺终结雷霆:以勇猛,以文班亚马

娱乐要闻

何晴生前最大谣言!没有再婚嫁廖京生

财经要闻

重大违法强制退市!10人被判刑

汽车要闻

硬核敞篷巴士?掷弹兵Game Viewer 2026年初量产

态度原创

数码
亲子
本地
游戏
公开课

数码要闻

百信太行国产台式机新品发布量产,搭载麒麟9000X处理器

亲子要闻

胳膊和腿抖一年了什么原因 怎么办

本地新闻

云游安徽|阜阳三朝风骨,传承千年墨香

《如龙》系列20周年纪念 已有玩家与桐生一马“结婚”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×