网易首页 > 网易号 > 正文 申请入驻

AI圈公开的秘密:天下模型一大抄

0
分享至

作者:卜淑情

来源:硬AI

抄袭已经成为AI世界公开的秘密。

据The Information周一的文章,许多初创公司的AI聊天机器人很可能是采用了OpenAI和其他公司的数据开发的。这些机器人在某些任务上可以媲美GPT-4,但收费只是后者的一小部分。

初创公司在开发过程中没有披露使用OpenAI的技术。不过,The Information报道称,OpenAI首席执行官Sam Altman去年夏天告诉初创公司创始人,可以接受初创公司以这种方式使用OpenAI的技术。

虽然Altman的回应让一些初创公司松了一口气,但这种做法实质上损害了OpenAI的增长,Altman随时可能改变主意。

在初创公司中,抄袭已成常态

初创公司抄袭OpenAI的具体做法是,先开通GPT-4的会员,然后向它提出一系列问题,例如“这行代码有什么问题?”他们使用这些问题和答案来训练自己的竞品模型。

采取这一策略的初创公司不在少数。

Unsloth AI联合创始人Daniel Han估计,他大约一半的客户从GPT-4或Anthropic的Claude模型中获取数据,并用它来改进自己的模型。许多公司也从ShareGPT获得此类数据,ShareGPT是一个开发人员分享使用OpenAI模型生成答案的网站。

小型开发商的模型通常基于Meta Platforms或Mistral AI免费提供的流行开源模型,但通过融合OpenAI模型的答案,可以显著提高这些模型输出内容的质量。Han表示,一些开发人员正在使用一项名为OpenPipe的服务来自动化这一过程。

“在一个尚未建立明确规则的新生态系统中,就会发生这种情况,”Menlo Ventures董事总经理Matt Murphy表示,该公司投资了OpenAI的竞争对手Anthropic。Murphy说:

如果大家都使用相同的数据,你怎么能比其他人更出色呢?

目前尚不清楚OpenAI、谷歌、Anthropic和其他大型开发商会在多大程度上允许初创对手利用他们的数据进行追赶。

Radical Ventures合伙人Rob Toews表示:

AI模型的训练数据的质量和来源正成为最重要的热点问题之一。没有人确切知道事情将如何发展,但任何没有对(数据来源)进行周密和战略考虑的AI初创公司都在落后。

如果那些在开发模型时暗中依赖其他AI服务的开发商被曝光,它们可能会面临尴尬的处境。

比如,总部位于巴黎的Mistral使用Meta的开源AI 模型Llama 2创建了自己的AI,但直到无意泄露才披露这一事实,引起了一些开发者的不满。Mistral已经筹集了数亿美元的资金。

大公司也一样?

实际上,初创公司利用OpenAI数据训练模型的做法,与OpenAI等AI巨头的做法并无二致。

OpenAI首席技术官Mira Murati上个月在回答有关该公司是否使用谷歌旗下YouTube以及Meta Platforms旗下Facebook和Instagram的数据来训练生成AI视频的Sora时表现出了犹豫和困惑。

如果OpenAI真的使用了这些数据,也不足为奇。

据《纽约时报》最近的报道,OpenAI创建了一个名为Whisper的语音识别工具,用于转录YouTube视频,以此来改进GPT-4。此前,也有媒体曾报道称,OpenAI暗中使用YouTube数据训练其早期的AI模型。

就在本月早些时候,YouTube CEO Neal Mohan还表示,他不赞成OpenAI使用YouTube视频来开发像Sora这样的文生视频模型。

这种行为也导致OpenAI招致了侵权官司。《纽约时报》公司去年12月起诉OpenAI及其最大支持者微软,指控他们在训练模型时非法复制了该报的新闻文章。诉讼称,OpenAI的聊天机器人“可以逐字逐句地生成时报内容”。

作为回应,OpenAI辩称,它已努力与新闻出版商建立合作关系,其训练做法属于美国版权原则“合理使用”所允许的范围。

尽管如此,OpenAI和谷歌都与Axel Springer等出版商达成了数百万美元的许可协议,并与Reddit等主要网站达成了更大的交易。

即使是科技巨头也难以抗拒捷径的诱惑。

The Information报道称,谷歌曾转录YouTube视频,Meta雇佣承包商总结受版权保护的书籍,Adobe使用Midjourney的AI生成照片,均是为了训练自家AI模型。一位谷歌工程师因担忧公司使用OpenAI的ChatGPT数据而辞职。

初创公司Lamini的CEO Sharon Zhou表示,AI开发的快速步伐和激烈竞争迫使开发者求助于有争议的训练数据来源,如受版权保护的内容或LLM。

Zhou说:

在这个领域,投资者需要看到非常快的进展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
49岁大妈有5位情人,还结交了52岁情夫,二人联合将丈夫杀害

49岁大妈有5位情人,还结交了52岁情夫,二人联合将丈夫杀害

胖胖侃咖
2024-04-28 08:00:10
“咬死”ASML,禁止维修光刻机只是开始,轮到中国工程师头疼了!

“咬死”ASML,禁止维修光刻机只是开始,轮到中国工程师头疼了!

搞笑的阿票
2024-04-29 20:48:46
和外国壮男结婚是什么样的体验?网友:婚后好几次,我都受不了了

和外国壮男结婚是什么样的体验?网友:婚后好几次,我都受不了了

户外阿崭
2024-04-28 20:58:20
厉害!伊能静为秦昊新剧宣传发文堪称百万文案,她能不能教教大S

厉害!伊能静为秦昊新剧宣传发文堪称百万文案,她能不能教教大S

小村民
2024-04-28 12:13:28
限期停用!无锡重要公告!

限期停用!无锡重要公告!

江南晚报
2024-04-29 17:31:59
重庆好色院长包养20名情妇,案发后,竟因一本日记被判十二年

重庆好色院长包养20名情妇,案发后,竟因一本日记被判十二年

朝暮书屋
2024-04-24 16:57:00
英超最快VAR复核引发热议:裁判在3米外看不到犯规 仍需VAR提醒才判点球

英超最快VAR复核引发热议:裁判在3米外看不到犯规 仍需VAR提醒才判点球

雷速体育
2024-04-29 10:48:14
发生关系时,男人戴避孕套那几十秒,女人心里在想什么?

发生关系时,男人戴避孕套那几十秒,女人心里在想什么?

绘世纪实
2024-04-28 16:54:35
中国绝不允许!为解除35万亿美债危机,美国想复制亚洲金融风暴?

中国绝不允许!为解除35万亿美债危机,美国想复制亚洲金融风暴?

北向财经
2024-04-29 13:26:05
纳达尔:网坛没啥变化,德约去年拿3个大满贯!对阿卡和辛纳颇失望

纳达尔:网坛没啥变化,德约去年拿3个大满贯!对阿卡和辛纳颇失望

开心体育站
2024-04-30 02:14:44
格雷茨卡:踢皇马不同于踢阿森纳 皇马能在没机会的情况下进2球

格雷茨卡:踢皇马不同于踢阿森纳 皇马能在没机会的情况下进2球

直播吧
2024-04-29 04:02:29
连雅迪生意都抢?比亚迪向“小电驴”下手,续航1000里堪比汽车

连雅迪生意都抢?比亚迪向“小电驴”下手,续航1000里堪比汽车

胖福的小木屋
2024-04-29 15:32:20
纪云浩前途尽毁!涉嫌学历造假、荣誉造假,父亲身份疑似遭曝光

纪云浩前途尽毁!涉嫌学历造假、荣誉造假,父亲身份疑似遭曝光

叶公子
2024-04-24 20:45:23
解放前,一侦查员将被处决,房东送断头饭时悄声道:这饭要仔细吃

解放前,一侦查员将被处决,房东送断头饭时悄声道:这饭要仔细吃

百年历史老号
2024-04-25 19:23:29
董宇辉河南博物院搞直播,让游客在外排队等50分钟?馆方:没有禁入,预约好的都能进

董宇辉河南博物院搞直播,让游客在外排队等50分钟?馆方:没有禁入,预约好的都能进

上游新闻
2024-04-29 14:32:57
在业界就做了两周年!幼态容颜和傲人胸围的安达夕莉宣布引退!

在业界就做了两周年!幼态容颜和傲人胸围的安达夕莉宣布引退!

日本这些事儿
2024-04-29 10:42:21
俄罗斯军队在乌克兰遇到的问题比损失坦克更大:基层军官损失惨重

俄罗斯军队在乌克兰遇到的问题比损失坦克更大:基层军官损失惨重

零度Military
2024-03-17 20:51:12
金城武路人照曝光,昔日大帅哥惨变大叔

金城武路人照曝光,昔日大帅哥惨变大叔

港叔
2024-04-29 10:51:12
因害怕乌克兰无人机攻击,俄罗斯几十年来首次取消胜利日大阅兵?

因害怕乌克兰无人机攻击,俄罗斯几十年来首次取消胜利日大阅兵?

不掉线电波
2024-04-28 12:41:59
比尔合同剩3年1.61亿且有交易否决权 下赛季开始每年5000万+

比尔合同剩3年1.61亿且有交易否决权 下赛季开始每年5000万+

直播吧
2024-04-29 13:15:05
2024-04-30 05:54:44
华尔街见闻官方
华尔街见闻官方
中国领先的金融商业信息提供商
110076文章数 2634236关注度
往期回顾 全部

科技要闻

马斯克收获大礼,李彦宏梅开二度?

头条要闻

周鸿祎近10天里热搜不断 背后是360市值蒸发4000多亿

头条要闻

周鸿祎近10天里热搜不断 背后是360市值蒸发4000多亿

体育要闻

足球童话!执教16年,从业余联赛到德甲

娱乐要闻

田馥甄遭抵制,蔡依林却能稳稳捞金?

财经要闻

建信人寿巨亏40亿 部分产品退保率93%

汽车要闻

配置更丰富 静态体验2024款欧拉好猫

态度原创

数码
健康
本地
房产
手机

数码要闻

Counterpoint:预计 2024 年华为鸿蒙手表国内市场份额达 61%

春天野菜不知不识莫乱吃

本地新闻

食味印象 | 潍坊:碳水脑袋的人间乐园

房产要闻

拆迁致富成过去式?广州旧改探索新出路

手机要闻

传三星因成本原因放弃在下一代旗舰机中采用更大的电池和更快的充电速度

无障碍浏览 进入关怀版