网易首页 > 网易号 > 正文 申请入驻

AI圈公开的秘密:天下模型一大抄

0
分享至

作者:卜淑情

来源:硬AI

抄袭已经成为AI世界公开的秘密。

据The Information周一的文章,许多初创公司的AI聊天机器人很可能是采用了OpenAI和其他公司的数据开发的。这些机器人在某些任务上可以媲美GPT-4,但收费只是后者的一小部分。

初创公司在开发过程中没有披露使用OpenAI的技术。不过,The Information报道称,OpenAI首席执行官Sam Altman去年夏天告诉初创公司创始人,可以接受初创公司以这种方式使用OpenAI的技术。

虽然Altman的回应让一些初创公司松了一口气,但这种做法实质上损害了OpenAI的增长,Altman随时可能改变主意。

在初创公司中,抄袭已成常态

初创公司抄袭OpenAI的具体做法是,先开通GPT-4的会员,然后向它提出一系列问题,例如“这行代码有什么问题?”他们使用这些问题和答案来训练自己的竞品模型。

采取这一策略的初创公司不在少数。

Unsloth AI联合创始人Daniel Han估计,他大约一半的客户从GPT-4或Anthropic的Claude模型中获取数据,并用它来改进自己的模型。许多公司也从ShareGPT获得此类数据,ShareGPT是一个开发人员分享使用OpenAI模型生成答案的网站。

小型开发商的模型通常基于Meta Platforms或Mistral AI免费提供的流行开源模型,但通过融合OpenAI模型的答案,可以显著提高这些模型输出内容的质量。Han表示,一些开发人员正在使用一项名为OpenPipe的服务来自动化这一过程。

“在一个尚未建立明确规则的新生态系统中,就会发生这种情况,”Menlo Ventures董事总经理Matt Murphy表示,该公司投资了OpenAI的竞争对手Anthropic。Murphy说:

如果大家都使用相同的数据,你怎么能比其他人更出色呢?

目前尚不清楚OpenAI、谷歌、Anthropic和其他大型开发商会在多大程度上允许初创对手利用他们的数据进行追赶。

Radical Ventures合伙人Rob Toews表示:

AI模型的训练数据的质量和来源正成为最重要的热点问题之一。没有人确切知道事情将如何发展,但任何没有对(数据来源)进行周密和战略考虑的AI初创公司都在落后。

如果那些在开发模型时暗中依赖其他AI服务的开发商被曝光,它们可能会面临尴尬的处境。

比如,总部位于巴黎的Mistral使用Meta的开源AI 模型Llama 2创建了自己的AI,但直到无意泄露才披露这一事实,引起了一些开发者的不满。Mistral已经筹集了数亿美元的资金。

大公司也一样?

实际上,初创公司利用OpenAI数据训练模型的做法,与OpenAI等AI巨头的做法并无二致。

OpenAI首席技术官Mira Murati上个月在回答有关该公司是否使用谷歌旗下YouTube以及Meta Platforms旗下Facebook和Instagram的数据来训练生成AI视频的Sora时表现出了犹豫和困惑。

如果OpenAI真的使用了这些数据,也不足为奇。

据《纽约时报》最近的报道,OpenAI创建了一个名为Whisper的语音识别工具,用于转录YouTube视频,以此来改进GPT-4。此前,也有媒体曾报道称,OpenAI暗中使用YouTube数据训练其早期的AI模型。

就在本月早些时候,YouTube CEO Neal Mohan还表示,他不赞成OpenAI使用YouTube视频来开发像Sora这样的文生视频模型。

这种行为也导致OpenAI招致了侵权官司。《纽约时报》公司去年12月起诉OpenAI及其最大支持者微软,指控他们在训练模型时非法复制了该报的新闻文章。诉讼称,OpenAI的聊天机器人“可以逐字逐句地生成时报内容”。

作为回应,OpenAI辩称,它已努力与新闻出版商建立合作关系,其训练做法属于美国版权原则“合理使用”所允许的范围。

尽管如此,OpenAI和谷歌都与Axel Springer等出版商达成了数百万美元的许可协议,并与Reddit等主要网站达成了更大的交易。

即使是科技巨头也难以抗拒捷径的诱惑。

The Information报道称,谷歌曾转录YouTube视频,Meta雇佣承包商总结受版权保护的书籍,Adobe使用Midjourney的AI生成照片,均是为了训练自家AI模型。一位谷歌工程师因担忧公司使用OpenAI的ChatGPT数据而辞职。

初创公司Lamini的CEO Sharon Zhou表示,AI开发的快速步伐和激烈竞争迫使开发者求助于有争议的训练数据来源,如受版权保护的内容或LLM。

Zhou说:

在这个领域,投资者需要看到非常快的进展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国产品牌近乎全军覆没的安全漏洞:唯一不受影响的只有华为

国产品牌近乎全军覆没的安全漏洞:唯一不受影响的只有华为

快科技
2024-04-29 11:46:57
江西觉醒姐又火了!被扒与黑人亲密合影,网友:黑人给多少彩礼?

江西觉醒姐又火了!被扒与黑人亲密合影,网友:黑人给多少彩礼?

记录生活日常阿蜴
2024-04-29 19:50:41
乌军总司令:“前线困难重重,局势有恶化趋势”

乌军总司令:“前线困难重重,局势有恶化趋势”

参考消息
2024-04-28 20:12:13
香港第一风水师陈朗,因助人改命受天谴,李嘉诚花费千万为他续命

香港第一风水师陈朗,因助人改命受天谴,李嘉诚花费千万为他续命

郁郁乎文
2024-04-28 16:03:28
放心!新冠疫苗之父杨晓明研发的是北京生物疫苗,而不是科兴疫苗

放心!新冠疫苗之父杨晓明研发的是北京生物疫苗,而不是科兴疫苗

影孖看世界
2024-04-29 21:20:11
面包吃前冷冻一下能减肥?碳水吃多了会不孕?一吃就胖是天生的?BBC又一纪录片毁三观!

面包吃前冷冻一下能减肥?碳水吃多了会不孕?一吃就胖是天生的?BBC又一纪录片毁三观!

最英国
2024-04-29 00:12:16
经过我不断被喷之后发现,支持哈、伊、俄的大体应该是同一群人!

经过我不断被喷之后发现,支持哈、伊、俄的大体应该是同一群人!

翻开历史和现实
2024-04-27 15:59:22
16条导弹生产线全速运转,8万人自愿加班助力:放开打满足供应

16条导弹生产线全速运转,8万人自愿加班助力:放开打满足供应

扬子的故事屋
2024-04-29 22:04:54
真相!上海病毒实验室被强关,顶级专家睡门口抗议,更多内幕曝出

真相!上海病毒实验室被强关,顶级专家睡门口抗议,更多内幕曝出

毒舌说历史1
2024-04-29 19:17:13
大S出门了!网友拍到具俊晔与大S聚餐,正穿着大S发图里的衣服!

大S出门了!网友拍到具俊晔与大S聚餐,正穿着大S发图里的衣服!

娱小小新
2024-04-29 15:05:08
慌了!黄金迎来大跌,行情已到顶?

慌了!黄金迎来大跌,行情已到顶?

户外钓鱼哥阿旱
2024-04-29 14:06:16
正要入睡,股市突发大消息,有个让2亿股民气愤,A股要承压?

正要入睡,股市突发大消息,有个让2亿股民气愤,A股要承压?

彩云的夕阳
2024-04-29 16:24:49
莫妮卡·贝鲁奇 Monica Bellucci 玉足穿高跟凉鞋录制电视节目

莫妮卡·贝鲁奇 Monica Bellucci 玉足穿高跟凉鞋录制电视节目

室内设计师阿喇
2024-04-29 20:18:03
“反转”了!三星、台积电先后宣布,外媒:中国不买了

“反转”了!三星、台积电先后宣布,外媒:中国不买了

小蘑菇壹号
2024-04-29 18:09:33
表面人模人样,实则是流氓头子,家暴恶魔,这五位男星太令人作呕

表面人模人样,实则是流氓头子,家暴恶魔,这五位男星太令人作呕

学者启智V3
2024-04-29 17:16:52
突然重伤!森林狼话事人髌腱撕裂!NBA第一支半决赛球队诞生……

突然重伤!森林狼话事人髌腱撕裂!NBA第一支半决赛球队诞生……

篮球实战宝典
2024-04-29 14:48:38
闹大了!骆家辉直言不讳:中国自主生产尖端芯片,美国或有大动作

闹大了!骆家辉直言不讳:中国自主生产尖端芯片,美国或有大动作

搞笑的阿票
2024-04-28 17:30:03
重磅,乌克兰瞒不住!绍伊古公布爆炸性消息,乌果然骗了全世界?

重磅,乌克兰瞒不住!绍伊古公布爆炸性消息,乌果然骗了全世界?

凝心斋
2024-04-29 13:45:03
1992年美国一对夫妻宇航员上天,在太空发生“关系”变成讨论焦点

1992年美国一对夫妻宇航员上天,在太空发生“关系”变成讨论焦点

搞笑的阿票
2024-04-29 17:41:32
刘鹏致命换人!浙江末节轰出20-0,上海全线崩盘,王哲林惨遭打脸

刘鹏致命换人!浙江末节轰出20-0,上海全线崩盘,王哲林惨遭打脸

后仰大风车
2024-04-29 22:06:28
2024-04-30 03:34:44
华尔街见闻官方
华尔街见闻官方
中国领先的金融商业信息提供商
110076文章数 2634228关注度
往期回顾 全部

科技要闻

马斯克收获大礼,李彦宏梅开二度?

头条要闻

周鸿祎近10天里热搜不断 背后是360市值蒸发4000多亿

头条要闻

周鸿祎近10天里热搜不断 背后是360市值蒸发4000多亿

体育要闻

足球童话!执教16年,从业余联赛到德甲

娱乐要闻

田馥甄遭抵制,蔡依林却能稳稳捞金?

财经要闻

建信人寿巨亏40亿 部分产品退保率93%

汽车要闻

配置更丰富 静态体验2024款欧拉好猫

态度原创

游戏
家居
房产
艺术
军事航空

《死亡回归》明日公布新消息 新作还是开发纪录片?

家居要闻

光影之间 空间暖意打造生活律动

房产要闻

拆迁致富成过去式?广州旧改探索新出路

艺术要闻

共度北京108小时 北京当代2024“凝聚”全球36座城市100余家艺术机构

军事要闻

以军轰炸加沙地带南部城市拉法 至少15人死亡

无障碍浏览 进入关怀版