网易首页 > 网易号 > 正文 申请入驻

字节OpenAI账号被封禁,这事儿到底谁错了?

0
分享至

不知道各位差友听说没,字节的 OpenAI 账号,被封了。。。

根据 OpenAI 的说法,就在上周五,他们暂停了字节的账号,具体发生了啥,现在也还在进一步调查中

世超也去查了查,发现事情,是由外媒 The Verge 的一则报道引起的。

据报道,字节跳动正在悄咪咪地用 OpenAI 的 API ,做一些 “ 不太光彩 ” 的事儿。

和大伙们用 AI 水周报,糊弄领导不一样,按照 The Verge 的说法,字节直接在用 OpenAI训练自家的大模型

一般遇到类似传言,世超不会太在意,毕竟套壳大模型、用别家大模型训练自家大模型等等,相关的消息隔三岔五就会来那么一次。

而且都是一些风言风语,没啥实锤,也没啥后续。

但这次不一样了,报道里的内部消息,至少看起来都贼真。

他们说是弄到了字节内部泄露的一份文件。

里面主要讲了字节的大模型项目—— “ 种子计划 ” 的开发过程,几乎在每个阶段,包括训练还有评估,字节的大模型都用了 OpenAI 的 API 。

另外,像是怎么 “ 通过数据脱敏,不被人抓到小尾巴 ” 这类的内部飞书聊天记录,也都给曝出了。

再加上 OpenAI 的直接封号,还真有点坐实了报道里内容的味道。

反正一时间,网友们都纷纷出来吃瓜,各种阴阳国产大模型的言论都出来了——

“ 怪不得国产大模型们一个个都开发得这么快,原来是在偷师 GPT 啊? ” “ 国内的大模型都一股 GPT 味儿,原来问题出在这儿。 ”

国内媒体们都一股脑儿地转载报道,话题还一度飙上了知乎热榜。

而大伙们也应该发现了,争议的中心在于,字节可能调用 OpenAI API给自家大模型生成训练数据

说实话,相较与简单粗暴,甚至有些无底线的套壳,这手段,其实文明了不少了。。。

在大模型领域里,我们一般叫它大模型的知识蒸馏

从名字来看,估计各位差友也能猜出来个一二三,就是用已经训练得差不多的先进大模型,生成一些优质语料,然后再把生成的这些语料喂给更小模型。

说好听点,大模型的知识蒸馏,是帮大家省了前期标注数据、提取优质语料库的功夫,说难听点,这就是在吃别人已经嚼烂的食物,好偷懒省力。

看到这儿,肯定有人会说了,大模型做出来,不就是让人用的么,用户爱咋用咋用,这波字节没做错啥啊?

话是这么说,但是 OpenAI 早就料到了这一手,为了防止自己的数据被薅、被蒸馏, OpenAI 在自家的服务协议早就埋伏上了。

不只有企业,包括个人开发者在内, OpenAI 都禁止他们用 OpenAI 的大模型,去开发竞品。

普通用户那儿, OpenAI 也没放过。

它给 ChatGPT 和 DALL·E 都套上了枷锁,同样也不让用输出的内容,训练与 OpenAI 竞争的模型。

只要你违反上面那些规定了,按照官方的说法,就只是提前知会一声,随时终止服务

这些条例就跟唐僧念符之下的紧箍咒一样,越来越紧。。。咱明眼人也都能看出 OpenAI 在自家 “ 数据安全 ” 这块是下狠招了。

虽说字节用的 API 不是从 OpenAI 这边直接买的,而是买的微软 Azure 上的云服务 Azure OpenAI 。

但从微软那边买,同样也是受这个协议约束。

或许是因为这些原因,才有了开头先封号处理,再进一步调查字节的局面。

看着这一盆盆 “ 脏水 ” 泼过来,字节也没干坐着,在周末加班一一给出了回应。

首先,他们称在开发大模型的时候,只是在初期探索阶段用了 GPT 的 API 服务,并且探索阶段的模型还只是测试,没有上线对外使用

并且根据字节的说法,今年四月份他们内部就明确规定,不能用 GPT 生成的数据训练自己的大模型。

更重要的是,他们说九月份内部还搞了个检查,主要的任务就是看他们的训练数据和 GPT 的相似程度

未来几天里,他们还准备再来一次全面检查,以确保严格遵守相关服务的使用条款。

到现在为止,反正各方的回应是一箩筐,至于字节到底有没有违反 OpenAI 的服务协议,从现在的信息来看我们也做不出啥判断,只能等后续双方沟通的结果。

不过,在训练大语言模型这块,数据来源的争议其实一直都蛮大。

OpenAI 训练大模型的时候,也曾在数据上栽了不少跟头。

就比如 ChatGPT ,它主要就是爬取一些社交媒体网站、或者论坛、贴吧上的数据。

刚开始,这些数据他们都是免费爬的,但后来 OpenAI 的 ChatGPT 还有 DALL·E 慢慢出圈,一些问题就连带着浮出水面了。

这两个大模型爆火的那段时间, OpenAI 吃的官司是一个接一个。

文生图大模型被各种图片网站、艺术家们起诉,大语言模型被社交平台上的博主索赔。。。

与此同时,各大平台也都开始注重数据价值,像是美版贴吧 Reddit ,还有程序员问答网站 StackOverflow 等等这种优质语料多的网站,都开始设置付费门槛,交钱才能爬取数据。

但在此时 OpenAI 的大模型已经发育起来了,过去网络上的数据该爬的也都爬了。

这下就苦了那些后来者,前期还不仅要做一些标注语料库的重复劳动,还得付费再爬一遍数据。

不过世超觉得,这次真如 The Verge 报道中说的,那这个 “ 锅 ” 铁定还是要字节来背,毕竟相关的条例,早就写在协议里了,拿人家的手短,人家还真有理。

最后,世超想说的是,自从大模型流行以来,业内类似的争议也好、丑闻也好,其实基本就没断过。

就比如前不久,李开复的大模型 Yi 被扒出是 “ 套壳 ” Meta 的 LLaMA ,虽说后者也是开源的,但要用也得注明。

但李开复还是在网上舆论发酵之后,才不痛不痒地回应了句命名疏忽。。。

更离谱的是,大模型内部还和机圈儿一样,流行起了跑分热

有的企业为了让自己的模型分数更好看一点,直接搞起了小动作。

前段时间谷歌的Gemini,为了让自家模型的分数比 GPT-4 好看,在测试方法上就动了些手脚。

国内某团队也曾发布过技术报告,里面明晃晃地指出了大模型刷榜的乱象。

他们直接把测评的题目,先喂给了自家大模型。

相当于是开卷刷榜,让自家的大模型在一群“ 做题家 ”中脱颖而出。

当然,新兴领域一开始都是乱象丛生,有这些丑闻也不是啥新鲜事儿。

世超也希望,未来,大模型厂商们能主打一个诚实,别今天暴打 GPT-4 ,明天又暴打 OpenAI 的了。

还有用了谁谁谁的数据,用了哪些开源资源,也大大方方承认,作为一个追赶者、学习者,其实没啥丢脸的。。

再回到字节和 OpenAI 这档子事儿,要是真相水落石出,字节确实是被冤枉,世超也希望 OpenAI 和媒体们能立马化身墙头草,还字节一个清白。

少一些套路,多一些真诚,大模型可以有幻觉,人嘛,还是实诚点好。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
毫无征兆!卢卡申科突然访华只求中国能够给自己四个字!

毫无征兆!卢卡申科突然访华只求中国能够给自己四个字!

阿龙聊军事
2026-06-30 10:52:50
资本全跑了,演员排队找工作,中国电影怎么就走到这步了?

资本全跑了,演员排队找工作,中国电影怎么就走到这步了?

陈意小可爱
2026-06-28 14:55:24
涉案金额过亿 刘应成(原法名释永信)一审被判有期徒刑24年

涉案金额过亿 刘应成(原法名释永信)一审被判有期徒刑24年

每日经济新闻
2026-05-30 00:42:59
为何只要去浙江发展,不但自己,甚至连下一代都很难再回到故乡生活?

为何只要去浙江发展,不但自己,甚至连下一代都很难再回到故乡生活?

周哥一影视
2026-06-30 17:51:31
上半场封神 下半场崩盘!安帅1招击溃日本铁桶阵,巴西赢在教练!

上半场封神 下半场崩盘!安帅1招击溃日本铁桶阵,巴西赢在教练!

看透足球专栏
2026-06-30 03:57:30
家中查出20吨黄金真相大白后 赵本山近况曝出 儿子不争气 女儿惹

家中查出20吨黄金真相大白后 赵本山近况曝出 儿子不争气 女儿惹

阿伧说事
2026-06-29 19:41:49
安徽一女子在酒吧被陌生男子投放“伟哥”,警方不予立案,双方签署调解协议后男方赔偿1.3万元,女子回应:已撤销协议,正在走法律程序

安徽一女子在酒吧被陌生男子投放“伟哥”,警方不予立案,双方签署调解协议后男方赔偿1.3万元,女子回应:已撤销协议,正在走法律程序

大风新闻
2026-06-29 22:09:46
没有公告,卢卡申科紧急访华,普京有心无力,白俄只有中国能救?

没有公告,卢卡申科紧急访华,普京有心无力,白俄只有中国能救?

顾史
2026-06-30 02:21:37
A股:刚刚,大消息传来,释放一信号,明天将迎来更大级别的变盘

A股:刚刚,大消息传来,释放一信号,明天将迎来更大级别的变盘

云鹏叙事
2026-06-30 00:00:08
A股:大家要准备好下车了!主力已经明牌,周二将迎来更大的分化

A股:大家要准备好下车了!主力已经明牌,周二将迎来更大的分化

虎哥闲聊
2026-06-30 00:00:04
A股:两天反弹100点涨到4094,种种迹象表明,A股要迎来七月开门红?

A股:两天反弹100点涨到4094,种种迹象表明,A股要迎来七月开门红?

趋势清风侠
2026-06-30 15:28:47
土耳其总统公开呼吁摧毁以色列,内塔尼亚胡:要向特朗普告状!

土耳其总统公开呼吁摧毁以色列,内塔尼亚胡:要向特朗普告状!

青烟小先生
2026-06-30 19:32:22
温网高温规则揭秘:辛纳中暑退赛敲响警钟

温网高温规则揭秘:辛纳中暑退赛敲响警钟

坠入温柔晚风
2026-06-30 01:15:28
《生活大爆炸》演员们如今都当爸妈了!佩妮二胎、莱纳德儿女双全

《生活大爆炸》演员们如今都当爸妈了!佩妮二胎、莱纳德儿女双全

粉红冻奶的观影日记
2026-06-30 15:40:42
1天4个瓜!当街亲密、全网封禁,自曝怀双胎,赵丽颖最让人意外

1天4个瓜!当街亲密、全网封禁,自曝怀双胎,赵丽颖最让人意外

丁丁鲤史纪
2026-06-28 15:35:14
终于破案了!蚊子专挑你咬并非因为血型!真正原因很多人都搞错了

终于破案了!蚊子专挑你咬并非因为血型!真正原因很多人都搞错了

匹夫来搞笑
2026-06-28 18:22:47
42 岁 16 年老员工遇欧派裁员:管理层平稳转岗,中年打工人无路可退

42 岁 16 年老员工遇欧派裁员:管理层平稳转岗,中年打工人无路可退

时尚的弄潮
2026-06-30 20:13:55
我出差提前回家,本想给妻子一个惊喜,却发现她在家出轨

我出差提前回家,本想给妻子一个惊喜,却发现她在家出轨

千秋文化
2026-06-03 20:07:29
湖北一位复读生的亮眼成绩:去年高考633分复读一年奋力冲刺

湖北一位复读生的亮眼成绩:去年高考633分复读一年奋力冲刺

手工制作阿爱
2026-06-30 19:37:20
国际现货金银扩大跌幅

国际现货金银扩大跌幅

界面新闻
2026-06-30 09:06:04
2026-06-30 21:35:00
差评XPIN incentive-icons
差评XPIN
用知识和观点Debug the world!
11022文章数 489708关注度
往期回顾 全部

科技要闻

iPhone18 Pro遭泄密!印度代工商惹祸

头条要闻

日本队世界杯出局后 韩媒来劲了

头条要闻

日本队世界杯出局后 韩媒来劲了

体育要闻

大热倒灶压力给到法国 王楚揭法国队隐患

娱乐要闻

韩红称要退出公益,多位名人挽留

财经要闻

万亿“寒王”,历史时刻

汽车要闻

奇瑞风云A9探店 五个理由一定来看看

态度原创

旅游
时尚
房产
教育
军事航空

旅游要闻

“渝郴”携手拓客源 郴州旅游产品推介会在重庆举办

“复古波点”又流行回来了!夏天简单穿就很时髦

房产要闻

等了三年!改善顶流实景交付,海口标杆的的答卷来了!

教育要闻

快讯!2026黄石中考分数线公布!

军事要闻

以色列防长:穆杰塔巴已被列入死亡名单

无障碍浏览 进入关怀版