网易首页 > 网易号 > 正文 申请入驻

GPT-4强到离谱,OpenAI拒绝Open!首席科学家:开源并不明智,我们之前错了

0
分享至

新智元报道

编辑:Britta 好困

【新智元导读】OpenAI的联合创始人Greg Brockman和首席科学家Ilya Sutskever评价GPT-4的性能,并对安全问题和开源的争议进行解释。

毫无疑问,GPT-4一经发布,就引爆了整个业界和学界。

凭借着自己强大的推理和多模态能力,引发了一众热议。

然鹅,GPT-4不是一个open的模型。

虽然OpenAI分享了大量GPT-4的基准和测试结果,但是基本上没有提供用于训练的数据、成本、或者用于创建模型的方法。

当然了,这样的「独家秘笈」OpenAI肯定不会公布了。

马库斯直接拿出当初OpenAI的初衷,发文嘲讽了一波。

网友改进了一个版本。

人无完人,GPT-4也是

当OpenAI的总裁、联合创始人之一Greg Brockman将GPT-4和GPT-3进行比较时,他说了一个词——不同。

「它只是不同而已,模型仍然有很多问题和错误......但你真的可以看到它在微积分或法律等方面的技能提升。在某些领域,它从表现非常糟糕进化到现在足以匹敌人类。」

GPT-4的测试结果很不错:在AP微积分BC考试中,GPT-4得了4分,而GPT-3得了1分。在模拟的律师考试中,GPT-4以大约前10%考生的分数通过;GPT-3.5的分数徘徊在后10%。

在上下文能力,也就是说在生成文本之前可以记忆的文本方面,GPT-4大约能够记住50页左右的内容,是GPT-3的8倍。

在提示方面,GPT-3和GPT-3.5只能接受文字提示:「写一篇关于长颈鹿的文章」,而多模态的GPT-4可以接受图片和文字的提示:给出一张长颈鹿的图片,提示问「这里有多少只长颈鹿?」 这些GPT-4都能答对,而且它的读梗能力也很强!

我们之前错了,开源并不明智

而强到离谱的GPT-4一发布,便引起了大量研究人员和专家的兴趣。但令人失望的是,OpenAI发布的GPT-4,不是「Open的AI模型。」

尽管OpenAI分享了大量GPT-4的基准、测试结果和有趣的演示,但基本上没有提供用于训练该系统的数据、能源成本或用于创建它的具体硬件或方法的相关信息。

之前Meta的LLaMa模型泄露的时候,就引发过一波关于开源的讨论。不过,这次大家对于GPT-4封闭模型的最初反应是大部分都是负面的。

人工智能社区普遍认为,这不仅破坏了OpenAI作为研究机构的创始精神,而且让其他人难以制定保障措施来应对威胁。

Nomic AI的信息设计副总裁Ben Schmidt表示,由于无法看到GPT-4是在什么数据上训练的,大家很难知道该系统在什么地方是安全使用的,并提出修复方案。

「为了让人们知道这个模型什么地方不起作用,OpenAI需要更好地了解GPT-4所做的事情以及其中的假设。我可不会在下雪的时候,相信一个没有在雪地气候情况下训练出来的自动驾驶汽车。因为很可能,漏洞和问题只在真实使用的时候才会浮现。」

对此,OpenAI的首席科学家兼联合创始人Ilya Sutskever解释称:OpenAI不分享更多关于GPT-4的信息是因为害怕竞争,也是因为对安全的担忧,这一点是毋庸置疑的。

「外面的竞争很激烈,GPT-4的开发并不容易。几乎所有的OpenAI的员工在一起工作了很长时间才生产出这个东西。从竞争的角度来看,有很多很多公司都想做同样的事情,而GPT-4像是一个成熟的果实。」

众所周知,OpenAI在2015年成立之初是一个非营利组织。其创始人包括Sutskever、现任首席执行官Sam Altman、总裁Greg Brockman以及现已离开OpenAI的马斯克。

Sutskever等人曾表示,该组织的目标是为每个人创造价值,而不是单单为股东创造价值,并表示将与该领域的各方进行「自由合作」。

然而,为了获得数十亿美元的投资(主要来自微软),OpenAI还是被加盖了一层商业属性。

不过,当被问及为什么OpenAI改变了分享其研究的方法时,Sutskever简单地回答道:

「我们错了。在某个时候,AI/AGI将变得极其强大,那时,开源就是没有意义的。可以预料的是,在几年内,每个人都会完全明白,开源人工智能是不明智的。因为这个模型是非常有力的。如果有人想,用它就能够造成巨大的伤害,这将是相当容易的。所以随着模型的能力越来越高,不想披露它们是有道理的。」

Lightning AI的首席执行官和开源工具PyTorch Lightning的创建者William Falcon从商业角度解读称:「作为一家公司,你完全有权利这样做。」

安全风险

与此同时,Brockman也认为GPT-4的应用推广应当是缓慢推进的,因为OpenAI正在评估风险和利益。

「我们需要解决一些政策问题,如面部识别和如何对待人的图像,我们需要弄清楚,危险区在哪里,红线在哪里,然后慢慢澄清这些点。」

还有就是老生常谈的,GPT-4被用来干坏事的风险。

以色列网络安全初创公司Adversa AI发表了一篇博文,展示了绕过OpenAI的内容过滤器,让GPT-4生成钓鱼邮件、生成对同性恋者的攻击性描述等让人高度反感的文本的方法。

因此,很多人都希望GPT-4在审核方面带来重大改进。

针对这一点,Brockman强调,他们花了很多时间试图了解GPT-4的能力,而该模型已经经历了六个月的安全培训。在内部测试中,对于OpenAI的使用政策所不允许的内容,GPT-4作出反应的可能性比GPT-3.5低82%,产生「事实性」反应的可能性高40%。

不过,Brockman并不否认GPT-4在这方面的不足。但他强调了该模型的新的缓和导向工具,称为「系统信息」的API级能力。

系统信息本质上是为GPT-4的互动设定基调,并建立界限的指令。这样,以系统信息作为护栏,就可以防止GPT-4偏离方向。

例如,一条系统信息的人设可能是这样的:「你是一个总是以苏格拉底方式回答问题的导师。你从不给学生答案,而是总是试图提出正确的问题,帮助他们学会自己思考。」

新的道路

其实,从一定程度上,Sutskever也认同批评者的观点:「如果更多的人愿意研究这些模型,我们会对它们有更多的了解,这将是好事。」

所以OpenAI出于这些原因,向某些学术和研究机构提供了访问其系统的机会。

而且Brockman还提到了Evals,这是OpenAI新近开源的软件框架,用于评估其人工智能模型的性能。

Evals采用的是模型测试众包的方式,让用户开发和运行评估GPT-4等模型的基准,同时检查其性能,这也是OpenAI致力于「健全」模型的标志之一。

「通过Evals,我们可以看到用户关心的用例,能够以一种系统的形式进行测试。我们开源的部分原因是,我们正在从每三个月发布一个新模型转向不断改进新模型。当我们制作新的模型版本时,我们至少可以通过开源知道这些变化是什么。」

其实,关于共享研究的讨论一直颇为火热。一方面,谷歌和微软这样的科技巨头正急于将人工智能功能添加到他们的产品中,往往会将以前的道德问题搁置一边,微软最近就解雇了一个团队,该团队是专门确保人工智能产品遵循道德准则的);另一方面;技术的迅速改善引发了人们对人工智能的担忧。

英国人工智能政策负责人 Jess Whittlestone 说,平衡这些不同的压力带来了严重的治理挑战,这意味着我们可能需要第三方监管机构参与。

「OpenAI 不分享关于 GPT-4 的更多细节的出发点是好的,但也可能导致人工智能世界的权力集中化。这些决定不应该由个别公司来做。」

Whittlestone 说:「理想的情况是,我们需要把这里的做法编纂成册,然后让独立的第三方去审查与某些模型相关的风险。」

参考资料:

https://techcrunch.com/2023/03/15/interview-with-openais-greg-brockman-gpt-4-isnt-perfect-but-neither-are-you/

https://www.theverge.com/2023/3/15/23640180/openai-gpt-4-launch-closed-research-ilya-sutskever-interview

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
外媒:丹麦已准备好在格陵兰岛与美军作战

外媒:丹麦已准备好在格陵兰岛与美军作战

参考消息
2026-03-20 21:41:08
英军官建议用核弹毁灭俄罗斯:未来台海若开战,中国必须敲响警钟

英军官建议用核弹毁灭俄罗斯:未来台海若开战,中国必须敲响警钟

军闻新大门
2026-03-22 23:24:34
中核集团的顾军被查了。最让人脊背发凉的是他的第一个身份

中核集团的顾军被查了。最让人脊背发凉的是他的第一个身份

南权先生
2026-02-02 16:05:36
一票否决权的黄昏:欧尔班砸了桌子,才发现地板是玻璃做的

一票否决权的黄昏:欧尔班砸了桌子,才发现地板是玻璃做的

民间胡扯老哥
2026-03-22 20:27:01
重温1999:西方媒体报道的炸馆“另一面”,17名军事顾问遇难?

重温1999:西方媒体报道的炸馆“另一面”,17名军事顾问遇难?

干史人
2026-02-27 11:00:05
章子怡主动拥抱却被“悬空手”婉拒!这分寸感才是真高级

章子怡主动拥抱却被“悬空手”婉拒!这分寸感才是真高级

TVB的四小花
2026-03-22 20:12:18
“惨案”:伊朗命中以色列核工业城,造成200多人伤亡!

“惨案”:伊朗命中以色列核工业城,造成200多人伤亡!

胜研集
2026-03-22 08:09:41
菲总统候选人莫雷诺:如果当选,我会让菲律宾成为下一个新加坡!

菲总统候选人莫雷诺:如果当选,我会让菲律宾成为下一个新加坡!

小丸说故事
2026-03-17 14:23:29
陈天桥:那一夜梁文锋拒绝了我的投资,却让我决定投入10亿美金去做另一件事

陈天桥:那一夜梁文锋拒绝了我的投资,却让我决定投入10亿美金去做另一件事

猎云网
2026-03-19 15:28:10
外媒:中国国产邮轮“爱达·花城号”出坞意义重大

外媒:中国国产邮轮“爱达·花城号”出坞意义重大

参考消息
2026-03-22 15:49:02
苹果官网标错价格!大量用户抢空 2TB 产品

苹果官网标错价格!大量用户抢空 2TB 产品

XCiOS俱乐部
2026-03-20 09:38:29
终于要补强大外援了?曝广东签下2米13防守大闸,朱芳雨放手一搏

终于要补强大外援了?曝广东签下2米13防守大闸,朱芳雨放手一搏

老叶评球
2026-03-22 18:05:04
陈云晚年首次披露:遵义会议上这两个人死活不同意毛主席,吵得面红耳赤

陈云晚年首次披露:遵义会议上这两个人死活不同意毛主席,吵得面红耳赤

老杉说历史
2026-03-21 17:38:44
让韩佳人惊叹的中国网红美貌:万幸我出道早…

让韩佳人惊叹的中国网红美貌:万幸我出道早…

奋斗在韩国
2026-03-20 14:44:59
上海某工业设计院薪资炸裂!

上海某工业设计院薪资炸裂!

黯泉
2026-03-22 18:46:25
重大风向!房地产税从十五五规划消失,楼市底层逻辑彻底转变

重大风向!房地产税从十五五规划消失,楼市底层逻辑彻底转变

复转这些年
2026-03-20 23:29:32
确认了!明天起ICE进驻各大机场,负责维持秩序,顺便抓非法移民

确认了!明天起ICE进驻各大机场,负责维持秩序,顺便抓非法移民

大洛杉矶LA
2026-03-23 05:47:56
她是两百年难遇的美人,靠美貌“征服”无数男人,如今49岁仍未婚

她是两百年难遇的美人,靠美貌“征服”无数男人,如今49岁仍未婚

林雁飞
2026-03-22 14:47:54
东契奇:比塔泽用塞尔维亚语告诉我“他要搞我全家”

东契奇:比塔泽用塞尔维亚语告诉我“他要搞我全家”

懂球帝
2026-03-22 10:52:07
最新世界排名:塔猜亚夺本赛季第21站冠军,飙升17位!丁俊晖第16

最新世界排名:塔猜亚夺本赛季第21站冠军,飙升17位!丁俊晖第16

求球不落谛
2026-03-22 22:35:33
2026-03-23 06:20:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14786文章数 66707关注度
往期回顾 全部

科技要闻

嫌台积电太慢 马斯克要把芯片产能飙升50倍

头条要闻

媒体:特朗普48小时通牒砸向伊朗 不排除美国铤而走险

头条要闻

媒体:特朗普48小时通牒砸向伊朗 不排除美国铤而走险

体育要闻

46岁生日快乐!巴萨全队穿10号致敬小罗

娱乐要闻

47岁“国际章”身材走样?让嘲笑她的人闭嘴

财经要闻

睡梦中欠债1.2万?这只“虾”杀疯了

汽车要闻

14.28万元起 吉利银河星耀8远航家开启预售

态度原创

本地
数码
教育
公开课
军事航空

本地新闻

春色满城关不住|绍兴春日顶流,这片樱花海藏不住了

数码要闻

古尔曼:苹果Apple TV、HomePod和HomePod mini库存告急

教育要闻

上海一模作文题藏着仨陷阱

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊导弹击中以核设施附近 爆炸视频公布

无障碍浏览 进入关怀版