网易首页 > 网易号 > 正文 申请入驻

GPT-4发布,能击败90%的人类

0
分享至

来源:青投创新

编辑:Tian

" 许多人工智能研究人员认为,整合文本、音频和视频的多模态系统为构建更强大的人工智能系统提供了最佳途径。

今天(3月15日)凌晨,OpenAI宣布推出GPT-4,这是其AI语言模型系列中最新的一款,为ChatGPT和新Bing等应用提供支持。

在OpenAI的介绍里,对GPT-4的描述是:这是 OpenAI 努力扩展深度学习的最新里程碑。GPT-4 是一个大型多模态模型,将接受图像和文本输入,提供文本输出,虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平。

在Live Demo中,OpenAI的总裁和联合创始人Greg Brockman展示了GPT-4的能力:总结文章、写代码、报税、写诗等等,过去GPT-3.5做不到的, GPT-4都可以完成。

结论就是,GPT-4是一个比ChatGPT更加强大的模型!

01

强大在哪里?

“GPT-3.5和GPT-4之间的区别可能很微妙。当任务的复杂性达到足够的阈值时,差异就会出现——GPT-4比GPT-3.5更可靠、更有创意,并且能够处理更细微的指令。”

OpenAI首席执行官Sam Altman在推特上表示,过去的两年里,团队重建了整个深度学习堆栈,并与微软Azure一起,为GPT工作负载从头开始共同设计了一台超级计算机。经过训练和修复更新之后,GPT-4前所未有的稳定,成为OpenAI能够提前准确预测其训练性能的第一个大型模型。

GPT-4的改进明显体现在系统进行多项测试和基准测试中的表现,包括统一律师考试、LSAT、SAT数学和SAT基于证据的阅读和写作考试。

在美国律师执照统考模拟中,GPT-4得分约为前10%——击败了90%人类,而ChatGPT背后的GPT-3.5得分约为倒数10%;生物奥林匹克竞赛,GPT-3.5能达到后31%水平分位,GPT-4可达到前1%水平分位;GRE、SAT考试成绩中,也有大幅提升,击败了80%以上的人类答题水平,而医学知识自测考试准确率达75%。

尽管在GPT-4的介绍中,OpenAI没有像往常一样透露训练参数数据,只用了“更大的模型”来表述,但从GPT-4能完成的任务和表现来看,无疑是要比上一代GPT-3的1750亿个参数多很多倍。

并且GPT-4 由深度学习技术开发而来,是在公开可用和已被许可数据上进行的训练,并使用强化学习和人工反馈进行微调,这使得GPT-4相比上一代还接受了更多的训练,大幅提高数据与计算方面的能力。

GPT-4是多模态的,即不仅能接受图片、视频、音频的输入,还能同样输出图片、视频和音频。

许多人工智能研究人员认为,整合文本、音频和视频的多模态系统为构建更强大的人工智能系统提供了最佳途径。

02

存在的问题

OpenAI在发布GPT-4时强调,该系统已经进行了六个月的安全培训,并且在内部测试中,与GPT-3.5相比,GPT-4对禁止或不恰当内容做出响应的可能性降低了82%,做出实际响应的可能性提高了40%,这是对早期GPT模型皆会出现问题的一种修正:随意编造事实或触发敏感内容。

然而,这并不意味着系统不会出错或输出不恰当的内容。例如,微软透露其Bing搜索引擎一直由GPT-4驱动,许多用户能够以各种方式破解Bing的防护,让AI提供危险的建议,威胁用户,并编造信息。

而且GPT-4仍然是基于2021年9月之前的数据训练的,因此GPT-4还缺乏对2021年 9月之后数据的有效理解。

“GPT-4 仍有许多已知的局限性,我们正在努力解决,例如社会偏见、幻觉和对抗性提示。”OpenAI表示。

03

应用与竞争

OpenAI已经与多家公司合作,要将GPT-4结合到他们的产品中,包括Duolingo、Stripe和Khan Academy。

GPT-4模型也将以API的形式,提供给付费版ChatGPT Plus(OpenAI每月20美元的ChatGPT订阅)的订阅用户,开发者可以注册,用它打造应用。

微软此后表示,新Bing搜索引擎将运行于GPT-4系统之上。

OpenAI进一步强调,GPT-4“比以往任何时候都更具创造力和协作性,可以更准确地解决难题”。

与此同时,谷歌方面为了迎战微软,宣布将一系列即将推出的AIGC功能,应用到自家产品中,包括谷歌Docs、Gmail、Sheets和 Slides。

但不同于微软和OpenAI的“发布即可用”,谷歌只会先将Docs和Gmail中的AI工具,在月底提供给一些“值得信赖的开发人员”,而其它功能则将是在今年晚些时候向公众开放。

至于具体时间,谷歌方面并没有具体说明,外界对此评价是谷歌希望抢先微软原定于本周四的发布,但依旧让微软抢先了,所以将暂缓对公众对开放。

而国内的百度早先也宣布将在3月16日正式发布文心一言,但与谷歌面临的窘境一致,在OpenAI推出更加强大的GPT-4后,是否会对文心一言的发布有影响,还需明日揭晓。

美国伊利诺伊大学香槟分校计算机系教授李博表示,短期来看ChatGPT作为文章写作、代码生成的辅助查错工具还不错,但是还不能完全依赖ChatGPT来做回答和搜索,因为它的回答不能保证正确性。

长期来看,她认为ChatGPT可以和不同的AI模型工具结合,做更友好的自动问答系统、学习工具等辅助性工具。此外李博认为,如果要长久发展并用于重要领域中,ChatGPT的可信赖性保证、纠错能力等非常重要。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
震惊!网传一小学班收1000元班费引争执,家长称家委会能买套房了

震惊!网传一小学班收1000元班费引争执,家长称家委会能买套房了

火山詩话
2026-05-28 14:10:15
江苏扔吸管女子暴怒后续,原因曝光,警方发声,已拘留和罚款!

江苏扔吸管女子暴怒后续,原因曝光,警方发声,已拘留和罚款!

米果说识
2026-05-28 09:35:32
汽车大局已定?明后年,拥有两辆以上燃油车的车主,坚持4不做!

汽车大局已定?明后年,拥有两辆以上燃油车的车主,坚持4不做!

沙雕小琳琳
2026-05-27 08:26:18
NBA出手了!警告文班亚马!追加马刺恶意犯规

NBA出手了!警告文班亚马!追加马刺恶意犯规

篮球教学论坛
2026-05-28 07:58:08
卫健委已将左氧氟沙星列为重点监控药物!提醒:服用千万注意

卫健委已将左氧氟沙星列为重点监控药物!提醒:服用千万注意

健康科普365
2026-05-25 22:15:03
相声圈大瓜!杨鹤通被德云社解除职务,20年元老栽在一张嘴上

相声圈大瓜!杨鹤通被德云社解除职务,20年元老栽在一张嘴上

阿废冷眼观察所
2026-05-29 00:23:06
弘一大师:“人一旦死了,生前的衣服、手表,穿过的衣服,盖过的被子,睡过的床,都会被扔掉,烧掉,处理掉,除了房子和钱,啥都不会留”

弘一大师:“人一旦死了,生前的衣服、手表,穿过的衣服,盖过的被子,睡过的床,都会被扔掉,烧掉,处理掉,除了房子和钱,啥都不会留”

大爱三湘
2026-05-28 21:14:51
古代太监净身到底是割蛋还是割鸡?他们说话的声音真的是娘娘腔?

古代太监净身到底是割蛋还是割鸡?他们说话的声音真的是娘娘腔?

史之铭
2026-05-28 00:48:09
印度超50℃,每天热死几百人!莫迪丢下国民,自己跑国外“避暑”

印度超50℃,每天热死几百人!莫迪丢下国民,自己跑国外“避暑”

小陆搞笑日常
2026-05-28 13:17:18
心理学:已婚女人一旦有了别的男人,一般不拒绝丈夫亲近,但会有两个表现

心理学:已婚女人一旦有了别的男人,一般不拒绝丈夫亲近,但会有两个表现

心理观察局
2026-05-26 06:15:06
四川甘孜通报“景区拦38公里省道收费120元”:提级整治稻城亚丁景区问题,整治期间暂停收取摆渡车交通运输服务费用

四川甘孜通报“景区拦38公里省道收费120元”:提级整治稻城亚丁景区问题,整治期间暂停收取摆渡车交通运输服务费用

齐鲁壹点
2026-05-28 21:11:18
毒杨梅事件升级!央视二次暗访,会长不简单,1天亏几亿只是开始

毒杨梅事件升级!央视二次暗访,会长不简单,1天亏几亿只是开始

米师傅安装
2026-05-29 01:55:42
血债惊全球!47条人命炸穿底线!中方怒斥:这事没完!

血债惊全球!47条人命炸穿底线!中方怒斥:这事没完!

达文西看世界
2026-05-26 15:42:43
袁立出手了!公开与辛柏青私下真实关系,真相估计和你想得不一样

袁立出手了!公开与辛柏青私下真实关系,真相估计和你想得不一样

观史搜寻着
2026-05-28 14:33:14
aespa吉赛尔内衣外穿,网友震惊:以为是短裤

aespa吉赛尔内衣外穿,网友震惊:以为是短裤

时光慢旅人
2026-05-29 00:18:39
别让显卡性能白浪费!99%玩家不知的免费提频开关,解锁15%隐藏动力

别让显卡性能白浪费!99%玩家不知的免费提频开关,解锁15%隐藏动力

全栈遛狗员
2026-05-28 02:40:40
视频丨日本民众持续发声 反对高市政权战争动向

视频丨日本民众持续发声 反对高市政权战争动向

国际在线
2026-05-28 18:25:21
A股:今天,5月28日,科技股“惊天大反弹”,到底发生了什么?

A股:今天,5月28日,科技股“惊天大反弹”,到底发生了什么?

风风顺
2026-05-29 02:15:06
5月28日俄乌最新:精彩的求援信

5月28日俄乌最新:精彩的求援信

西楼饮月
2026-05-28 20:52:30
五粮液放量砸向52周最低点!白酒还要自欺欺人到什么时候?

五粮液放量砸向52周最低点!白酒还要自欺欺人到什么时候?

风风顺
2026-05-29 00:00:06
2026-05-29 04:28:49
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4774文章数 37467关注度
往期回顾 全部

科技要闻

利润跌27%:快手只剩“可灵”这张牌?

头条要闻

男子疑遭家暴跳楼身亡 母亲:儿媳说"你不配活在世上"

头条要闻

男子疑遭家暴跳楼身亡 母亲:儿媳说"你不配活在世上"

体育要闻

唐斯经历的一切,此刻的他与尼克斯

娱乐要闻

林俊杰七七与大哥嫂子的瓜剪不断理还乱

财经要闻

小米仍需一次创业

汽车要闻

从智驾兜底到自研4nm芯片,再到迪迪虾,比亚迪智能化战略凭什么封神?

态度原创

游戏
艺术
家居
数码
亲子

《女神异闻录6》泄露主角太丑?金毛男主太路人!

艺术要闻

2026陕西省青年美术作品展 入选油画

家居要闻

蜂鸟餐椅 线面交错

数码要闻

宏碁推出Predator Atlas 8掌机:8" FHD+ 120Hz 500nits触屏

亲子要闻

“家长听豆包给婴儿每顿只喂60ml奶”体重未增? 豆包回应

无障碍浏览 进入关怀版