网易首页 > 网易号 > 正文 申请入驻

电厂丨上能考托福、下能玩梗图的 GPT-4 发布,还有哪些新内容?

0
分享至

记者 张勇毅

编辑 高宇雷

当地时间2023年3月14日,北京时间3月15日凌晨,OpenAI 发布了新一代大模型 GPT-4。

大模型就是在 ChatGPT 背后最重要的存在,大模型的性能,直接决定了表现在外、呈现给用户答案的聪慧程度,因此本次 GPT-4的发布在数周之前就已经是让人津津乐道的话题。

如今,这个能再一次掀起 AI 浪潮的重磅炸弹终于落地,同时带着三个方向的新改进,试图进一步加固 OpenAI 在这一领域的统治地位。

长内容识别

首先是 GPT-4的长内容识别能力:更新迭代之后的 GPT-4能快速理解最高2.5万字输入内容,同时并整合总结。同时在内容推理能力方面,GPT-4也远强于 ChatGPT:在你发送一篇长文或是财报给 GPT-4后,它不仅能更快的生成梗概总结,同时还能以更加精炼的语言,帮你「抓重点」,简直是学生党复习以及分析师看财报的利器。

之前网络上热衷于让 ChatGPT 参加的各种人类考试,现在 OpenAI 也亲自下场,带着 GPT-4来到了做题家们的主场挑战:按照 OpenAI 公布的结果,让 GPT-4与 ChatGPT 同时参加律师资格考试,前者能拿到前90% 的成绩,而后者虽然能通过测试,但也只能拿到倒数10% 的排名。 如果参加的是生物奥林匹克竞赛,两者的差距还能被进一步拉大。同理,参加人类类似托福、LSAT、GRE 等语言考试也能得到类似的结果。

图像识别

本次 OpenAI 宣布另一个 GPT-4升级重点是加入了对输入图像内容的支持:GPT-4能自行理解输入图像的内容以及寓意,同时给出准确的回复。比如给衣柜拍张照片,然后要求 GPT-4生成一份旅行衣物单。或者把你准备好的食材放在桌子上,拍照发给 GPT-4,问问它这些材料能做出什么食物。

GPT-4能自动识别图中的食材究竟是什么,并自动根据这些内容给出适当的组合答案。

在官方演示中,GPT-4甚至还能帮你翻译梗图其中的意思:或许下次你在上网冲浪时,如果网友再给你发一些看不懂的梗图,可以先拿来问问 GPT-4。

但最能展现 GPT-4图像识别性能的桥段,可能还是发布视频中演示的场景:主持人在笔记本上画出了一个网页的草稿,然后用手机拍下来,发送给 GPT-4,要求其生成这个网页的代码。

紧接着,一个网页的代码就出现在 GPT-4的回复中:这是一个可以直接完整运行的网页代码,这一过程仅用了不到两分钟,生成网站代码更是只用了不到十秒钟。

这场演示,不仅让人看到 GPT-4在代码生成方面的巨大潜力,更会让人不由得产生一种「人的沟通才是拖慢 GPT-4运行效率的原因」的感觉。

更安全,更可靠

之前在 ChatGPT 中,一个饱受诟病的问题是它经常会「不懂装懂」:在涉及到事实性的提问对话中,ChatGPT 有时会一本正经地给出完全错误的答案。更严重的问题是 ChatGPT 经常还能「引经据典」地佐证自己完全错误的结论,甚至回答缜密到能把很多专业作者误导。这一现象毫无疑问加剧了很多用户对于 AI 大模型的不信任。

到了 GPT-4发布时,OpenAI 将回答内容的事实核查作为了本次升级的重点,同时宣称 ChatGPT 4更安全,也更加可靠:

我们花了6个月的时间使 GPT-4更安全、更一致。 在内部评估中,与 GPT-3.5相比,GPT-4响应禁止内容请求的概率低82%,产出正确事实结果的概率高40%

换言之,GPT-4在回复内容的事实核查以及有害内容的阻断上做出了明显的改善。OpenAI 也公开承认这要得益于过去 ChatGPT 海量的用户数据给大模型优化带来的助力,用越来越多的数据来创建更加强大的语言模型。但 OpenAI 仍然在公告中强调:「我们正在与第三方研究团队合作,对错误答案的潜在影响作出评估」。

以及最重要的是 GPT-4也与之前发布的 ChatGPT 3.5相同的问题:GPT-4储存的数据截止至2021年9月,与之前的 GPT 3.5相同。这仍会在一定程度上限制 GPT-4的应用场景:比如上面提到的「解释梗图」功能,如果 GPT-4本身不能跟上当前热点的话,或许也很难准确把握其中的精髓所在。

应用

虽然今天是 OpenAI 的正式发布日,但在此之前作为大股东的微软已经按耐不住很久了:不仅微软德国 CTO 在一周前「说漏嘴」表示 GPT-4即将发布,今天 GPT-4终于正式发布后,微软也迫不及待地宣布 New Bing 早已经用上了 GPT-4:并表示「如果你在过去五周内用过(New Bing),那么你其实已经体验过 GPT-4的早期版本了」。

不过很多用户之所以在 New Bing 的使用中没有感受到和 ChatGPT 明显的区别,OpenAI 解释的原因「对话复杂度不够」,换言之就是日常闲聊提问并不能快速区分出 GPT-4与 GPT-3.5的区别,只有当问题足够复杂、需要同时处理的信息足够多时,GPT-4能更好地区分细枝末节的优势才能体现出来。

除了早早就「走关系」用上 GPT-4的 Bing,其他与 OpenAI 有合作关系的、首批使用的应用服务与机构也在今天被一并公开:例如语言学习服务多邻国于今天宣布推出整合 GPT-4能力的 Duolingo Max 服务,在现有的付费订阅功能基础之上还提供问题解答以及错误解释功能。

为视障人士提供服务的公司 Be My Eyes,也宣布将使用 GPT-4,来改变现有的视觉辅助识别服务:他们开始在应用程序中加入基于 GPT-4开发而来的视觉驱动模块,测试结果「能产生与人类志愿者相同水平的理解内容」。

按照 OpenAI 的说法,从去年11月延续至今的 ChatGPT 全球爆火,他们也「完全没有预料到」。

他们或许更加没有预料到,伴随着 ChatGPT 爆火而来的,是席卷全球的一次 AI 产业革命。今天 GPT-4的发布无疑是在这堆火焰之上添加了新的燃料。

目前,订阅 ChatGPT Plus 的用户已经能先期体验到 GPT-4,几乎没有人会怀疑之后 ChatGPT 的迭代速度会越来越快。

责任编辑:郜雪丹_NT5097

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
汶川地震中,丢了学生逃跑的老师“范跑跑”,18年后竟成了大赢家

汶川地震中,丢了学生逃跑的老师“范跑跑”,18年后竟成了大赢家

芳芳历史烩
2026-05-24 01:06:29
黎家盈带20多封信赴太空,丈夫放弃香港事业:家人付出有多大

黎家盈带20多封信赴太空,丈夫放弃香港事业:家人付出有多大

米果说识
2026-05-24 19:17:35
完成“黑5”,博尔顿力克斯托克港时隔7年重返英冠联赛

完成“黑5”,博尔顿力克斯托克港时隔7年重返英冠联赛

懂球帝
2026-05-24 22:47:07
吴婉芳次子大婚!干爹张学友献唱,每桌两瓶茅台,郑伊健夫妇也在

吴婉芳次子大婚!干爹张学友献唱,每桌两瓶茅台,郑伊健夫妇也在

裕丰娱间说
2026-05-24 07:05:20
美媒感慨:如果不是中国还在反抗特朗普,几乎全世界都向他投降了

美媒感慨:如果不是中国还在反抗特朗普,几乎全世界都向他投降了

观史搜寻着
2026-05-25 03:36:45
趁你病要你命!普京访华途中,昔日兄弟今日敌人:直接制裁俄罗斯

趁你病要你命!普京访华途中,昔日兄弟今日敌人:直接制裁俄罗斯

半身Naked
2026-05-24 05:44:49
手握百万存款的普通家庭,如今在社会啥层次?多数人都没认清现实

手握百万存款的普通家庭,如今在社会啥层次?多数人都没认清现实

复转这些年
2026-05-24 17:17:36
3年感情纠葛结束!李梦公布新恋情,与张隆分手背后藏有多少无奈

3年感情纠葛结束!李梦公布新恋情,与张隆分手背后藏有多少无奈

拳击时空
2026-05-24 05:55:54
汪峰罕见集齐四娃!小苹果神似葛荟婕,二女儿首露面 幼子脸打码

汪峰罕见集齐四娃!小苹果神似葛荟婕,二女儿首露面 幼子脸打码

小鋭有话说
2026-05-25 01:08:53
一次性清退30万执法人员:中国做了一次史无前例的“反向实验”

一次性清退30万执法人员:中国做了一次史无前例的“反向实验”

李博世财经
2026-05-24 16:56:34
神舟23乘组公布,朱杨柱太空住一年,张志远、黎家盈首次执行任务

神舟23乘组公布,朱杨柱太空住一年,张志远、黎家盈首次执行任务

光电科技君
2026-05-23 10:28:32
斯洛特:欧冠资格不是我们的主要目标,我们想再次英超夺冠

斯洛特:欧冠资格不是我们的主要目标,我们想再次英超夺冠

懂球帝
2026-05-25 06:11:08
孩子被开水烫伤,妈妈直接用冰块敷坑了娃,医生:组织坏死毁容了

孩子被开水烫伤,妈妈直接用冰块敷坑了娃,医生:组织坏死毁容了

菁妈育儿
2026-05-24 10:36:51
翻旧账了!10年前姚晨微博被扒出,精忠报国将“忠”绣成“终”…

翻旧账了!10年前姚晨微博被扒出,精忠报国将“忠”绣成“终”…

火山詩话
2026-05-24 07:05:54
唏嘘!西汉姆联时隔15年再从英超降级 队史第3次 4大名将或离队

唏嘘!西汉姆联时隔15年再从英超降级 队史第3次 4大名将或离队

我爱英超
2026-05-25 01:37:16
上市公司发公告就是在暗示散户该走还是该留。

上市公司发公告就是在暗示散户该走还是该留。

流苏晚晴
2026-05-09 18:41:02
突发!正部级官员任上被查,曾是执掌两大车企的“汽车老兵”,反腐任重道远!

突发!正部级官员任上被查,曾是执掌两大车企的“汽车老兵”,反腐任重道远!

运营商段子手
2026-05-25 00:05:14
马刺传闻:内部人士透露德阿隆·福克斯的交易难题迫在眉睫

马刺传闻:内部人士透露德阿隆·福克斯的交易难题迫在眉睫

好火子
2026-05-24 23:41:26
意甲大结局:罗马科莫进欧冠 米兰尤文踢欧联 39岁瓦尔迪随队降级

意甲大结局:罗马科莫进欧冠 米兰尤文踢欧联 39岁瓦尔迪随队降级

我爱英超
2026-05-25 06:11:34
汪小菲证实父女关系依旧很好,玥儿走在前面动作潇洒,像妈妈

汪小菲证实父女关系依旧很好,玥儿走在前面动作潇洒,像妈妈

笑谈历史阿晡
2026-05-24 17:24:37
2026-05-25 07:04:49
电厂 incentive-icons
电厂
探索科技公司的未知,为你充电
2153文章数 1060关注度
往期回顾 全部

科技要闻

我戴着摄像头上班,正在帮AI抢走我饭碗

头条要闻

山西矿难遇难者家属:父亲年过半百 我们一直劝他别干了

头条要闻

山西矿难遇难者家属:父亲年过半百 我们一直劝他别干了

体育要闻

唐斯发牌,大头逆袭:骑士跌向残忍夏季

娱乐要闻

王鹤棣掉粉超20万!代言和作品遭抵制

财经要闻

什么情况下,本轮AI大行情会结束?

汽车要闻

国民家轿再上新 帝豪向上系列限时5.59万起

态度原创

手机
亲子
房产
游戏
教育

手机要闻

iPhone 20周年纪念款渲染图出炉:曲面屏加持,配置规格更激进了

亲子要闻

六一儿童节,用贴纸给女儿化妆,和化妆师的手法一样!

房产要闻

疯狂周末,海口楼市突然爆了!

魔兽世界:时光服团本难度争议再起,玩家疯狂diss,该加强吗?

教育要闻

女教师"幼态字体"走红,被家长建议停职, 学校:停职,接受调查

无障碍浏览 进入关怀版