网易首页 > 网易科技 > IT业界 > 正文

ChatGPT-4震撼发布!准确性提高,能在SAT上能击败90%人类

0
分享至

最先进的 OpenAI GPT-4 系统介绍 (来源:技术译站)

3月15日消息,美国当地时间周二,人工智能研究公司OpenAI发布了其下一代大型语言模型GPT-4,这是其支持ChatGPT和新必应等应用程序的最新AI大型语言模型。该公司表示,该模型在许多专业测试中的表现超出了“人类水平”。

OpenAI声称,ChatGPT-4比迭代前的GPT-3.5更大,这意味着它接受了更多的数据训练,模型文件中有更多的权重(参数),这也使得它的运行成本更高。该公司声称,该模型“比以往任何时候都更具创造性和协作性”,“可以更准确地解决难题”。它可以解析文本和图像输入,尽管它只能通过文本进行响应。

目前,该领域的许多研究人员认为,AI最近取得的许多进步来自于在数千台超级计算机上运行越来越大的模型,训练过程可能耗资数千万美元。GPT-4就是以“扩大规模”为中心以达到更好结果的例证。

OpenAI承认,该公司使用了微软云计算平台Azure来训练其模型,微软已经向OpenAI投资了数十亿美元。OpenAI以竞争为由,没有公布具体的模型大小或用于训练它的硬件等细节,这些细节可以用来重建模型。

OpenAI的GPT大型语言模型支持许多AI演示,这些演示在过去六个月里始终令科技行业的人们惊叹不已,包括必应的AI聊天机器人和ChatGPT。

ChatGPT-4是对语言模型取得最新进展的预览,这些新进展可能会在未来几周开始向下渗透到聊天机器人等消费产品中。微软周二表示,必应的AI聊天机器人使用GPT-4模型。

OpenAI声称,新模型将产生更少的事实错误答案,更少偏离话题,更少谈论被禁止的话题,甚至在许多标准化考试中表现得比人类更好。

该公司举例说,GPT-4在模拟律师考试中的成绩在所有考生中列于前10%,在SAT阅读考试中进入了前7%,在SAT数学考试中进入前11%。

然而,OpenAI警告说,新模型还不够完美,在许多情况下它的能力不如人类。例如,GPT-4仍然存在所谓的“幻觉”或编造故事等问题,而且在事实上并不可靠。当它犯错的时候,它仍然倾向于坚持自己是正确的。OpenAI首席执行官萨姆·阿尔特曼(Sam Altman)在推特上表示,GPT-4“仍然有缺陷,有很大局限性”,但“它在首次使用时仍然能给你留下深刻印象。”

OpenAI在博客文章中表示:“GPT-4仍有许多已知的局限性,我们正在努力解决,如社交偏见、幻觉和敌意回复等。在一次随意的谈话中,GPT-3.5和GPT-4之间的区别很小。而当任务的复杂性达到足够的阈值时,差异就会显现出来:GPT-4比GPT-3.5更可靠、更有创造力,并且能够处理更多细微差别的指令。”

OpenAI表示,该公司已经与多家公司合作以将GPT-4整合到他们的产品中,包括Duolingo、Stripe和Khan Academy等。这款新模型通过OpenAI每月20美元的ChatGPT订阅服务ChatGPT Plus向用户开放,并为微软的必应聊天机器人提供动力。同时,GPT-4也将作为API的一部分提供,该API允许程序员将AI集成到自己的应用程序中。(小小)

延伸阅读
相关推荐
热点推荐
两性关系:50岁后女性最渴望的生理性需求

两性关系:50岁后女性最渴望的生理性需求

第7情感
2025-09-16 08:42:01
汪小菲果然是精明,S妈再次发声

汪小菲果然是精明,S妈再次发声

悦心知足
2025-09-17 03:47:58
布莱德・皮特以 Cliff Booth 身份重返大银幕 黄色工装装尽显范儿

布莱德・皮特以 Cliff Booth 身份重返大银幕 黄色工装装尽显范儿

述家娱记
2025-09-16 12:13:22
突然怂了?意义仍然非凡!罗永浩:决定放弃!但若失踪,或被跨省

突然怂了?意义仍然非凡!罗永浩:决定放弃!但若失踪,或被跨省

瑜说还休
2025-09-16 07:36:57
希特勒临死前下一道命令,德国至今仍忠实执行,连美国都称赞不已

希特勒临死前下一道命令,德国至今仍忠实执行,连美国都称赞不已

小豫讲故事
2025-09-11 06:00:09
联名《黑神话:悟空》 安克如意棒充电宝发布:220W三口快充

联名《黑神话:悟空》 安克如意棒充电宝发布:220W三口快充

快科技
2025-09-16 14:47:04
一觉醒来,iPhone用户有点忙,“改变最大的一次更新”

一觉醒来,iPhone用户有点忙,“改变最大的一次更新”

都市快报橙柿互动
2025-09-16 09:02:45
中国车市真黑

中国车市真黑

后视镜里de未来
2025-09-15 14:31:44
26万难民逃到中国“赖着”不走,还想入中国籍:做梦都想当中国人

26万难民逃到中国“赖着”不走,还想入中国籍:做梦都想当中国人

近史博览
2025-08-19 11:01:20
围攻黄岩岛惨败,菲律宾认怂,举白旗后10艘船的损失统计出来了!

围攻黄岩岛惨败,菲律宾认怂,举白旗后10艘船的损失统计出来了!

青青子衿
2025-09-17 02:45:14
苍井空近日公开了带双胞胎儿子参加学园祭的照片,引发热议

苍井空近日公开了带双胞胎儿子参加学园祭的照片,引发热议

随波荡漾的漂流瓶
2025-09-14 20:11:06
特朗普连开3枪,公开否定台湾属于中国?国民党递出一句决绝的话

特朗普连开3枪,公开否定台湾属于中国?国民党递出一句决绝的话

墨兰史书
2025-09-15 07:05:10
去暨南大学报到才2天,全红婵被嘲"没教养没文化",背后真相太现实

去暨南大学报到才2天,全红婵被嘲"没教养没文化",背后真相太现实

巷子里的历史
2025-09-16 14:04:36
辽宁老板亲述:我所经历的朝鲜设备贸易潮与背后的惊心内幕

辽宁老板亲述:我所经历的朝鲜设备贸易潮与背后的惊心内幕

百姓识天下
2025-09-16 15:37:15
闹大了!西贝预制菜事件发酵,深圳城中村挂出“拒绝预制菜”标识

闹大了!西贝预制菜事件发酵,深圳城中村挂出“拒绝预制菜”标识

明月杂谈
2025-09-15 10:50:52
比预售便宜近2万元,享界S9T售价30.98万元起,余承东:这款车是我坚持要做的

比预售便宜近2万元,享界S9T售价30.98万元起,余承东:这款车是我坚持要做的

时代财经
2025-09-16 23:30:16
曼联对阿莫林下课立场曝光!球员对其信心渐失,死守343还乱用人

曼联对阿莫林下课立场曝光!球员对其信心渐失,死守343还乱用人

罗米的曼联博客
2025-09-16 07:34:25
辛柏青丧妻刚满100天,离谱的事就发生了,被撮合娶马伊琍引争议

辛柏青丧妻刚满100天,离谱的事就发生了,被撮合娶马伊琍引争议

凉羽亭
2025-08-28 11:40:48
纵览热点|违建豪宅“英之园”拆除后遗留大片建筑垃圾无人清理?当地:是小部分残留垃圾,地块后续用途还在商议

纵览热点|违建豪宅“英之园”拆除后遗留大片建筑垃圾无人清理?当地:是小部分残留垃圾,地块后续用途还在商议

纵览新闻
2025-09-16 21:22:03
难怪菲律宾人举白旗!中方终于认真上手段,菲律宾吃亏终于闭嘴了

难怪菲律宾人举白旗!中方终于认真上手段,菲律宾吃亏终于闭嘴了

青青子衿
2025-09-17 00:26:40
2025-09-17 06:19:00

科技要闻

2025款Apple Watch全系怎么选?

头条要闻

女子误触"化骨水"去世:9点误踩15点心脏衰竭 当天死亡

头条要闻

女子误触"化骨水"去世:9点误踩15点心脏衰竭 当天死亡

体育要闻

2022:勇士归来,库里的第四个冠军

娱乐要闻

李小璐母亲:女儿嫁给贾乃亮我好后悔

财经要闻

扩大服务消费 9部门提出5方面19条举措

汽车要闻

智能体豪华旅行车 享界S9T30.98万元起售

态度原创

游戏
家居
本地
手机
公开课

《刺客信条:影》“淡路之爪”DLC试玩报告"/> 主站 商城 论坛 自运营 登录 注册 《刺客信条:影》“淡路之爪”DLC试玩报告:故事还未结束 ROO...

家居要闻

江南秘境 理想生活模样

本地新闻

云游忻州 | 慢时光!老街逛吃,烟火气超上头~

手机要闻

华为鸿蒙 HarmonyOS 6.0.0.100 开发者 / 用户尝鲜版本开启推送

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×