网易首页 > 网易科技 > IT业界 > 正文

ChatGPT-4震撼发布!准确性提高,能在SAT上能击败90%人类

0
分享至

最先进的 OpenAI GPT-4 系统介绍 (来源:技术译站)

3月15日消息,美国当地时间周二,人工智能研究公司OpenAI发布了其下一代大型语言模型GPT-4,这是其支持ChatGPT和新必应等应用程序的最新AI大型语言模型。该公司表示,该模型在许多专业测试中的表现超出了“人类水平”。

OpenAI声称,ChatGPT-4比迭代前的GPT-3.5更大,这意味着它接受了更多的数据训练,模型文件中有更多的权重(参数),这也使得它的运行成本更高。该公司声称,该模型“比以往任何时候都更具创造性和协作性”,“可以更准确地解决难题”。它可以解析文本和图像输入,尽管它只能通过文本进行响应。

目前,该领域的许多研究人员认为,AI最近取得的许多进步来自于在数千台超级计算机上运行越来越大的模型,训练过程可能耗资数千万美元。GPT-4就是以“扩大规模”为中心以达到更好结果的例证。

OpenAI承认,该公司使用了微软云计算平台Azure来训练其模型,微软已经向OpenAI投资了数十亿美元。OpenAI以竞争为由,没有公布具体的模型大小或用于训练它的硬件等细节,这些细节可以用来重建模型。

OpenAI的GPT大型语言模型支持许多AI演示,这些演示在过去六个月里始终令科技行业的人们惊叹不已,包括必应的AI聊天机器人和ChatGPT。

ChatGPT-4是对语言模型取得最新进展的预览,这些新进展可能会在未来几周开始向下渗透到聊天机器人等消费产品中。微软周二表示,必应的AI聊天机器人使用GPT-4模型。

OpenAI声称,新模型将产生更少的事实错误答案,更少偏离话题,更少谈论被禁止的话题,甚至在许多标准化考试中表现得比人类更好。

该公司举例说,GPT-4在模拟律师考试中的成绩在所有考生中列于前10%,在SAT阅读考试中进入了前7%,在SAT数学考试中进入前11%。

然而,OpenAI警告说,新模型还不够完美,在许多情况下它的能力不如人类。例如,GPT-4仍然存在所谓的“幻觉”或编造故事等问题,而且在事实上并不可靠。当它犯错的时候,它仍然倾向于坚持自己是正确的。OpenAI首席执行官萨姆·阿尔特曼(Sam Altman)在推特上表示,GPT-4“仍然有缺陷,有很大局限性”,但“它在首次使用时仍然能给你留下深刻印象。”

OpenAI在博客文章中表示:“GPT-4仍有许多已知的局限性,我们正在努力解决,如社交偏见、幻觉和敌意回复等。在一次随意的谈话中,GPT-3.5和GPT-4之间的区别很小。而当任务的复杂性达到足够的阈值时,差异就会显现出来:GPT-4比GPT-3.5更可靠、更有创造力,并且能够处理更多细微差别的指令。”

OpenAI表示,该公司已经与多家公司合作以将GPT-4整合到他们的产品中,包括Duolingo、Stripe和Khan Academy等。这款新模型通过OpenAI每月20美元的ChatGPT订阅服务ChatGPT Plus向用户开放,并为微软的必应聊天机器人提供动力。同时,GPT-4也将作为API的一部分提供,该API允许程序员将AI集成到自己的应用程序中。(小小)

延伸阅读
相关推荐
热点推荐
女教师跳楼再添猛料!父母不退彩礼,再提过分要求,难怪一直逼婚

女教师跳楼再添猛料!父母不退彩礼,再提过分要求,难怪一直逼婚

阿纂看事
2025-12-18 15:04:37
倒反天罡!日本明治天皇玄孙发文称世界上最野蛮的国家是中国

倒反天罡!日本明治天皇玄孙发文称世界上最野蛮的国家是中国

我心纵横天地间
2025-12-17 14:35:24
乐华娱乐创始人杜华发文致谢海南航空,称自己从泰国飞北京突感呼吸不畅,机组广播寻医生为她检查,航司回应

乐华娱乐创始人杜华发文致谢海南航空,称自己从泰国飞北京突感呼吸不畅,机组广播寻医生为她检查,航司回应

极目新闻
2025-12-18 13:32:08
河北民营制造龙头:一年收入超过3600亿,低调排进世界500强行列

河北民营制造龙头:一年收入超过3600亿,低调排进世界500强行列

柳先说
2025-12-18 21:04:53
10家榜上无名!中足联官宣,中超3强在列:北京国安+邵佳一前东家

10家榜上无名!中足联官宣,中超3强在列:北京国安+邵佳一前东家

大秦壁虎白话体育
2025-12-19 00:13:53
“交警”变“交管”不只是换块牌子!4.6亿车主的出行,要变样了

“交警”变“交管”不只是换块牌子!4.6亿车主的出行,要变样了

陈博世财经
2025-12-18 14:33:21
被美国抛弃后,欧洲对华求援,中方用一句话,让普京彻底放心

被美国抛弃后,欧洲对华求援,中方用一句话,让普京彻底放心

蛙斯基娱乐中
2025-12-18 14:31:46
上海交大:每次起床后大量喝水的人,用不了多久,身体或有7变化

上海交大:每次起床后大量喝水的人,用不了多久,身体或有7变化

读懂世界历史
2025-11-23 11:18:04
超重狸花猫被遗弃,火爆全网引14万人关注,带动其他猫被领养

超重狸花猫被遗弃,火爆全网引14万人关注,带动其他猫被领养

Magic宠物社
2025-12-18 14:10:05
她是央视认证的大歌唱家,嫁大30岁二婚老头,如今周游世界很幸福

她是央视认证的大歌唱家,嫁大30岁二婚老头,如今周游世界很幸福

素衣读史
2025-12-17 16:27:51
洪森太太有多美?找遍中国古代诗词,也无法形容她的绝世美貌!

洪森太太有多美?找遍中国古代诗词,也无法形容她的绝世美貌!

古装影视解说阿凶
2025-10-20 06:32:17
退伍后给私人老板当司机,陪她女儿玩了一周,竟改变了自己的人生

退伍后给私人老板当司机,陪她女儿玩了一周,竟改变了自己的人生

农村情感故事
2024-12-12 07:12:49
太离谱!湖南农村高额葬礼,一个普普通通的家庭都要花费上10万元

太离谱!湖南农村高额葬礼,一个普普通通的家庭都要花费上10万元

千言娱乐记
2025-12-18 22:59:52
异性间有这8个信号?大概率互相惦记了

异性间有这8个信号?大概率互相惦记了

风起见你
2025-12-19 04:45:57
万万没有想到,赖清德的父亲赖永都居然还是抗日英雄!

万万没有想到,赖清德的父亲赖永都居然还是抗日英雄!

南权先生
2025-12-13 16:55:04
第92分钟绝杀!19岁天才绝境爆发,英超豪强险胜,成功晋级4强

第92分钟绝杀!19岁天才绝境爆发,英超豪强险胜,成功晋级4强

足球狗说
2025-12-18 06:20:41
保持代谢旺盛的 5 个小技巧,让你想胖都难!

保持代谢旺盛的 5 个小技巧,让你想胖都难!

蝌蚪五线谱
2025-12-17 17:22:53
多国首脑即将赶到东京!高市早苗瘪着嘴笑,全球已收到中国的通知

多国首脑即将赶到东京!高市早苗瘪着嘴笑,全球已收到中国的通知

观星赏月
2025-12-19 00:25:44
灰丝:男人心中的神

灰丝:男人心中的神

疾跑的小蜗牛
2025-12-17 16:02:51
一觉醒来北京南到上海虹桥,京沪夜班高铁0点出发5点到?12306回应:系大客流临时增开,目前仅有12月22日运行

一觉醒来北京南到上海虹桥,京沪夜班高铁0点出发5点到?12306回应:系大客流临时增开,目前仅有12月22日运行

纵相新闻
2025-12-17 23:39:06
2025-12-19 05:44:49

科技要闻

2025新一代人工智能创业大赛总决赛收官

头条要闻

iPhone内存用完就坏了吗 苹果客服回应

头条要闻

iPhone内存用完就坏了吗 苹果客服回应

体育要闻

纽约尼克斯,板正的球队

娱乐要闻

丝芭放大招了!实名举报鞠婧祎经济犯罪

财经要闻

尹艳林:呼吁加快2.5亿新市民落户进程

汽车要闻

在零下30℃的考场里 凡尔赛C5 X和508L拿到了"稳"的证明

态度原创

亲子
教育
数码
房产
公开课

亲子要闻

这些儿童常用药,有娃的家庭赶紧备起来

教育要闻

新文科适合谁学?揭秘3类人成就跨界精英!

数码要闻

LG新一代车用屏下摄像头将亮相CES 2026,画质达非屏下产品99%

房产要闻

抢藏疯潮!封关时代,海口顶奢王炸压轴,传世资产即刻登场!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×