网易首页 > 网易科技 > IT业界 > 正文

ChatGPT-4震撼发布!准确性提高,能在SAT上能击败90%人类

0
分享至

最先进的 OpenAI GPT-4 系统介绍 (来源:技术译站)

3月15日消息,美国当地时间周二,人工智能研究公司OpenAI发布了其下一代大型语言模型GPT-4,这是其支持ChatGPT和新必应等应用程序的最新AI大型语言模型。该公司表示,该模型在许多专业测试中的表现超出了“人类水平”。

OpenAI声称,ChatGPT-4比迭代前的GPT-3.5更大,这意味着它接受了更多的数据训练,模型文件中有更多的权重(参数),这也使得它的运行成本更高。该公司声称,该模型“比以往任何时候都更具创造性和协作性”,“可以更准确地解决难题”。它可以解析文本和图像输入,尽管它只能通过文本进行响应。

目前,该领域的许多研究人员认为,AI最近取得的许多进步来自于在数千台超级计算机上运行越来越大的模型,训练过程可能耗资数千万美元。GPT-4就是以“扩大规模”为中心以达到更好结果的例证。

OpenAI承认,该公司使用了微软云计算平台Azure来训练其模型,微软已经向OpenAI投资了数十亿美元。OpenAI以竞争为由,没有公布具体的模型大小或用于训练它的硬件等细节,这些细节可以用来重建模型。

OpenAI的GPT大型语言模型支持许多AI演示,这些演示在过去六个月里始终令科技行业的人们惊叹不已,包括必应的AI聊天机器人和ChatGPT。

ChatGPT-4是对语言模型取得最新进展的预览,这些新进展可能会在未来几周开始向下渗透到聊天机器人等消费产品中。微软周二表示,必应的AI聊天机器人使用GPT-4模型。

OpenAI声称,新模型将产生更少的事实错误答案,更少偏离话题,更少谈论被禁止的话题,甚至在许多标准化考试中表现得比人类更好。

该公司举例说,GPT-4在模拟律师考试中的成绩在所有考生中列于前10%,在SAT阅读考试中进入了前7%,在SAT数学考试中进入前11%。

然而,OpenAI警告说,新模型还不够完美,在许多情况下它的能力不如人类。例如,GPT-4仍然存在所谓的“幻觉”或编造故事等问题,而且在事实上并不可靠。当它犯错的时候,它仍然倾向于坚持自己是正确的。OpenAI首席执行官萨姆·阿尔特曼(Sam Altman)在推特上表示,GPT-4“仍然有缺陷,有很大局限性”,但“它在首次使用时仍然能给你留下深刻印象。”

OpenAI在博客文章中表示:“GPT-4仍有许多已知的局限性,我们正在努力解决,如社交偏见、幻觉和敌意回复等。在一次随意的谈话中,GPT-3.5和GPT-4之间的区别很小。而当任务的复杂性达到足够的阈值时,差异就会显现出来:GPT-4比GPT-3.5更可靠、更有创造力,并且能够处理更多细微差别的指令。”

OpenAI表示,该公司已经与多家公司合作以将GPT-4整合到他们的产品中,包括Duolingo、Stripe和Khan Academy等。这款新模型通过OpenAI每月20美元的ChatGPT订阅服务ChatGPT Plus向用户开放,并为微软的必应聊天机器人提供动力。同时,GPT-4也将作为API的一部分提供,该API允许程序员将AI集成到自己的应用程序中。(小小)

延伸阅读
相关推荐
热点推荐
穆里尼奥将上演另类帽子戏法!强挖拜仁巨星,英超豪门全力支持

穆里尼奥将上演另类帽子戏法!强挖拜仁巨星,英超豪门全力支持

足球漫漫跳
2024-05-28 10:15:58
阉割后还能9.4,它依旧封神

阉割后还能9.4,它依旧封神

影探
2024-05-27 13:53:57
CCTV5直播,中国女篮明日亮剑,迎战澳大利亚女篮,郑薇冲开门红

CCTV5直播,中国女篮明日亮剑,迎战澳大利亚女篮,郑薇冲开门红

最爱生活汇
2024-05-28 13:10:36
订了600万?安卓恨透华为了,说好的做高价保护市场可下手真狠!

订了600万?安卓恨透华为了,说好的做高价保护市场可下手真狠!

奇奇怪怪的冒险
2024-05-27 21:11:33
A股:突发,利好来袭、势不可挡,明天周三注定会有一场好戏

A股:突发,利好来袭、势不可挡,明天周三注定会有一场好戏

静守时光落日
2024-05-28 14:36:13
他是林彪的第一心腹,晚年选择“装聋作哑”,死后千人为其送行

他是林彪的第一心腹,晚年选择“装聋作哑”,死后千人为其送行

洞鉴五千年
2024-05-27 11:32:20
相信我!胰岛素抵抗就得饿!

相信我!胰岛素抵抗就得饿!

今日养生之道
2024-05-28 16:37:37
北京明日将迎全市性雷阵雨天气!

北京明日将迎全市性雷阵雨天气!

家住朝阳
2024-05-28 20:03:16
苏群:无论绿军以何种方式进总决 大多数人还会以老眼光看低他们

苏群:无论绿军以何种方式进总决 大多数人还会以老眼光看低他们

直播吧
2024-05-28 10:57:10
女市委书记高速路上被警车别停,两名便衣下车对其进行搜身揩油

女市委书记高速路上被警车别停,两名便衣下车对其进行搜身揩油

神奇的锤子
2024-05-19 14:16:07
武书连2024全国高校排名出炉,快来看看你们母校排名多少位

武书连2024全国高校排名出炉,快来看看你们母校排名多少位

小鬼头体育
2024-05-28 20:06:11
"叔叔昨晚来过":三岁女儿无意中的一句话,把夫妻两人惊出冷汗

"叔叔昨晚来过":三岁女儿无意中的一句话,把夫妻两人惊出冷汗

千面凡君
2024-05-27 07:30:14
梅德韦杰夫:一旦发生核对抗,波兰肯定会收到应得的放射性灰烬

梅德韦杰夫:一旦发生核对抗,波兰肯定会收到应得的放射性灰烬

观察者网
2024-05-27 11:39:05
为什么不去拉面店,非和星巴克的座位较劲?

为什么不去拉面店,非和星巴克的座位较劲?

桃溪读书
2024-05-27 23:36:56
结婚多年,在我面前一直性冷淡的老婆,没想到竟有如此疯狂的一面

结婚多年,在我面前一直性冷淡的老婆,没想到竟有如此疯狂的一面

封河日丽
2023-05-23 12:44:05
比利时欧洲杯25人名单:德布劳内领衔,卢卡库入围,皇马门神落选

比利时欧洲杯25人名单:德布劳内领衔,卢卡库入围,皇马门神落选

我爱英超
2024-05-28 16:17:44
汪小菲花样秀恩爱,说马筱梅“嘴太欠”,总喜欢带着俩娃到处玩!

汪小菲花样秀恩爱,说马筱梅“嘴太欠”,总喜欢带着俩娃到处玩!

小咪侃娱圈
2024-05-16 11:11:33
这谁顶得住嘛!杨紫这身材,这才是尤物啊!

这谁顶得住嘛!杨紫这身材,这才是尤物啊!

冷却爱情
2024-04-19 10:10:08
发现不了歼-20用这找补?解放军歼16和轰6双双突然遭台军战机锁定,赖清德上任或许将为武统送上“神助攻”!

发现不了歼-20用这找补?解放军歼16和轰6双双突然遭台军战机锁定,赖清德上任或许将为武统送上“神助攻”!

澳门月刊
2024-05-26 05:20:02
陕西高校一老师从32楼一跃而下,生前最后一条朋友圈曝光

陕西高校一老师从32楼一跃而下,生前最后一条朋友圈曝光

此处已无情
2024-05-28 18:28:53
2024-05-28 22:42:44

科技要闻

4月中国手机需求回升 iPhone出货量增长52%

头条要闻

杭州不限购后 河南购房者花2300多万3天连买8套房

头条要闻

杭州不限购后 河南购房者花2300多万3天连买8套房

体育要闻

阿根廷一代神锋,击碎了沙特的金元足球梦

娱乐要闻

昆凌晒三胎正面照,2岁妹妹超像周杰伦

财经要闻

东方通收购藏雷 花6亿买来"业绩变脸"

汽车要闻

三联屏/纯电续航318km 岚图FREE 318官图发布

态度原创

家居
亲子
艺术
手机
公开课

家居要闻

圆的世界 流动的曲线与自如的空间

亲子要闻

#宝宝罩衣 #母婴好物 #罩衣 #围兜 #儿童吃饭罩衣推荐

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

手机要闻

曝iOS 18支持App图标颜色更改,更多细节下月见

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版
×