网易首页 > 网易号 > 正文 申请入驻

AI领域迎来重大突破!GPT-5震撼发布,性能全面升级、多领域“屠榜”,告别“幻觉”?

0
分享至

北京时间8月8日凌晨,OpenAI正式发布了备受瞩目的新一代人工智能模型GPT-5。这场长达1个多小时的线上发布会规格之高、细节之多,引发了全球科技界的广泛关注。GPT-5的发布,不仅标志着AI技术的一次巨大飞跃,更被视为构建“超级智能”的重要一步。

性能全面升级,多领域“屠榜”

GPT-5在多个领域的表现都迎来了全面提升。在文本生成、Web开发和视觉感知能力领域,GPT-5均排名第一;在硬提示、编码、数学、创造力、长查询等方面也毫无悬念地拔得头筹。在代号为“峰会”的测试中,GPT-5保持着截至目前最高的Arena分数,堪称实至名归的“屠榜”者。

OpenAI首席执行官Sam Altman对GPT-5的评价极高,他比喻说,如果说GPT-4像中学生,GPT-5就像大学生,而GPT-5则是第一次让他真正感觉像在与一位博士级别的专家交谈。他甚至断言,GPT-5是世界上编码能力最强、写作能力最强以及在医疗保健领域最强的模型。

告别“幻觉”,AI更可靠

“AI幻觉”一直是困扰大型语言模型的难题,但GPT-5在这方面取得了显著进步。与GPT-4o相比,GPT-5在联网搜索时回答出现事实错误的概率降低了45%;在独立思考时,回答出错的概率更是比OpenAI o3降低了80%。

此外,GPT-5还引入了四种全新的“人格”模式,包括犬儒、机器人、倾听者和学霸,用户可以根据自己的喜好设定ChatGPT与自己互动和回答问题的方式。

编码能力逆天,“软件按需生成”时代来临

GPT-5的编码能力堪称逆天。在多个编码基准测试中,GPT-5的表现均优于其他任何模型。在人类最终测试中取得42%的成绩,在SWE基准测试中更是达到了75%的成绩。

在发布会上,OpenAI的后期训练负责人Yann Dubois现场演示了GPT-5的强大编码能力,要求它生成一个用于学习法语并带有互动游戏的网站。GPT-5在短短几秒钟内就编写了数百行代码,并直接展示了网站的前端界面。

此外,GPT-5还展示了一款仅靠一段提示词就创作的3D游戏,其画面精致,物理效果也十分逼真。

更安全、更“诚实”

OpenAI对GPT-5进行了超过五千小时的测试,以确保其安全性。GPT-5在更可靠地处理多步骤任务方面表现更好,不会像以前那样“自信地撒谎”。对于一些可能涉及安全风险的问题,GPT-5会采用“安全补全”机制,在保持安全约束的前提下,给出尽可能有帮助的答案。

全面开放,多版本满足不同需求

GPT-5向所有用户开放,包括普通用户、Plus会员和Pro会员。普通用户可以免费体验GPT-5,但用量有限;Plus会员可获得更多使用量;Pro会员则可以访问具备更强推理能力的GPT-5 Pro版本。GPT-5系列还包括GPT-5-mini、GPT-5-nano等版本,以满足不同用户的需求。

在定价方面,标准版GPT-5每百万输入Token 1.25美元,每百万输出Token 10美元,mini版和Nano版的定价则相对较低。

集成架构,智能调度子模型

GPT-5采用了内嵌式三位一体集成架构,由处理常规问题的GPT-5-main模型、解决复杂任务的GPT-5-thinking深度思考模型、实时决策的路由机制以及额度使用完后启动的mini版本组成。路由机制会根据对话类型、复杂程度、工具需求以及用户的明确意图,快速决定使用哪个模型,自动匹配最适合的模型,用户无需手动切换。

本文源自:金融界

作者:归林

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
贾玲巴黎周“一脸男相”!不爱笑也没梨涡眼神犀利,梳大背头好酷

贾玲巴黎周“一脸男相”!不爱笑也没梨涡眼神犀利,梳大背头好酷

轩逸阿II
2026-01-20 07:54:29
越来越多孩子得白血病?医生坦言:家里4样东西是祸根,趁早扔了

越来越多孩子得白血病?医生坦言:家里4样东西是祸根,趁早扔了

DrX说
2025-11-19 14:42:09
交易所紧急出手!大幅上调!

交易所紧急出手!大幅上调!

数据宝
2026-02-01 08:21:54
77年邓华复出,叶剑英问他有何要求,邓华:让我老哥重回部队工作

77年邓华复出,叶剑英问他有何要求,邓华:让我老哥重回部队工作

兴趣知识
2026-02-01 08:24:57
国产香烟加了助燃剂?测试发现只能烧4分钟,而日本烟能烧7分钟

国产香烟加了助燃剂?测试发现只能烧4分钟,而日本烟能烧7分钟

回旋镖
2026-01-01 21:00:24
中国出口最多的商品:不是芯片、手机和家电,全年出口1.7万亿

中国出口最多的商品:不是芯片、手机和家电,全年出口1.7万亿

荣亭小吏
2026-01-29 13:08:44
中日交恶80天后,美防长落地日本:向中国喊话,高市早苗马上改口

中日交恶80天后,美防长落地日本:向中国喊话,高市早苗马上改口

现代小青青慕慕
2026-02-01 14:15:09
李晨杭州狂炫67元拌川!小饭馆老板认不出

李晨杭州狂炫67元拌川!小饭馆老板认不出

情感大头说说
2026-01-30 11:32:59
腾讯元宝10亿现金红包今日开抢:单个奖最高万元 可直接提现到微信

腾讯元宝10亿现金红包今日开抢:单个奖最高万元 可直接提现到微信

快科技
2026-02-01 07:33:15
腊月十五祭玉帝:"吃三样、食二果、忌一事"决定你2026年的福气

腊月十五祭玉帝:"吃三样、食二果、忌一事"决定你2026年的福气

富贵说
2026-02-01 17:46:58
别再买错了!网购时“旗舰店”和“官方店”差2字,背后差别不小

别再买错了!网购时“旗舰店”和“官方店”差2字,背后差别不小

复转这些年
2026-01-20 08:10:05
女子举办“北京第一届黑色羽绒服选美大赛”引数百人围观:冠军是只小狗,季军称很好玩

女子举办“北京第一届黑色羽绒服选美大赛”引数百人围观:冠军是只小狗,季军称很好玩

极目新闻
2026-02-01 17:23:47
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
中东国家都已意识到了!就算中国高端武器再多,也无法保护他们

中东国家都已意识到了!就算中国高端武器再多,也无法保护他们

轩逸阿II
2026-01-14 04:20:15
平均每人负债1300万,书记吴仁宝去世10年后,华西村的现况如何?

平均每人负债1300万,书记吴仁宝去世10年后,华西村的现况如何?

哄动一时啊
2026-01-24 21:29:54
中国春节赴日2376班航班取消!中国游客消费2万亿被嫌弃,日网友:欧美游客多了,不亏!

中国春节赴日2376班航班取消!中国游客消费2万亿被嫌弃,日网友:欧美游客多了,不亏!

东京新青年
2026-01-27 17:56:04
一级歌唱家沦落到接小商演,给某集团年会助兴,老总是她的小粉丝

一级歌唱家沦落到接小商演,给某集团年会助兴,老总是她的小粉丝

完善法
2026-01-31 14:06:21
“仿佛是僵尸”!浙江两家人接连中招,大人小孩皮肤“报废”!元凶找到了

“仿佛是僵尸”!浙江两家人接连中招,大人小孩皮肤“报废”!元凶找到了

上观新闻
2026-01-29 22:59:13
江诗丹顿手表1元起拍,因“未达到保留价”流拍,拍卖公司人员回应:起拍价是处置单位设定

江诗丹顿手表1元起拍,因“未达到保留价”流拍,拍卖公司人员回应:起拍价是处置单位设定

红星资本局
2026-02-01 15:24:17
糖尿病患者别自己吓自己了,若这4个指标正常,基本不会有并发症

糖尿病患者别自己吓自己了,若这4个指标正常,基本不会有并发症

健康之光
2026-01-23 11:25:06
2026-02-02 05:51:01
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 545857关注度
往期回顾 全部

科技要闻

10亿元宝红包突袭 复刻微信支付还是微视?

头条要闻

特朗普又有疯狂想法:白宫格斗赛 首都飙赛车

头条要闻

特朗普又有疯狂想法:白宫格斗赛 首都飙赛车

体育要闻

德约大度祝贺阿卡 幽默互动逗笑纳达尔

娱乐要闻

春晚第三次联排阵容曝光:全是实力派

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

旅游
时尚
艺术
教育
健康

旅游要闻

春节必打卡10大榜单聚焦“京味年味”

“多巴胺风”又又又火了!这样穿时髦又减龄

艺术要闻

上海“高技派”地标:华润中心竣工,LV总部入驻!

教育要闻

语不惊人死不休,立刚反对学英语有些着魔了,又出新谬论

耳石症分类型,症状大不同

无障碍浏览 进入关怀版