网易首页 > 网易号 > 正文 申请入驻

GPT-5泄露!首次统一GPT和o系列,实测demo抢先曝光,下周发布?

0
分享至

明敏 鹭羽 发自 凹非寺
量子位 | 公众号 QbitAI

GPT-5这回是真的要来了。

现在,全网都在“偶遇”GPT-5。

不仅是ChatGPT上有踪迹:

而且在MacOS应用的模型列表中也发现了GPT-5。

还有Cursor、微软Copilot以及OpenAI API平台上,也都被网友捉到已经悄悄接入/测试GPT-5。

这一大波泄露,大家对GPT-5的热情和好奇再次被重新拉回高点,还是奥特曼会玩啊。

连向来怼天怼地的马库斯都说:不开玩笑,这一次GPT-5真的要来了。

从已经泄露的信息来看,GPT-5肯定更强大。

它将整合GPT系列和o系列,实现多模态和推理能力大一统、编程能力很强、百万tokens上下文、支持MCP等。

最快下周就会发布!

据说微软Copilot上的GPT-5将向所有人开放,不受订阅限制。今年3月,奥特曼在采访中还说了GPT-5将免费向用户开放。

感觉GPT-5这一波,是要全面铺开啊。

所以到底有多强?

两款模型都编程能力突出

根据OpenAI内部人士透露,GPT-5实现推理能力(o系列)和多模态交互能力(4o以及GPT系列)的大一统,以后不用再手动切换模型。

模型包含多个版本:

  • GPT‑5 主模型(代号 “nectarine” 或 “o3‑alpha”)
  • GPT‑5 mini(代号 “lobster”)
  • GPT‑5 nano(代号 “starfish”)

模型的技术亮点可能包括:

  • 输入上下文窗口高达100万tokens,输出可达10万tokens。
  • 支持MCP(模型上下文协议)与并行工具调用。
  • 动态处理短时与长时推理,集成 Code Interpreter 与其他工具。
  • 性能更快、更可靠、更少幻觉、提升长期对话记忆与逻辑处理能力。

其中GPT-5(o3-alpha)被曝在高级编程方面表现出色,能达到接近人类程序员水平,“实现更快、更精准的软件开发”。

它可以自动编写高质量的游戏原型,支持很多应用程序定制以及可以根据特定要求进一步细化。

以及在物理方面也表现出色,一些zero-shot的demo效果也很不错。

Lobster(mini版本代号)有消息称它是一个专用的编程模型。在精度和功能方面均优于Claude 4等模型,尤其是在一些复杂的编码任务上。

Lobster可以通过极少的输入快速生成结构完整、功能准确的代码,非常适合处理凌乱的遗留代码,可以自动优化代码结构、清除冗余,同时管理大型软件项目中的依赖关系。

例如一名用户让Lobster和另一个模型同时创建交互式神经网络动画,Lobster一次性就生成了一个带有彩色节点的解决方案,而另一个模型在代码运行中出现错误。

另外Lobster据悉也集成了o3系列模型的高级推理能力,能在简单任务中使用快速响应模式,在复杂任务中触发深层推理模块,更擅长逻辑推理以及解决数学问题。

支持文本、图像、工具调用等多模态,具备类似Agent的多步骤组合执行能力,可以让其同时完成解释图像、编写代码和使用工具等任务,而无需像GPT-4一次只能处理一类输出。

Lobster将是编码、推理、多模态理解的融合,将OpenAI之前彼此独立的模型集合在一起,让用户直接拥有一个功能更强大的工作助手,轻松执行复杂的多步骤任务。

starfish(nano版本)则在前几天悄悄出现在了大模型竞技场上。

测试结果显示,这个模型只能做静态的小游戏界面,无法启动游戏。

除了模型本身外,现在微软和cursor也被曝将火速接入GPT-5。

微软正试行新版Copilot的“Smart 模式”(或称 “magic mode”),能够智能判断何时调用GPT‑5的深度推理与多模态能力,以简化用户无需手动选择模型的流程。这项功能显示微软极可能在GPT‑5发布后第一时间集成该模型至Copilot及Microsoft 365生态中,Azure也在为集成GPT-5做准备。

同时也有人发现,cursor团队正在内部测试GPT-5 Alpha版本(图中被模糊掉的部分原来标了GPT-5-Alpha)。

但大家不容易被奥特曼忽悠了

从各方泄露信息来看,GPT-5确实如奥特曼所说,强得可怕。

不过,现在大家更冷静、更理智、也更不容易被忽悠了。

有人就说,那又如何?GPT-5可能在刚刚发布时表现很好,1周过去它就会开始变笨,像此前所有模型一样。

也有人表示这可能是因为模型发布后,出于安全考量会ban一部分能力,所以让大家感觉这是炒作出来的幻象。

“泼冷水王”马库斯也发文表示,即便GPT-5真的更强大,但是他还是要给出7个悲观预测

  1. 尽管GPT-5在能力上会远超GPT-4,但GPT-5仍然是难以控制的,会继续犯一些难以预料的低级错误,甚至不会完全听从指令操作。
  2. GPT-5仍然难以处理一些复杂的物理、心理和数学推理任务。
  3. 幻觉依旧普遍,且误导性更高,更容易生成看起来正确但实际内容错误的输出。
  4. 自然语言输出仍然无法可靠地链接到下游系统(如数据库、虚拟助手等),自然语言指令难以准确映射到用户意图上。
  5. GPT-5不会是像AGI一样的通用人工智能,仍旧需要其它工具协助完成复杂场景任务。
  6. 系统仍将无法稳定地遵循有用无害的人类价值观,在输出回答时可能隐含部分偏见。
  7. GPT-5只是基础的规模扩展,未来AGI将朝向更结构化、具备显性知识与规划能力发展,与更广泛的其它技术集成,而这些都是GPT系列所缺乏的。

社区里也弥漫着相似的观点,毕竟已经被奥特曼溜了太多次,再不发布,网友们都累了……

天天各种真假混杂的爆料,一些泄露的GPT-5基准测试都是fake news,网友表示,现在除了官方,谁都不可信。

当然也有不少网友认为,这些“不经意间的”泄漏,都是OpenAI在炒作。

总之,不管模型是不是真如宣传所说的这么好,都赶紧发布吧!

参考链接:
[1]https://www.geeky-gadgets.com/openai-gpt-5-lobster-ai/
[2]https://garymarcus.substack.com/p/what-to-expect-when-youre-expecting-62e
[3]https://x.com/nicksomed/status/1950507062091485551
[4]https://www.bgr.com/1926255/gpt-5-leaks-reveal-more-features-ahead-of-launch/?utm_source=chatgpt.com

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
男女干部戴头套开房后续:女主高清照片流出,男主六月新婚

男女干部戴头套开房后续:女主高清照片流出,男主六月新婚

没有偏旁的常庆
2025-12-25 06:58:51
李煜至死没想通:最该联手的钱弘俶,为何捅他一刀?

李煜至死没想通:最该联手的钱弘俶,为何捅他一刀?

爱历史
2026-01-25 11:25:36
航天电子击鼓传花撞上SpaceX百万卫星,谁在被现实打脸

航天电子击鼓传花撞上SpaceX百万卫星,谁在被现实打脸

粤语音乐喷泉
2026-02-01 10:04:27
1988年政治部主任深夜接军区命令:控制你们师长,他身上有3把枪

1988年政治部主任深夜接军区命令:控制你们师长,他身上有3把枪

兴趣知识
2026-01-31 10:48:03
庆祝时刻,莱巴金娜一袭红裙拍摄澳网女单冠军写真

庆祝时刻,莱巴金娜一袭红裙拍摄澳网女单冠军写真

懂球帝
2026-02-01 12:16:16
曹操为什么喜欢寡妇?许多人不明白,看完不得不佩服曹操的智慧

曹操为什么喜欢寡妇?许多人不明白,看完不得不佩服曹操的智慧

铭记历史呀
2026-01-29 18:27:55
大S一周年纪念日前墓地太闹腾了吧?具俊晔哭完韩国主持人接着哭

大S一周年纪念日前墓地太闹腾了吧?具俊晔哭完韩国主持人接着哭

安宁007
2026-02-01 06:50:07
CBA最新消息!杨鸣或重返辽宁,南京同曦两人被禁赛

CBA最新消息!杨鸣或重返辽宁,南京同曦两人被禁赛

体坛瞎白话
2026-02-01 11:18:25
国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

比利
2026-01-23 12:41:53
著名歌手不幸离世,留3200万遗产,生前自购墓地

著名歌手不幸离世,留3200万遗产,生前自购墓地

最美的开始
2026-02-01 18:56:39
官宣!增值税5%征收率保留,不会降至3%

官宣!增值税5%征收率保留,不会降至3%

第一财经资讯
2026-02-01 11:09:10
歌手于文文演唱会上突然晕倒,被救护车紧急送医

歌手于文文演唱会上突然晕倒,被救护车紧急送医

扬子晚报
2026-02-01 23:23:03
脊柱断裂、前夫已死,63岁韦唯近况曝光,已然走上一条上坡路

脊柱断裂、前夫已死,63岁韦唯近况曝光,已然走上一条上坡路

深度解析热点
2026-01-25 01:28:29
女子举办“北京第一届黑色羽绒服选美大赛”引数百人围观:冠军是只小狗,季军称很好玩

女子举办“北京第一届黑色羽绒服选美大赛”引数百人围观:冠军是只小狗,季军称很好玩

极目新闻
2026-02-01 17:23:47
失业的人越来越多了

失业的人越来越多了

曹多鱼的财经世界
2025-12-24 14:56:20
30年营养谎言被戳穿:为什么医生们突然改口让你吃肉?

30年营养谎言被戳穿:为什么医生们突然改口让你吃肉?

富贵说
2026-01-18 20:36:47
娶了朋友前妻是一种什么样的体验?

娶了朋友前妻是一种什么样的体验?

另子维爱读史
2026-01-13 20:04:40
湖人被耍惨了!2月1日,骑士一记闷棍敲醒洛杉矶春秋大梦

湖人被耍惨了!2月1日,骑士一记闷棍敲醒洛杉矶春秋大梦

时事佳人
2026-02-01 16:58:14
反转炸锅!布鲁克林从贝家少爷变赘婿靠老婆 100 万刀月例躺平?

反转炸锅!布鲁克林从贝家少爷变赘婿靠老婆 100 万刀月例躺平?

阿雹娱乐
2026-01-30 11:39:17
洗碗机砸家反转!丈夫降薪扛,妻子卖金买苹果17月吃4次海底捞

洗碗机砸家反转!丈夫降薪扛,妻子卖金买苹果17月吃4次海底捞

深析古今
2026-01-10 13:58:59
2026-02-02 08:03:03
量子位 incentive-icons
量子位
追踪人工智能动态
12092文章数 176369关注度
往期回顾 全部

科技要闻

10亿元宝红包突袭 复刻微信支付还是微视?

头条要闻

30岁男子如厕时猝死 妻子回忆事发前5天丈夫疼痛细节

头条要闻

30岁男子如厕时猝死 妻子回忆事发前5天丈夫疼痛细节

体育要闻

德约大度祝贺阿卡 幽默互动逗笑纳达尔

娱乐要闻

春晚第三次联排阵容曝光:全是实力派

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

房产
本地
时尚
艺术
公开课

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

“多巴胺风”又又又火了!这样穿时髦又减龄

艺术要闻

上海“高技派”地标:华润中心竣工,LV总部入驻!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版