OpenAI拉响红色警报!
暂停广告和Agent,下周发布新模型硬刚Gemini 3
OpenAI真的急了!
Sam Altman已正式宣布公司进入“红色警报”(Code Red)状态
面对Google等竞争对手的步步紧逼,OpenAI决定下周直接发布全新的推理模型。据内部测试显示,该模型表现已超越Google的Gemini 3 pro
为了集中火力,Altman甚至按下了广告、AI Agent(智能体)和Pulse项目的暂停键,将所有人力和算力资源重新调配,只为全力修复和升级ChatGPT
目前的战略优先级是:产品体验 > 商业变现。
虽然包括购物广告在内的实验仍在后台进行,但OpenAI已推迟了广告业务的全面铺开。团队的首要任务是为超过8亿的周活跃用户改善核心用户体验(UX)和个性化服务
重点修补“模型行为”,要在榜单上赢回来
在“红色警报”状态下,升级的重点领域非常明确:
更好的个性化
更快、更可靠的响应速度
减少不必要的拒绝回答
改进模型行为
OpenAI的目标很直接:要让用户在LMArena(大模型竞技场)等公开榜单中,更倾向于选择ChatGPT
图像生成军备竞赛
图像生成也被列为指名道姓的重点项目。
在Google发布Nano Banana Pro并获得强烈反响后,OpenAI希望确保ChatGPT的图像生成功能(Imagegen)在创意和商业用例中保持足够的竞争力
背后的战略赌注:千亿美元融资需求
这一系列动作背后,是巨大的市场和资金压力。
目前,ChatGPT占据了全球约70%的“助手活动”和约10%的搜索份额。
面对Google和Anthropic的围剿,OpenAI必须确立绝对优势,以实现营收的快速增长——预计从100亿美元增长至200亿,并计划在2027年达到约350亿美元。只有这样,才能支撑起公司接下来约1000亿美元的融资需求。
来源:AI寒武纪
ChatGPT三岁生日,要被谷歌颠覆了
![]()
来源:新智元
【导读】ChatGPT的三岁生日没有蛋糕,只有谷歌送来的「病危通知书」和金主爸爸们背着的一千亿巨债。
如果将时间拨回三年前的今天,也就是2022年12月1日,那是一个相对安静的周三。
位于旧金山的一家名为OpenAI的非营利实验室,悄无声息地发布了一个名为「ChatGPT」的研究预览版。
![]()
ChatGPT三年前的样子
没有盛大的发布会,没有乔布斯式的演讲,只有一个朴素的对话框。
当时的人们并不知道,这个对话框将彻底改变世界。
![]()
![]()
三年后的今天,2025年12月12日,当我们站在这个时间节点回望,世界已经被彻底重塑。
![]()
ChatGPT早已不是那个偶尔会算错数学题的聊天机器人,它和它的继承者、竞争者们已经成为了人类在数字AI世界赖以生存的「氧气」。
![]()
Gemini 3 Nano Banana Pro绘制
然而,伴随着技术的指数级跃迁,一种难以名状的群体性焦虑正在全球蔓延,和每个人都息息相关。
这三年里,围绕ChatGPT和生成式AI,我们见证了前所未有的狂热与恐慌交织在一起:硅谷高歌猛进,华尔街亦疯狂逐利,但普通人和各行各业从业者却充满焦虑和不安。
正如《大西洋月刊》评论所言,我们正身处「ChatGPT建造的世界」!
一个充满不稳定性的时代,大家都在战战兢兢地等待下一只靴子落地。
年轻人眼看着AI正在取代自己,CS课程教授开始教「不写一行代码的」编程课;年老的人不知道AI正在远远抛弃他们;大量企业开始裁员。
狂欢的人们抱着Scaling Law的铁律不断加码,买下核电站为AI供电,将芯片发到太空为AI建立地外空间;
反对派开始「鼓吹」LLM已经是死胡同,下一个十年是世界模型。
在ChatGPT背后,「最大功臣」英伟达的股价在三年间暴涨了近10倍,其5万亿市值富可敌国,仿佛整个全球经济的命运都悬挂在几块GPU芯片之上。
![]()
这是一场关于「泡沫」与「人类未来」的豪赌。
就在奥特曼还在四处寻找和创建电厂,就在马上迎来「ChatGPT三周年」之际,命运跟OpenAI开了一个残酷的玩笑。
「ChatGPT三周年」,却被谷歌用一记蓄谋已久的重拳,将OpenAI打落尘埃。
谷歌抓住了这个稍纵即逝的时间窗口。Gemini 3的发布,不仅是一次产品的迭代,更像是一场精心策划的「斩首行动」。
历史总是惊人的相似,却又如此无情。
三年前,OpenAI突袭了谷歌;三年后,谷歌用同样的方式,在OpenAI的生日宴上宣告了主权的回归。
站在2025年的尾巴上,「ChatGPT三周年」不再是一个单纯的纪念日,它成了一个分水岭。
人类被改写的三年
在讨论谷歌和OpenAI之前,先复盘一下这三年AI技术演进的轨迹。
故事中,OpenAI一直处于领先地位,不论是GPT-3.5、GPT-4o、GPT-5都引领了AI技术的演进。
![]()
但如今这一章的结尾,却被谷歌画上了句号。
2023年-2024年:惊奇与幻觉的蜜月期
ChatGPT的横空出世打破了图灵测试的最后一道防线。
在这个阶段,人类主要沉浸在「惊奇」之中。我们惊讶于机器能写诗、能编程、能通过沃顿商学院的考试。
虽然那时的GPT充满了「幻觉」,经常一本正经地胡说八道,但它的感觉是「类人」的。
这一年的关键词是「对话」。人机交互模式依然停留在「你问我答」的层面,或者说更多的停留在语言层面。
Prompt Engineering(提示词工程)成为了一门热门新技术,人们试图通过咒语般的指令来操纵模型的潜力。
![]()
但没想到是,这门刚刚兴起还没有一年「新型技术岗位」迅速被AI提升的能力快速瓦解。
2024年-2025年:多模态与应用的爆发
随着GPT-4o和Midjourney等多模态AI的普及,AI开始长出「眼睛」和「耳朵」。
它不再只是处理文本,而是开始吞噬图像、音频和视频。
更有甚者,马斯克还推出了Grok小姐姐。
这个过程一直持续到2025年上半年的「吉卜力热」,10月份的Sora2,延续到谷歌Nano Banana第一波热潮。
![]()
这个过程中,Vibe Coding开始兴起,以Cursor为代表的新生产力工具彻底重塑了生产关系:人类的效率被彻底改写。
![]()
2025年是神奇的一年,也是每个人亲自体验到「奇点」是什么感觉的一样。
或许是因为谷歌Gemini 3太过于好用、太智能了,所以大部分人都开始冒出一个想法:OpenAI,要被谷歌逼到绝境了吗?
谷歌重生,OpenAI落幕
的确,OpenAI曾在AI竞赛的早期拥有一骑绝尘的优势,但巨头们绝不会坐以待毙。
尤其是被视为「输在起跑线」上的谷歌,这三年经历了从仓促应战到厚积薄发的过程。
构建在TPU之上的原生多模态模型Gemini,以及基于此打造的生图模型Nano Banana,一整个扭转了此前OpenAI+英伟达的逻辑叙事。
如今,Gemini移动应用的月活用户已经从5月份的约4亿,激增到了6.5亿。
![]()
虽然拥有超过8亿周用户的OpenAI,在使用量上仍占据绝对主导的市场份额,但用户现在花在与Gemini聊天上的时间已经超过了ChatGPT。
![]()
对此,Hugging Face联合创始人兼首席科学官Thomas Wolf感叹道:
这与两年前的世界简直是天差地别!
当时,OpenAI遥遥领先于其他所有人;现在,天已经变了……
ChatGPT我用了3年。刚刚试用了2小时Gemini3。
我回不去了。
这跨度简直太疯狂了……感觉世界刚刚又变了一次。
![]()
现在,所有的压力和考验,彻底转移到了OpenAI的掌门人奥特曼身上——
他能否加速变现,又能否在千头万绪中稳住大局……
在公开场合,OpenAI对竞争表示欢迎。
「我们总是很高兴看到该领域的进步——竞争能推动整个生态系统向前发展,」OpenAI首席研究官Mark Chen表示。
我们的模型继续在性能、可靠性和现实应用价值方面树立标杆,我们将继续发布能力更强的模型。
但在内部,员工们感到压力山大,因为他们要在多条战线上与那些手握数百亿美元资金、财大气粗的竞争对手抗衡。
就连奥特曼本人,也在Gemini 3发布之前,通过一份备忘录给员工打了预防针:
公司需要在短期的竞争高压下保持专注……预计外面的舆论风向会有一段时间比较严峻。
![]()
一些专家认为,OpenAI为了不惜一切代价追求规模,把战线拉得太长了。
在过去的一年里,他们以惊人的速度推出新产品,从自动化编程工具到视频应用Sora,应有尽有。
「OpenAI的摊子铺得太大了。他们不可能把每件事都做到完美,」一家硅谷风险投资公司的合伙人说。(他们支持了几家AI模型初创,但唯独没有投OpenAI)
与此同时,OpenAI还计划在未来8年投入1.4万亿美元用于算力建设,并与英伟达、甲骨文、AMD和博通达成了巨额交易。
这笔开支,比起OpenAI目前的销售额,要高出好几个数量级!
对于任何公司来说,这都是一场风险极高的豪赌。
但OpenAI,却有着一套自己独特的「打法」——
用别人的资产负债表,为自己办大事。
金主爸爸背债,自己「空手套白狼」
是的,OpenAI如今正享受着一场靠举债支撑的烧钱狂欢,自己却不用承担什么金融风险。
根据《金融时报》的分析,软银、甲骨文和CoreWeave为了投资OpenAI或者帮它建数据中心,至少已经借了300亿美元。
投资集团Blue Owl Capital和Crusoe等计算基础设施公司,也指望着它们的客户与OpenAI签下的合同来偿还大约280亿美元的贷款。
此外,还有一帮银行正在商谈,准备再借给甲骨文和数据中心建设商Vantage 380亿美元,好让他们为OpenAI建设更多的站点。
前前后后加起来,这些与OpenAI合作的公司,差不多背了得有近1000亿美元的债。
相比之下,OpenAI自己的账上却几乎没有欠款——
他们跟几家美国银行有40亿美元的信贷额度,是去年拿到的,但到现在还没动用过。
OpenAI的高管曾说过,他们计划举借大量债务来支付这些合同。
但到目前为止,背锅的都是它的合作方和背后的贷款人,财务负担全在他们身上。
![]()
资产管理公司Janus Henderson 2024年的一份报告显示,与OpenAI挂钩的这1000亿美元债券、银行贷款和私人信贷交易,规模相当于全球六大企业借款人(包括大众汽车、丰田汽车以及电信巨头AT&T和康卡斯特)直接持有的净债务总和。
但实际上,与OpenAI相关的债务可能比这还要高得多。
很多合作伙伴,包括软银和CoreWeave,都借了更多的钱,只是没有明确说这笔钱跟OpenAI有关。
比如,软银今年就为了它的AI投资筹集了大约200亿美元,其中投给OpenAI的无疑是最大头。
CoreWeave手握向微软提供算力的巨额合同,为了租用数据中心空间来履行这些义务,已经借了超过100亿美元。
鉴于OpenAI和微软的关系,这些算力最终可能有一部分会流向OpenAI。
随着合作伙伴们努力履行与这家初创公司的巨额合同,与OpenAI相关的债务规模估计还会继续膨胀。
甲骨文已经发售了180亿美元的公司债券,用来支付对OpenAI的基础设施承诺。
KeyBanc Capital Markets的分析师预测,拉里·埃里森(Larry Ellison)在未来四年内还得再借1000亿美元,才能完成OpenAI的合同。
不过,斯坦福HAI的教授Erik Brynjolfsson认为,现在就断言OpenAI出局还为时过早——
他们庞大的应用矩阵是寻找新收入来源的极佳方法,这些收入将为其核心研究能力提供资金。
彩蛋
三年前的今天,OpenAI无心插柳。
OpenAI曾经说过根本没有预料到「ChatGPT」会火爆全球,5天内吸引100万用户,成为全球最快达到10亿用户的应用。
更不用说ChatGPT彻底改变了地球的科技树,影响后续无数的AI公司。
有网友晒出了ChatGPT第一天上线时的对话截图,当时它不能联网,遇到不会的问题只会说:
「对不起,我只是一个被OpenAI训练的大语言模型。。。」
![]()
如今,它却演变成了在这个星球上最高科技的物种,也给人类带来了一场最昂贵、最惊心动魄的豪赌。
参考资料:
https://techcrunch.com/2025/11/30/chatgpt-launched-three-years-ago-today/
https://x.com/OpenAI/status/1995198060188807347
https://www.ft.com/content/5605d086-289e-4b5f-803b-4c13666976a5
https://www.ft.com/content/8881062d-ff4f-4454-8e9d-d992e8e2c4e3
OpenAI危!DeepSeek放大招:追平谷歌最强,手撕GPT-5 High
![]()
来源:新智元
【导读】「开源之神」DeepSeek重磅发布V3.2正式版,性能全面超越GPT-5 High,与谷歌Gemini-3.0 Pro平分秋色。新模型不仅斩获4项国际奥赛金牌级成绩,更凭借独创的DSA稀疏注意力架构,打破「速度、成本、智能」的不可能三角。
OpenAI这次真的要慌了!
就在刚刚,「源神」DeepSeek开源了DeepSeek-V3.2正式版——
在数学编程等多项推理基准上,全面超越GPT-5 High,优于Claude 4.5 Sonet;
与刷屏的Gemini 3.0 Pro相比,则难分伯仲,不相上下!
![]()
表1:DeepSeek-V3.2与其他模型在各类数学、代码与通用领域评测集上的得分(括号内为消耗Tokens估计总量)
在今年,DeepSeek此前已发布7款模型——「开源之神」,当之无愧:
DeepSeek‑R1、DeepSeek‑R1‑Zero
DeepSeek‑V3、DeepSeek‑V3.1、DeepSeek‑V3.1-Terminus、DeepSeek‑V3.2‑Exp
DeepSeek‑OCR、DeepSeek‑Math-V2
出手即王炸
开源4项奥赛金牌级AI
全新模型DeepSeek-V3.2,出手即王炸。
DeepSeek正式发布DeepSeek-V3.2与DeepSeek-V3.2-Speciale——专为智能体打造的推理优先模型!
DeepSeek-V3.2:V3.2-Exp的官方迭代版本,现已登陆App、网页端及API;
DeepSeek-V3.2-Speciale:突破推理能力边界,目前仅通过API提供服务。
![]()
两款模型均达到世界级推理性能 :
V3.2:推理能力与文本长度兼顾,拥有GPT-5级别性能,适合日常驱动;
V3.2-Speciale:极致推理能力,取得了4项金牌级成绩;目前仅提供API版本(不支持工具调用),以支持社区评估与研究。
在主流推理基准测试上,DeepSeek-V3.2-Speciale的性能表现媲美Gemini-3.0-Pro(见表1)。
更令人瞩目的是,V3.2-Speciale 模型成功斩获多项金牌:
IMO 2025(国际数学奥林匹克)
CMO 2025(中国数学奥林匹克)
ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)
IOI 2025(国际信息学奥林匹克)
其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。
而DeepSeek-V3.2是首个将思考直接整合到工具使用中的模型,同时支持在思考和非思考模式下使用工具。
目前,两款模型均已开源:
· DeepSeek-V3.2
HuggingFace:https://huggingface.co/deepseek-ai/
DeepSeek-V3.2
ModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2
· DeepSeek-V3.2-Speciale
HuggingFace:https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale
ModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale
从「引擎验证」到「全能车手」
DeepSeek V3.2的进化论
如果说两个月前发布的DeepSeek-V3.2-Exp是一台在赛道上呼啸而过的「概念车」,用来向世界证明「稀疏注意力」引擎的动力潜力;
那么今天正式转正的DeepSeek V3.2,则是一辆完成了内饰精修、装配了顶级导航系统、可以随时上路解决复杂问题的「量产超跑」。
这就是DeepSeek V3.2相比于Exp版(实验版)最大的进化逻辑:核心引擎不变,但驾驶技巧(Agent能力)发生了质变。
![]()
V3.2正式版 vs. Exp
学会了「边干边想」
在架构层面,V3.2沿用了Exp版本验证成功的DSA架构,但在「软实力」上,DeepSeek解决了一个困扰AI界的顽疾——思考与行动的断裂
在V3.2-Exp时期(以及其他大多数推理模型),模型像是一个记性不好的老学究:它会先花很长时间思考,决定调用一个工具(比如搜索天气)。
但当工具把「今天是雨天」的结果扔回来时,它往往会「断片儿」,忘了刚才思考到哪一步了,不得不重新规划。
V3.2正式版引入了「思维上下文管理」。
![]()
这就像给模型装了一个「工作记忆暂存区」。
现在的V3.2像一位经验丰富的外科医生,在伸手要手术刀(调用工具)的间隙,脑子里的手术方案依然清晰连贯,拿到刀后能无缝衔接下一步操作。
为了练就这项绝活,DeepSeek甚至为V3.2搭建了一个「虚拟演练场」。
他们合成了1800多个虚拟的操作系统、代码库和浏览器环境,生成了8.5万条极其刁钻的指令,逼着V3.2在虚拟世界里反复练习「修Bug」、「查资料」、「做报表」。
正是这种高强度的特训,让V3.2正式版从一个只会做题的「做题家」,进化成了能熟练使用工具解决现实难题的「实干家」。
最大技术亮点
给注意力装上「闪电索引器」
V3.2能够同时兼顾「聪明」和「便宜」,其最大的功臣依然是那个名为稀疏注意力(DSA)的底层黑科技。
![]()
DeepSeek-V3.2的注意力架构
要理解它的牛逼之处,我们得先看看传统模型有多「笨」。
传统模型在处理长文档时,就像一个强迫症晚期的图书管理员:
为了回答你一个简单的问题,它强迫自己必须把图书馆里每一本书的每一页、每一行字都读一遍,并计算它们之间的关联。
这导致计算量随着书的厚度呈指数级爆炸(O(L^2))。
DSA则给这位管理员配备了一套「闪电索引器」。
当问题来临时,DSA先用极低的成本扫描一遍「索引」,瞬间判断出哪几页书可能包含答案,把无关的99%的废话直接扔掉。
然后,它只对这筛选出的1%的关键内容进行精细的深度阅读。
这种「查目录」而非「死磕全书」的策略,将计算复杂度从可怕的指数级直接拉低到了近乎线性(O(L))。
带来的显著提升
打破「不可能三角」
DSA技术的成功落地,直接击穿了AI领域的「速度、成本、智能」不可能三角。
![]()
其一,成本腰斩,长文无忧。
对于用户来说,丢给模型一本几十万字的小说或代码库,不再是「烧钱」的奢侈行为,处理速度也从「泡杯咖啡」变成了「眨眼之间」。
其二,算力盈余带来的「智力涌现」,这是最精彩的一点。
正因为DSA节省了大量算力,DeepSeek才有底气推出那个恐怖的Speciale版本。
既然读得快,那就让它想得久一点!
Speciale版本利用节省下来的资源,进行更深度的「长思考」和逻辑推演。
结果是震撼的:DeepSeek-V3.2-Speciale在数学(IMO金牌)、编程(IOI金牌)等硬核指标上,不仅超越了GPT-5 High,更是与谷歌最强的Gemini 3.0 Pro战成平手。
![]()
从验证DSA引擎潜力的V3.2-Exp,到将Agent能力、思维上下文管理、虚拟演练场训练全部装车的V3.2正式版,DeepSeek展示的是另一条通往强智能的路线:在算力紧箍咒下,用更聪明的架构、更精细的训练和更开放的生态,撬动推理极限。
DeepSeek-V3.2的横空出世,正是DeepSeek开源AI的魅力时刻:拒绝无脑烧钱Scaling,靠更聪明的算法,在算力的缝隙中开辟出通往顶峰的捷径。
为伟大思想而生!
AI+时代,互联网思想(wanging0123),
第一必读自媒体
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.