网易首页 > 网易号 > 正文 申请入驻

谷歌深夜发布Gemini,3,Deep,Think碾压群雄

0
分享至



就在刚刚,Gemini 3 Deep Think重磅升级,以一种恐怖的姿态刷爆了全领域的SOTA(当前最佳技术水平)。这不是一次简单的版本迭代,而是一次 AI 推理能力的维度跨越——在科学研究和硬核工程领域,它已经不再是“副驾驶”,而是真正的最强大脑。



一个数据足以让所有开发者沉默:在刚刚结束的 Codeforces 编程比赛中,Gemini 3 Deep Think 拿下了3455Elo的惊人分数。 这意味着什么?它不仅达到了世界冠军级的水准,更直接冲入了人类 TOP 10,排名全球第七!

也就是说,在这个星球上,目前仅有 7 个人类选手能勉强压制住它。作为对比,一年前被奉为神作的最强OpenAI o3 模型,也仅仅拿下了 2727 Elo。Gemini 3 Deep Think 的出现拿到3455 Elo,让 AI 编程能力直接断层领先。

但这只是冰山一角。 在人类最后考试(HLE)上,它拿下了48.4%的成绩,刷新 SOTA; 在最难的 ARC-AGI-2 基准测试中,它一夜之间让榜单直接饱和,以84.6%的分数一骑绝尘。

与 Gemini 3 Pro 相比,Deep Think 实现了全方位的反超,更是将ClaudeOpus 4.6、GPT-5.2直接踩在了脚下。



目前,Google AI Ultra 订阅用户已经可以在后台直接体验,API 也已向部分开发者开放。属于 AI 推理的新纪元,真的来了。

Gemini 3 Deep Think 的强,不是挤牙膏式 5% 提升,是断崖式的维度打击。

让我们看一组让友商窒息的数据:

全方位反超,绝非虚言。在 Google 官方公布的雷达图中,Gemini 3 Deep Think 几乎包围了所有竞争对手。曾经的逻辑之王Claude Opus 4.6 在它面前显得反应迟钝,而 GPT-5.2 更是被远远甩在身后。

一位参与测试的开发者在推特上感叹:以前我们对比模型是用跑分,现在对比 Deep Think,感觉像是在用智商。

它不仅是在做题,它是在思考。官方演示中,Deep Think 展现出的不仅仅是计算能力,更是一种对复杂系统的多维理解力——这也为它在现实物理世界中的惊人表现埋下了伏笔。

如果说前面的跑分只是学霸的自我修养,那么接下来的实战表现,才真正让人感受到了Gemini3 Deep Think 对物理世界的降维打击。

它不再只是一个能聊天的 Bot,它开始具备了工程师的直觉和设计师的手眼。

最令人震撼的一幕,发生在谷歌 VP 的一个副业项目中:他随手画了一张极其实际的、甚至有些潦草的笔记本电脑支架草图,扔给了 Deep Think。 Deep Think 没有废话,它不仅仅是“看懂”了这张图,而是瞬间化身为一名资深工业设计师。它分析了草图结构,自动补全了物理细节,直接渲染出了一个高保真、可落地的 3D 模型方案。





除了懂物理,的审美也在线。Simon Willison 为了刁难它,发出了一个离谱指令:“生成一张鹈鹕骑自行车的 SVG 矢量图”。 Deep Think 并没有像以往的模型那样生成一团乱码,而是画出了一张线条流畅、结构合理的矢量图。 Simon 看完直接炸了





既然基础题难不倒它,Simon 决定加大难度。结果 Deep Think 在处理复杂的几何图形和矢量路径时,依然表现得游刃有余。 只需一张图、一个提示词,它就能深入思考,提供几个你从未设想过的设计方案。

对于产品经理和设计师来说,这意味着什么? 这意味着“想法即产品”的时代真的来了。AI 开始理解空间、理解结构、理解物理约束——这才是通往 AGI 的必经之路。

画图、写代码还在我们可以理解的范畴,那么 Gemini 3 Deep Think 在科研领域的表现,则让人感到一丝畏惧。



而在杜克大学,Wang Lab 的科学家们则被它的“创造力”震惊了。为了优化一种复杂晶体的生长制造方法,Deep Think 不仅分析了现有数据,还成功设计出了一种生长大于 100 μm 薄膜的全新配方。 这个精确目标,在此前的方法中几乎难以实现。它不仅给出了方案,还预测了结果,直接让物理零部件建模加速了十倍。



这意味着什么? 这意味着在科学发现的领域,AI 已经从整理资料进化到了产出新知。对于科研人员来说,它既是最好的搭档,也是最强的对手。

Google AI Ultra 订阅用户即刻起就能在 Gemini 后台体验新版 Deep Think。同时,谷歌首次通过 API 向部分研究人员、工程师和企业开放了这一能力。

去年,Deep Think 还需要专门版才能解决数学难题;而今天,通用版的它已经能在 Codeforces 上虐杀人类选手,在实验室里指导科学家做实验。

如今,巨大的压力球被狠狠抛回给了 OpenAI。面对谷歌这记直击痛点、甚至可以说是“羞辱级”的 SOTA 回击,Sam Altman 手里还藏着什么牌? 传说中的 GPT-5 或者是那个神秘的“Q*”,如果不能拿出超越“自主科研”级别的能力,恐怕很难再复刻当年的 ChatGPT 时刻了。

2026 年的 AI 战争,才刚刚开始。但至少,谷歌 DeepMind 是跑在前方的赢家。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
毛主席见到贺子珍哥哥,得知其行政待遇八级,大怒道:这是瞎胡闹

毛主席见到贺子珍哥哥,得知其行政待遇八级,大怒道:这是瞎胡闹

南书房
2026-02-17 11:35:05
1998年数万华人遭屠杀,中国为何没出兵?26年后答案让人沉默

1998年数万华人遭屠杀,中国为何没出兵?26年后答案让人沉默

哄动一时啊
2026-02-17 22:21:25
2月17日俄乌最新: 2.5 年来的最大战果

2月17日俄乌最新: 2.5 年来的最大战果

西楼饮月
2026-02-17 20:49:47
1-0复仇!皇马20天后攻陷魔鬼主场:维尼修斯进球+罢赛 穆帅染红

1-0复仇!皇马20天后攻陷魔鬼主场:维尼修斯进球+罢赛 穆帅染红

风过乡
2026-02-18 06:21:31
李敖:王菲之所以高冷,因为她肚子里没墨水,本质是一个"愚妇"

李敖:王菲之所以高冷,因为她肚子里没墨水,本质是一个"愚妇"

青橘罐头
2026-02-18 09:33:57
亏损超5亿,吴京尽力了,2026年春节档第一票房惨案诞生了

亏损超5亿,吴京尽力了,2026年春节档第一票房惨案诞生了

靠谱电影君
2026-02-17 20:53:41
不忍心告诉你:人旺财不旺,财旺人不旺,人财两旺寿不长

不忍心告诉你:人旺财不旺,财旺人不旺,人财两旺寿不长

舒山有鹿
2026-02-16 12:23:11
冯小刚夫妻美国陪养女过年!徐帆忙着炒菜包饺子,豪宅内景很破旧

冯小刚夫妻美国陪养女过年!徐帆忙着炒菜包饺子,豪宅内景很破旧

社会日日鲜
2026-02-17 08:08:09
26落水4死!云南游船侧翻:画面流出,负责人被控制,一细节可怕

26落水4死!云南游船侧翻:画面流出,负责人被控制,一细节可怕

博士观察
2026-02-18 13:51:50
不是那个年代的,你真看不懂

不是那个年代的,你真看不懂

深度报
2026-02-15 23:01:53
河南一企业老板因“给员工的红包太薄”落泪,现场宣布追加一个月工资,金额3500-10000元不等,员工:3年以上职工还能领黄金

河南一企业老板因“给员工的红包太薄”落泪,现场宣布追加一个月工资,金额3500-10000元不等,员工:3年以上职工还能领黄金

中国日报网
2026-02-17 17:35:04
紧急救市!美联储官员深夜连线,一场全球市场崩盘危机被按住了

紧急救市!美联储官员深夜连线,一场全球市场崩盘危机被按住了

魏家东
2026-02-18 09:19:02
冬奥会女选手夺冠时激动拉开上衣,露出内衣品牌,或将因此赚得100万美元!

冬奥会女选手夺冠时激动拉开上衣,露出内衣品牌,或将因此赚得100万美元!

大象新闻
2026-02-17 17:43:34
英法德等五国联合声明,俄方发声

英法德等五国联合声明,俄方发声

扬子晚报
2026-02-17 18:43:46
大年初一机票价格腰斩,有人打算今晚就“抄底价”旅行,“春节假期前两天休息,正好初一出门”,部分热门航线价格比火车票还便宜

大年初一机票价格腰斩,有人打算今晚就“抄底价”旅行,“春节假期前两天休息,正好初一出门”,部分热门航线价格比火车票还便宜

大风新闻
2026-02-17 21:02:20
王兴兴:预计2026年宇树人形机器人出货量或将达一到两万台

王兴兴:预计2026年宇树人形机器人出货量或将达一到两万台

财闻
2026-02-17 13:22:53
大量持金的人要哭了!大年初一金价开始大幅下跌,一直跌到了1080

大量持金的人要哭了!大年初一金价开始大幅下跌,一直跌到了1080

火山詩话
2026-02-18 12:42:25
“谁给王菲画的眉毛”登上热搜,女儿窦靖童发文“挖嘞个亲娘”

“谁给王菲画的眉毛”登上热搜,女儿窦靖童发文“挖嘞个亲娘”

仙味少女心
2026-02-17 12:13:27
落槌!全部划归国资!追随许家印6年,江苏第一包工头赔得精光

落槌!全部划归国资!追随许家印6年,江苏第一包工头赔得精光

始于初见见
2026-02-18 12:16:38
马年春晚与百姓冷暖渐行渐远,非于蕾一己之力,这是时代的尴尬

马年春晚与百姓冷暖渐行渐远,非于蕾一己之力,这是时代的尴尬

姜大叔侃球
2026-02-17 12:33:58
2026-02-18 17:24:49
二大爷观世界
二大爷观世界
谢谢大家的关注
1648文章数 875关注度
往期回顾 全部

科技要闻

怒烧45亿,腾讯字节阿里决战春节

头条要闻

14岁龙凤胎姐弟替患病母亲摆摊卖春联 父亲患癌已离世

头条要闻

14岁龙凤胎姐弟替患病母亲摆摊卖春联 父亲患癌已离世

体育要闻

夺银被问丢金,谷爱凌回击外媒:很荒谬

娱乐要闻

6大卫视春晚收视出炉 北京台稳居第一

财经要闻

面条火腿香菇酱!上市公司这些年请你吃

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

家居
旅游
数码
手机
公开课

家居要闻

中古雅韵 乐韵伴日常

旅游要闻

来潮州过年!单日10万游客,古建+小吃承包全部快乐

数码要闻

AMD否认MI455X跳票,重申2026下半年如期交付Helios

手机要闻

荣耀Magic V6真机曝光!MWC即将发布,折叠屏+机器人手机双王炸

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版