网易首页 > 网易号 > 正文 申请入驻

谷歌IMO金牌级Gemini 3深夜上线!华人大神挂帅,OpenAI无力反击

0
分享至


新智元报道

编辑:桃子 好困

【新智元导读】Gemini 3 Deep Think用2.5倍的暴力性能把GPT-5.1踩在脚下,OpenAI若再不发新模型,这「推理之王」的宝座今天就正式换人了!

太劲爆了!

不过半月,谷歌DeepMind终于放出了IMO最强金牌模型——Gemini 3 Deep Think。


今年夏天,Gemini 2.5 Deep Think分别在IMO、ICPC国际大赛中,拿下了金牌的战绩。

这一次,谷歌为其注入了全新的血液——Gemini 3。

凭借着「并行思考」能力,Gemini 3 Deep Think可以搞定超高难度的数学、科学难题!

在基准测试中,Deep Think全面碾压Gemini 3 Pro,尤其是在HLE上,未用工具拿下了41%高分。

同时在ARC-AGI-2上,以45.1%成绩领跑全球。


下面实例中,同一个指令,让Gemini 3 Pro和Deep Think版基于一张博物馆展馆屋顶的草图,创建一个精确的交互式3D场景。

显然,后者在还原度上,与原图几乎是1:1复刻,并在交互上,光影变化符合物理逻辑。


今天,Gemini 3 Deep Think已在Gemini App上线,所有Ultra用户即可体验。


最强IMO金牌模型来了

Gemini 3 Deep Think正式开启了「深度思考」新纪元,让智能的边界再次拓展。

Gemini 3 Deep Think基于上一代Gemini 2.5 Deep Think迭代而来,在推理能力上实现了质的飞跃。

它专门用于攻克那些连当今最顶尖模型,都感到棘手的复杂数学、科学和逻辑难题。


在多项基准测试中,Gemini 3 Deep Think都拿下了行业领先成绩。

在Humanity’s Last Exam(无工具辅助)上刷爆41%,并在ARC-AGI-2(配合代码执行),创下45.1%新纪录。


在ARC-AGI-1和ARC-AGI-2上,Gemini 3 Deep Think实力堪称无「模」能敌。



左右滑动查看

之所以这么强,是因为Deep Think采用了「并行推理」来同时思考,能够同时探索多种假设。

在谷歌DeepMind放出的更多demo中,可以看出Gemini 3 Deep Think强大之处。

如下,让它打造一款3D版多米诺骨牌游戏。在关卡设置中,Deep Think兼具创意与惊喜,而且还模拟出了真实的碰撞物理效果。


这个例子,是要求Gemini 3 Pro和Deep Think分别在单个HTML文件中创建程序化生成的地球类行星。

左右对比一眼即可看出,Deep Think更加有创造力。


另有开发者实测惊叹道,Gemini 3 Deep Think具备惊人的能力。


上传一张玻璃瓶的照片,让它生成一个软橡胶同款掉在地上的3D动画。


有网友激动地表示,按照这个速度,我们将在2026年真正实现AGI!


华人科学家领衔,AGI王牌队冲刺

同在今天,谷歌DeepMind官宣,将在新加坡组建一支全新的精英团队。

它将由华人科学家Yi Tay率队,专攻高级推理、LLM/RL,以及推进Gemini、Gemini Deep Think等最前沿SOTA模型的发展。

Yi Tay将向位于山景城由Quoc Le(谷歌Fellow级大佬)领导的团队汇报。

恰好,这一团队正是Gemini Deep Think在国际竞赛中夺下金牌的核心力量之一,同时也在Gemini上取得重要进展。


Yi Tay表示,我们会从一支人不多但超强的小团队开始。

因为在大模型的时代,「人才密度」比什么都关键。

关键是,这个团队还能与AI领域传奇大神联动研究,其中就包括「推理之王」Denny Zhou、「香蕉」背后的男人Mostafa Dehghani、AI界的「GOAT」Noam Shazeer。

同时,还有很多「神仙队友」一起加入研究,包括生成式检索的发明人Vinh Q. Tran、IMO金牌项目总负责人Thang Luong、思维链开创者Xuezhi、日本顶尖AI大神Shane Gu等人。

过去几个月,谷歌DeepMind便开始秘密招募全球顶尖人才。

这一项目得到了Demis Hassabis、Jeff Dean等内部高层的大力支持。



如今,他们继续发出英雄招募帖,有机会站上通往AGI的关键赛道。

用不了多久,这支新加坡团队很快就会成为一支战斗力爆表的队伍。


Gemini 3爆冲15%流量

随着Gemini 3 Pro的强势发布,其网页端的市占率再创新高,突破15%大关。

与此同时,Grok也凭借着4.1版本的发布持续增长。

ChatGPT在流量上依然断崖式领先,但份额却在持续下降。



Gemini延续增长势头,访问量达到13.51亿次,较10月增长14.3%。ChatGPT跌破60亿次大关,网站访问量降至58.44亿次。

这是继7月之后,ChatGPT 在 2025 年出现的第二次环比下滑。


尽管在11月18日(Cloudflare宕机当天),ChatGPT创下了单日2.33亿次访问的历史纪录,但这并未扭转整体流量的跌势。

此外,Grok网站访问量达到2.344亿次,创下历史新高,较10月增长14.7%。

这也是该网站自启用当前域名以来,首次实现连续两个月的流量增长。




左右滑动查看

参考资料:

https://x.com/GoogleDeepMind/status/1996658401233842624?s=20

https://x.com/YiTayML/status/1996640869584445882?s=20

https://x.com/Similarweb/status/1995792272785310186

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
我个人觉得,五年之后蒯曼必然要接过世一的班

我个人觉得,五年之后蒯曼必然要接过世一的班

小光侃娱乐
2026-04-16 10:45:03
马宁执法,拉莫斯和武磊充当送点双子星,国安战平海港剧情太劲爆

马宁执法,拉莫斯和武磊充当送点双子星,国安战平海港剧情太劲爆

姜大叔侃球
2026-05-10 21:57:35
广厦86-81山西拖入生死战,胡金秋17+11,布朗15中3得19分,张宁13分

广厦86-81山西拖入生死战,胡金秋17+11,布朗15中3得19分,张宁13分

懂球帝
2026-05-10 22:03:15
《妻旅》3对姐弟恋各有槽点:均是女强男弱,被看好的只有伊能静

《妻旅》3对姐弟恋各有槽点:均是女强男弱,被看好的只有伊能静

扒点半吃瓜
2026-05-10 07:00:14
后悔莫及,两三百元维修费,换两条人命!辽宁北镇悲剧本可避免

后悔莫及,两三百元维修费,换两条人命!辽宁北镇悲剧本可避免

一口娱乐
2026-05-04 12:30:11
10亿都救不了一命!京东副总裁蔡磊,生命进入倒计时

10亿都救不了一命!京东副总裁蔡磊,生命进入倒计时

听风喃
2026-04-06 11:16:04
中超尴尬纪录:青岛西海岸7连平,距历史8连平仅差一场

中超尴尬纪录:青岛西海岸7连平,距历史8连平仅差一场

阿衃体育
2026-05-10 21:46:45
10日凌晨,亚洲杯抽签结果出炉,国足一般,日本队进入死亡之组

10日凌晨,亚洲杯抽签结果出炉,国足一般,日本队进入死亡之组

林子说事
2026-05-10 05:03:59
“天下第一人”河北彩花出道8周年,2026年夏季相约台北!

“天下第一人”河北彩花出道8周年,2026年夏季相约台北!

吃瓜党二号头目
2026-05-09 10:07:58
最新:俄军偷袭红军村遭乌克兰反击!停火协议走向破裂

最新:俄军偷袭红军村遭乌克兰反击!停火协议走向破裂

项鹏飞
2026-05-10 21:06:59
33岁章泽天风格大变!穿艳俗纱裙、副乳突出,比实际年龄成熟10岁

33岁章泽天风格大变!穿艳俗纱裙、副乳突出,比实际年龄成熟10岁

阿讯说天下
2026-04-18 14:53:39
风暴来袭!全国医院严查12大科室,5月飞检上门,原因让人心酸

风暴来袭!全国医院严查12大科室,5月飞检上门,原因让人心酸

白宸侃片
2026-05-10 14:38:57
冯绍峰没撒谎!消失3个月,曝光率下降的赵丽颖,证实了他的评价

冯绍峰没撒谎!消失3个月,曝光率下降的赵丽颖,证实了他的评价

阿伧说事
2026-05-10 15:30:49
闹大了!法国队赛前放狠话失败,F·勒布伦当场痛哭,哥哥情绪失控

闹大了!法国队赛前放狠话失败,F·勒布伦当场痛哭,哥哥情绪失控

郝小小看体育
2026-05-10 09:30:13
瑞舒伐他汀:你每天吃的这颗小药片,藏着多少你不知道的秘密?

瑞舒伐他汀:你每天吃的这颗小药片,藏着多少你不知道的秘密?

橘子约定
2026-05-10 22:08:46
抓了那么多贪官,钱呢?跟我们有关系吗?

抓了那么多贪官,钱呢?跟我们有关系吗?

细说职场
2026-05-08 22:15:45
实战出真知!乌克兰靠真实战场数据,在中东赚麻了

实战出真知!乌克兰靠真实战场数据,在中东赚麻了

寰球经纬所
2026-05-10 10:10:20
吴宇森最被低估的战争片,为何让凯奇栽了跟头

吴宇森最被低估的战争片,为何让凯奇栽了跟头

娱圈观察员
2026-05-09 19:48:48
99:102!北京加时惜败广东,纵观全场,揪出五大输球罪人!

99:102!北京加时惜败广东,纵观全场,揪出五大输球罪人!

田先生篮球
2026-05-09 22:26:45
靠山倒了?特朗普警告内塔尼亚胡:我是美国最后一位“亲以总统”

靠山倒了?特朗普警告内塔尼亚胡:我是美国最后一位“亲以总统”

爱看剧的阿峰
2026-05-10 20:35:44
2026-05-10 23:04:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15178文章数 66857关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

谈判陷僵局 世界杯转播费报价大幅降低央视仍不接招

头条要闻

谈判陷僵局 世界杯转播费报价大幅降低央视仍不接招

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

手机
旅游
游戏
艺术
家居

手机要闻

联想拯救者手机Y70新一代现身Geekbench

旅游要闻

一路向前,自在骑行!田园社骑行驿站成为庆云打卡新地标

《流放之路2》有望在5月底获得Steam Deck认证

艺术要闻

震撼!Rico Reinhold带你领略欧美复古艺术写真!

家居要闻

菁英人居 全能豪宅

无障碍浏览 进入关怀版