网易首页 > 网易科技 > 网易科技 > 正文

谷歌发布Gemini 2.5 Deep Think:月费250美元会员可用

0
分享至
核心提示
  • 01 谷歌DeepMind正式推出其迄今最先进的AI推理模型Gemini 2.5 Deep Think。该模型是谷歌首个公开发布的多智能体系统,能同时探索并权衡多种解题路径以选出最优答案。订阅了Ultra服务的用户可率先体验。
  • 02 谷歌称,该模型在HLE和高难度编程竞赛等基准测试中,表现均超越了OpenAI、xAI和Anthropic的同类模型。公司认为其有望助力科研人员,并“有可能加速科学发现的进程”。因运营成本高昂,这类系统或将成为顶级付费订阅的专属功能。
  • 03 多智能体系统已成为业界前沿探索方向。xAI、OpenAI、Anthropic等主要竞争对手近期均已推出或被披露正在采用类似的多智能体架构。

8月2日消息,据TechCrunch报道,谷歌DeepMind正式推出Gemini 2.5 Deep Think。据公司介绍,这是其迄今为止最先进的AI推理模型,能够在回答问题时同时探索并权衡多种解题路径,进而选出最优答案。

从本周五起,订阅了每月250美元Ultra订阅服务的用户,将可在Gemini应用中率先体验Gemini 2.5 Deep Think。

Gemini 2.5 Deep Think最早亮相于2025年的谷歌I/O大会,是谷歌公开发布的首个多智能体(multi-agent)模型。这类系统可同时生成多个AI智能体,并行处理同一问题,虽然对算力资源的消耗远超单一智能体,但通常能获得更优的解答。

谷歌曾以Gemini 2.5 Deep Think的一个变体,在今年的国际数学奥林匹克(IMO)上斩获金牌。

与此同时,谷歌还宣布向部分经过筛选的数学家和学者群体,开放其在IMO赛事中使用的那一版模型。公司表示,这一AI模型完成一次推理“需要数小时”,远超绝大多数面向消费级用户的AI模型(通常仅需数秒或数分钟)。谷歌希望该IMO模型能助力科研,并收集反馈,以便进一步优化多智能体系统在学术场景下的应用。

谷歌指出,相较于I/O大会上首次亮相的版本,如今的Gemini 2.5 Deep Think已有显著提升。公司还宣称已开发出“全新的强化学习技术”,以促使Gemini 2.5 Deep Think更高效地利用其推理路径。

谷歌在一篇博文中表示:“Deep Think能帮助用户解决需要创造力、战略规划和逐步改进的问题。”

公司称,Gemini 2.5 Deep Think在“人类终极大考”(Humanity’s Last Exam,HLE)上取得了顶尖水平(state-of-the-art)的表现。HLE是一项极具挑战性的测试,旨在评估AI回答数千道来自数学、人文、科学等领域众包问题的能力。谷歌称,其模型在不借助外部工具的情况下,HLE得分为34.8%,而xAI的Grok 4得分为25.4%,OpenAI的o3得分为20.3%。

此外,Gemini 2.5 Deep Think在LiveCodeBench 6这一高难度编程竞赛测试中,表现同样超越了OpenAI、xAI和Anthropic的AI模型。谷歌模型的得分为87.6%,Grok 4为79%,OpenAI的o3为72%。

Gemini 2.5 Deep Think能自动调用代码执行、谷歌搜索等工具,并且公司表示,该模型生成的回应“篇幅远超传统AI模型”。

在谷歌的内部测试中,相较于其他AI模型,Gemini 2.5 Deep Think完成的网页开发任务在细节丰富度和视觉美感上均更胜一筹。公司认为,该模型有望为科研人员提供助力,“并有可能加速科学发现的进程”。

目前,多智能体系统已成为业界前沿的探索方向。埃隆·马斯克(Elon Musk)旗下的xAI近期也推出了多智能体系统Grok 4 Heavy,据称在多项基准测试中取得领先成绩。OpenAI研究员诺姆·布朗(Noam Brown)在播客中透露,公司今年在IMO上获得金牌所用的未公开模型,同样采用了多智能体架构。与此同时,Anthropic旗下能生成详尽研究简报的工具Research agent,也同样依托多智能体系统提供支持。

尽管多智能体系统表现突出,但其运营成本甚至高于传统AI模型。这也意味着,科技公司很可能会将这类高成本的系统,作为其顶级付费订阅服务的一项专属功能,正如xAI和谷歌目前所做的那样。

在接下来的几周,谷歌计划通过Gemini API,邀请一小批测试者体验Gemini 2.5 Deep Think。公司表示,此举是希望进一步了解开发者和企业用户可能会如何利用其多智能体系统。(易句)

(本文由AI翻译,网易编辑负责校对)

相关推荐
热点推荐
CCTV5直播,杯赛揭幕战,广东PK山西,崔永熙、焦泊乔迎广东首秀

CCTV5直播,杯赛揭幕战,广东PK山西,崔永熙、焦泊乔迎广东首秀

体坛小快灵
2025-11-18 09:04:26
中美俄每月养老金对比:美国一个月1.3万,俄罗斯1692元,中国呢

中美俄每月养老金对比:美国一个月1.3万,俄罗斯1692元,中国呢

阿伧说事
2025-11-11 10:40:35
乌克兰一夜重击俄罗斯三大电网!清理红军村26平方公里

乌克兰一夜重击俄罗斯三大电网!清理红军村26平方公里

项鹏飞
2025-11-17 20:54:09
最有可能融为一体的两个国家,合并即登顶超级大国

最有可能融为一体的两个国家,合并即登顶超级大国

猫眼观史
2025-11-17 15:10:18
19岁男孩喝百草枯苦熬18天,逼外出打工母亲回家,母亲:你放心去

19岁男孩喝百草枯苦熬18天,逼外出打工母亲回家,母亲:你放心去

林子说事
2025-11-12 10:40:27
“我已经照顾不动她了”,日本女子勒死102岁母亲,被判监禁3年缓刑5年

“我已经照顾不动她了”,日本女子勒死102岁母亲,被判监禁3年缓刑5年

极目新闻
2025-11-18 10:55:02
人40元狗30元!游客带宠物狗进被收门票,浙江一景区:有相应游玩项目,已实行半年

人40元狗30元!游客带宠物狗进被收门票,浙江一景区:有相应游玩项目,已实行半年

潇湘晨报
2025-11-18 12:12:00
放不开手脚!韩国归化了德甲球星,却被国家队主帅洪明甫冷落

放不开手脚!韩国归化了德甲球星,却被国家队主帅洪明甫冷落

星耀国际足坛
2025-11-17 23:46:38
7国达成一致,不许解放军动手,美国连开3枪,上亿军火将运往台岛

7国达成一致,不许解放军动手,美国连开3枪,上亿军火将运往台岛

科技处长
2025-11-15 14:24:09
中日破裂,这是53年来对日最强硬的外交表态!

中日破裂,这是53年来对日最强硬的外交表态!

见闻致
2025-11-15 21:21:56
走路出现这7种迹象,寿命可能长不了!第5个尤其凶险

走路出现这7种迹象,寿命可能长不了!第5个尤其凶险

资说
2025-11-14 10:47:02
太难了!佛山一工厂发布春节放假通知,网友:回家不用抢火车票了

太难了!佛山一工厂发布春节放假通知,网友:回家不用抢火车票了

火山诗话
2025-11-17 05:42:07
泰王不懂妻美!和苏提达王后参观北京航天城,对其使眼神表情严肃

泰王不懂妻美!和苏提达王后参观北京航天城,对其使眼神表情严肃

夜深爱杂谈
2025-11-17 20:54:37
满屏荷尔蒙!网飞这一脱,又赢麻了

满屏荷尔蒙!网飞这一脱,又赢麻了

来看美剧
2025-11-17 21:10:16
欧阳开盛:被迫返乡农民工引发的乡村社会治安问题及治理路径

欧阳开盛:被迫返乡农民工引发的乡村社会治安问题及治理路径

中国乡村发现
2025-11-18 13:29:49
俞敏洪,无需共情牛马

俞敏洪,无需共情牛马

板砖谛深思考
2025-11-18 13:13:04
小米集团:智能电动汽车及AI等创新业务分部首次实现单季度经营盈利

小米集团:智能电动汽车及AI等创新业务分部首次实现单季度经营盈利

界面新闻
2025-11-18 17:32:10
男女越轨前都有两个默认信号,第二个尤其关键,几乎无人能躲过

男女越轨前都有两个默认信号,第二个尤其关键,几乎无人能躲过

晓艾故事汇
2025-11-11 08:03:07
终于,一场对网贷高利贷的严控要来了!

终于,一场对网贷高利贷的严控要来了!

深度报
2025-11-17 22:51:13
张家界七星山荒野求生比赛第40天迎来大降温,“林北”捡柴时手都冻木了,储备物资还可维持十多天

张家界七星山荒野求生比赛第40天迎来大降温,“林北”捡柴时手都冻木了,储备物资还可维持十多天

极目新闻
2025-11-17 22:30:52
2025-11-18 18:55:00

科技要闻

小米:汽车及AI等业务首次单季度经营盈利

头条要闻

22岁女生跳河轻生 生前因未请假离校与辅导员发生争执

头条要闻

22岁女生跳河轻生 生前因未请假离校与辅导员发生争执

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

宋佳夺影后动了谁的奶酪

财经要闻

中美机器人爆发了一场论战

汽车要闻

搭载1.5T增程动力 吉利银河V900官图发布

态度原创

健康
旅游
教育
房产
时尚

警惕超声报告这六大"坑"

旅游要闻

中国游客出境偏好变了!韩国取代日本登顶第一,上海直飞沙巴包机将重启

教育要闻

青岛敦化路小学“敦行•夜校”——如何与手机、网络现代工具“和谐相处”

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

从百元到大牌,《新闻女王2》的职场穿搭,每种预算都能找到参考

无障碍浏览 进入关怀版
×