网易首页 > 网易科技 > 网易科技 > 正文

谷歌发布Gemini 2.5 Deep Think:月费250美元会员可用

0
分享至
核心提示
  • 01 谷歌DeepMind正式推出其迄今最先进的AI推理模型Gemini 2.5 Deep Think。该模型是谷歌首个公开发布的多智能体系统,能同时探索并权衡多种解题路径以选出最优答案。订阅了Ultra服务的用户可率先体验。
  • 02 谷歌称,该模型在HLE和高难度编程竞赛等基准测试中,表现均超越了OpenAI、xAI和Anthropic的同类模型。公司认为其有望助力科研人员,并“有可能加速科学发现的进程”。因运营成本高昂,这类系统或将成为顶级付费订阅的专属功能。
  • 03 多智能体系统已成为业界前沿探索方向。xAI、OpenAI、Anthropic等主要竞争对手近期均已推出或被披露正在采用类似的多智能体架构。

8月2日消息,据TechCrunch报道,谷歌DeepMind正式推出Gemini 2.5 Deep Think。据公司介绍,这是其迄今为止最先进的AI推理模型,能够在回答问题时同时探索并权衡多种解题路径,进而选出最优答案。

从本周五起,订阅了每月250美元Ultra订阅服务的用户,将可在Gemini应用中率先体验Gemini 2.5 Deep Think。

Gemini 2.5 Deep Think最早亮相于2025年的谷歌I/O大会,是谷歌公开发布的首个多智能体(multi-agent)模型。这类系统可同时生成多个AI智能体,并行处理同一问题,虽然对算力资源的消耗远超单一智能体,但通常能获得更优的解答。

谷歌曾以Gemini 2.5 Deep Think的一个变体,在今年的国际数学奥林匹克(IMO)上斩获金牌。

与此同时,谷歌还宣布向部分经过筛选的数学家和学者群体,开放其在IMO赛事中使用的那一版模型。公司表示,这一AI模型完成一次推理“需要数小时”,远超绝大多数面向消费级用户的AI模型(通常仅需数秒或数分钟)。谷歌希望该IMO模型能助力科研,并收集反馈,以便进一步优化多智能体系统在学术场景下的应用。

谷歌指出,相较于I/O大会上首次亮相的版本,如今的Gemini 2.5 Deep Think已有显著提升。公司还宣称已开发出“全新的强化学习技术”,以促使Gemini 2.5 Deep Think更高效地利用其推理路径。

谷歌在一篇博文中表示:“Deep Think能帮助用户解决需要创造力、战略规划和逐步改进的问题。”

公司称,Gemini 2.5 Deep Think在“人类终极大考”(Humanity’s Last Exam,HLE)上取得了顶尖水平(state-of-the-art)的表现。HLE是一项极具挑战性的测试,旨在评估AI回答数千道来自数学、人文、科学等领域众包问题的能力。谷歌称,其模型在不借助外部工具的情况下,HLE得分为34.8%,而xAI的Grok 4得分为25.4%,OpenAI的o3得分为20.3%。

此外,Gemini 2.5 Deep Think在LiveCodeBench 6这一高难度编程竞赛测试中,表现同样超越了OpenAI、xAI和Anthropic的AI模型。谷歌模型的得分为87.6%,Grok 4为79%,OpenAI的o3为72%。

Gemini 2.5 Deep Think能自动调用代码执行、谷歌搜索等工具,并且公司表示,该模型生成的回应“篇幅远超传统AI模型”。

在谷歌的内部测试中,相较于其他AI模型,Gemini 2.5 Deep Think完成的网页开发任务在细节丰富度和视觉美感上均更胜一筹。公司认为,该模型有望为科研人员提供助力,“并有可能加速科学发现的进程”。

目前,多智能体系统已成为业界前沿的探索方向。埃隆·马斯克(Elon Musk)旗下的xAI近期也推出了多智能体系统Grok 4 Heavy,据称在多项基准测试中取得领先成绩。OpenAI研究员诺姆·布朗(Noam Brown)在播客中透露,公司今年在IMO上获得金牌所用的未公开模型,同样采用了多智能体架构。与此同时,Anthropic旗下能生成详尽研究简报的工具Research agent,也同样依托多智能体系统提供支持。

尽管多智能体系统表现突出,但其运营成本甚至高于传统AI模型。这也意味着,科技公司很可能会将这类高成本的系统,作为其顶级付费订阅服务的一项专属功能,正如xAI和谷歌目前所做的那样。

在接下来的几周,谷歌计划通过Gemini API,邀请一小批测试者体验Gemini 2.5 Deep Think。公司表示,此举是希望进一步了解开发者和企业用户可能会如何利用其多智能体系统。(易句)

(本文由AI翻译,网易编辑负责校对)

相关推荐
热点推荐
50年代,彭德怀推荐陈赓接替自己任国防部长,毛主席为何不同意?

50年代,彭德怀推荐陈赓接替自己任国防部长,毛主席为何不同意?

谈古论今历史有道
2025-12-17 13:05:03
终于栽了!黎智英罪名成立,美国“大鱼”被供出,这回彻底凉透了

终于栽了!黎智英罪名成立,美国“大鱼”被供出,这回彻底凉透了

菊宝视界
2025-12-17 12:40:03
超500万点赞!广州“网红教授”发长文悼念好友,“没有人会对一捧土产生情感,直到自己亲手垒起了一座”

超500万点赞!广州“网红教授”发长文悼念好友,“没有人会对一捧土产生情感,直到自己亲手垒起了一座”

环球网资讯
2025-12-17 07:33:16
袁世凯坐龙椅的真实老照片,接受群臣朝拜,“妃子们”也非常漂亮

袁世凯坐龙椅的真实老照片,接受群臣朝拜,“妃子们”也非常漂亮

文史微鉴
2025-12-13 22:13:15
俄媒女主持人:只要中国愿出兵300万,俄军很快就能打败乌克兰

俄媒女主持人:只要中国愿出兵300万,俄军很快就能打败乌克兰

梦想的现实
2025-12-15 23:11:18
忍无可忍!泰国F-16直接开炸,柬埔寨150亿没了,邻国竟无一发声

忍无可忍!泰国F-16直接开炸,柬埔寨150亿没了,邻国竟无一发声

书纪文谭
2025-12-15 14:32:42
善恶有报,移居英国仅2年,57岁吴秀波再迎噩耗,步入李易峰后尘

善恶有报,移居英国仅2年,57岁吴秀波再迎噩耗,步入李易峰后尘

社会日日鲜
2025-12-17 08:13:19
捡到宝了!泰国上将:中国没要求归还导弹,将反打柬埔寨59D坦克

捡到宝了!泰国上将:中国没要求归还导弹,将反打柬埔寨59D坦克

南宫一二
2025-12-17 07:22:32
国产大力神首飞!中国新型运-30军用运输机首飞,性能超越美国

国产大力神首飞!中国新型运-30军用运输机首飞,性能超越美国

军迷战情室
2025-12-17 07:18:32
胡幼桃搞权色钱色交易,于文明搞隐性腐败,中纪委打两“虎”

胡幼桃搞权色钱色交易,于文明搞隐性腐败,中纪委打两“虎”

南方都市报
2025-12-16 14:34:07
泰国为泰党公布三名总理候选人

泰国为泰党公布三名总理候选人

界面新闻
2025-12-16 19:20:06
只因长得太美就被导演潜规则,多年后无戏可拍的她,靠胡歌才走红

只因长得太美就被导演潜规则,多年后无戏可拍的她,靠胡歌才走红

一娱三分地
2025-12-14 22:21:38
中央最近亮剑了,十五五规划直接把“遮羞布”扯了下来。

中央最近亮剑了,十五五规划直接把“遮羞布”扯了下来。

南权先生
2025-12-16 16:24:33
爆冷!《阿凡达3》预售较前作腰斩,“票价太贵”遭吐槽:IMAX 3D可达200元!投资方博纳影业5天4板后连续跌停

爆冷!《阿凡达3》预售较前作腰斩,“票价太贵”遭吐槽:IMAX 3D可达200元!投资方博纳影业5天4板后连续跌停

每日经济新闻
2025-12-17 00:02:20
60岁蒋雯丽心酸现状,定居英国,又瘦又老,一代女神成了"笑话"

60岁蒋雯丽心酸现状,定居英国,又瘦又老,一代女神成了"笑话"

小熊侃史
2025-11-27 18:59:29
欧洲也撑不住了!昨天欧盟突然正式宣布:放弃2035年内燃机禁令!

欧洲也撑不住了!昨天欧盟突然正式宣布:放弃2035年内燃机禁令!

青青子衿
2025-12-17 07:16:00
11国进军乌克兰?特朗普未表态,欧洲联军上场,俄罗斯态度坚决

11国进军乌克兰?特朗普未表态,欧洲联军上场,俄罗斯态度坚决

音乐时光的娱乐
2025-12-17 11:54:02
整个社会都在喊没钱?看懂日本通缩30年,就知道普通人如何翻身了

整个社会都在喊没钱?看懂日本通缩30年,就知道普通人如何翻身了

博览历史
2025-10-08 17:02:11
南通一公立医院医生抛下患者去考试?网友:管理太混乱!

南通一公立医院医生抛下患者去考试?网友:管理太混乱!

好通网
2025-12-17 11:31:01
华为“变天”!余承东升任董事长,孟晚舟、徐直军等卸任董事

华为“变天”!余承东升任董事长,孟晚舟、徐直军等卸任董事

树科技
2025-12-16 15:44:16
2025-12-17 13:56:49

科技要闻

无人驾驶迈关键一步 特斯拉股价触历史新高

头条要闻

独居女子去世遗产被收归国有 远亲想帮买墓安葬遇难题

头条要闻

独居女子去世遗产被收归国有 远亲想帮买墓安葬遇难题

体育要闻

短短一年,从争冠到0胜垫底...

娱乐要闻

鞠婧祎收入曝光,丝芭称已支付1.3亿

财经要闻

"祥源系"爆雷 有投资者数百万元无法提现

汽车要闻

一车多动力+双姿态 长城欧拉5上市 限时9.18万元起

态度原创

本地
家居
时尚
旅游
公开课

本地新闻

云游安徽|踏过战壕与石板,读一部活的淮北史

家居要闻

温馨独栋 驼色与浅色碰撞

那些被称赞 “老得慢” 的阿姨们,这样穿,比同龄人显年轻

旅游要闻

赏星光、游雪境、感受摩登城市魅力,上海冬日消费活力持续升温

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×