网易首页 > 网易号 > 正文 申请入驻

突发!谷歌放出IMO 2025金牌模型Gemini 2.5 Deep Think,截胡GPT-5?

0
分享至


刚刚谷歌宣布推出Gemini 2.5 Deep Think ,这个模型就是前段时间获得IMO2025金牌的内部模型变体,经过了优化,模型的速度更快了,数学能力可以达到IMO 2025铜牌水平,该功能现已向 Google AI Ultra 订阅者在 Gemini 应用中推出

在不使用工具的情况下,基准测试分数如下,非常强:


值得注意的是,谷歌此次发布了两个版本的Deep Think:

日常可用版 (面向Ultra订阅者): 这个版本在Gemini应用中提供,它更快、更适合日常使用。虽然它在2025年IMO基准测试中达到铜牌水平,但已经足以应对大量复杂的日常任务

竞赛级完整版 (面向顶尖数学家): 谷歌还将一个在IMO竞赛中达到金牌标准的完整版Deep Think模型提供给一小部分精选的数学家和学者。该版本虽然推理耗时更长,但能力也更强,旨在帮助他们进行前沿研究,并收集反馈以持续改进模型

什么是Deep Think?它如何工作?

Deep Think的核心在于其创新的工作方式:扩展Gemini模型的并行思考时间

正如人类在面对难题时需要多角度探索、权衡各种解决方案并反复推敲一样,Deep Think通过并行思考技术,让Gemini能够同时生成大量想法,并对其进行评估、修正甚至融合,最终得出最佳答案。通过延长模型的推理时间(即思考时间),Gemini获得了更充足的空间来探索不同的假设,从而为复杂问题找到更具创造力的解决方案。

此外,谷歌还开发了新的强化学习技术,鼓励模型充分利用这些扩展的推理路径,使其随着时间的推移,成长为更优秀、更直观的问题解决者

Deep Think的强大能力与应用场景

根据谷歌的介绍,Deep Think在需要创造力、战略规划和逐步迭代改进的任务中表现卓越,主要体现在以下几个方面:

迭代开发与设计: Deep Think在逐步构建复杂项目的任务中表现出色。例如,在网页开发任务中,它能同时提升页面的美观度和功能性。文章中的一个示例展示了,相比Gemini 2.5 Flash和Pro,Deep Think能够根据指令生成一个细节极其丰富、更具创造性和美感的体素艺术宝塔场景

科学与数学发现: 凭借其强大的复杂问题推理能力,Deep Think可以成为科研人员的有力工具。它能帮助构想和探索数学猜想,或对复杂的科学文献进行推理,从而潜在地加速科学发现的进程

算法开发与代码: Deep Think尤其擅长解决高难度的编程问题,特别是在那些需要精确问题定义、权衡利弊和考虑时间复杂度的场景中,其优势尤为突出

参考:

https://blog.google/products/gemini/gemini-2-5-deep-think/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
六旬大叔相亲后提同居,女方:行,只要你答应我一件事

六旬大叔相亲后提同居,女方:行,只要你答应我一件事

兰姐说故事
2025-08-28 17:05:06
饭圈涌入了游泳界?张展硕击败潘展乐拿金牌,网友:请给潘治肩伤

饭圈涌入了游泳界?张展硕击败潘展乐拿金牌,网友:请给潘治肩伤

蜜桔娱乐
2025-11-12 21:25:34
九旬母亲被儿子暴打后续:一顿毒打,原因仅是阻拦儿子与人争吵

九旬母亲被儿子暴打后续:一顿毒打,原因仅是阻拦儿子与人争吵

不写散文诗
2025-11-12 17:12:44
有钱也没用!这一次,三代人都受邀观礼的霍家,给李嘉诚上了一课

有钱也没用!这一次,三代人都受邀观礼的霍家,给李嘉诚上了一课

手工制作阿歼
2025-11-13 02:39:13
颖儿,记住纸是包不住火的啊,38岁付辛博“老来俏”,还是翻红了

颖儿,记住纸是包不住火的啊,38岁付辛博“老来俏”,还是翻红了

瓜农娟姐
2025-11-13 01:53:49
仅仅是在KTV上班一周,女朋友就跟换了个人一样,为什么?

仅仅是在KTV上班一周,女朋友就跟换了个人一样,为什么?

新时代的两性情感
2025-10-21 02:15:25
全运会乒乓球:上海3选手晋级男单8强

全运会乒乓球:上海3选手晋级男单8强

赫岝乡村摄影
2025-11-13 00:30:35
荒野手艺人张老六透露请假参加比赛,网友羡慕他能请到长假,公司回应:支持他

荒野手艺人张老六透露请假参加比赛,网友羡慕他能请到长假,公司回应:支持他

极目新闻
2025-11-11 14:09:23
湖南省长沙市人民政府原副市长、市公安局原局长唐向阳被公诉

湖南省长沙市人民政府原副市长、市公安局原局长唐向阳被公诉

鲁中晨报
2025-11-12 16:19:02
中国男人捧红的“羽绒服贵族”,成功截胡加拿大鹅

中国男人捧红的“羽绒服贵族”,成功截胡加拿大鹅

金错刀
2025-11-10 16:18:13
轻断食翻车,再添新证!最新研究:进食<8小时,心血管死亡风险飙升135%;且伤β细胞,代谢疾病风险也激增

轻断食翻车,再添新证!最新研究:进食<8小时,心血管死亡风险飙升135%;且伤β细胞,代谢疾病风险也激增

梅斯医学
2025-11-12 07:53:26
宁夏退伍士兵将岳父全家7口人全部割喉,妻子肚里的孩子都没放过

宁夏退伍士兵将岳父全家7口人全部割喉,妻子肚里的孩子都没放过

热风追逐者
2025-09-24 23:41:51
涉案超27亿元!跨境赌博十大逃犯之一佘智江被引渡回国 公安部披露详情

涉案超27亿元!跨境赌博十大逃犯之一佘智江被引渡回国 公安部披露详情

每日经济新闻
2025-11-12 22:50:06
第二个默克尔出现,力挽狂澜!欧盟强制剔除华为,中方在京等贵客

第二个默克尔出现,力挽狂澜!欧盟强制剔除华为,中方在京等贵客

小陆搞笑日常
2025-11-12 12:32:09
何穗产后首晒照、网友:这是刚生完的人吗?

何穗产后首晒照、网友:这是刚生完的人吗?

艳姐的搞笑视频
2025-11-12 17:11:48
哈维:我在带领巴萨赢得西甲后降低了标准,必须进行自我批评

哈维:我在带领巴萨赢得西甲后降低了标准,必须进行自我批评

懂球帝
2025-11-13 03:25:05
当年“五星红旗”仅得5票,而三号作品得了342票,为何选了前者

当年“五星红旗”仅得5票,而三号作品得了342票,为何选了前者

浩渺青史
2025-11-12 18:34:03
广东一夜3消息!徐杰获封MVP,黑白矮首夺全运金牌,周鹏激动落泪

广东一夜3消息!徐杰获封MVP,黑白矮首夺全运金牌,周鹏激动落泪

多特体育说
2025-11-13 00:13:20
美国游泳名宿公开抹黑于子迪:13岁这么快?这是史上最荒诞的一幕

美国游泳名宿公开抹黑于子迪:13岁这么快?这是史上最荒诞的一幕

杨华评论
2025-11-12 23:41:08
悬着的心终于放下:滞留太空的中国航天员,带来意想不到的惊喜!

悬着的心终于放下:滞留太空的中国航天员,带来意想不到的惊喜!

刘森森
2025-11-12 11:26:11
2025-11-13 06:48:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
967文章数 370关注度
往期回顾 全部

科技要闻

前阿里人亲述: “经济上行”期双11什么样

头条要闻

俄外交部:乌方停止与俄谈判说明其缺乏达成和平意愿

头条要闻

俄外交部:乌方停止与俄谈判说明其缺乏达成和平意愿

体育要闻

消磨你上千小时的足球游戏,走过第20年

娱乐要闻

再王珞丹和白百何 明白两人"差别"在哪

财经要闻

段永平最新访谈:聊企业经营 投资理念

汽车要闻

7座皆独立座椅/新增5座版 体验第三代吉利豪越L

态度原创

亲子
家居
手机
艺术
公开课

亲子要闻

男孩总是躁怒崩溃,送去医院就诊,被确诊的却是孩子父母

家居要闻

情感之所 生活教会设计

手机要闻

TOP5厂商齐推双2亿像素:华为、小米、OPPO、vivo、荣耀!

艺术要闻

刚刚、贵州突然流出一批照片,全世界都吃惊了....

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版