网易首页 > 网易号 > 正文 申请入驻

谷歌推最强Gemini推理模型:月费1800,已拿奥赛金牌,性能超OpenAI o3和Grok 4

0
分享至


智东西
作者 ZeR0
编辑 漠影

智东西8月2日报道,昨夜,谷歌推出其迄今最强推理模型Gemini 2.5 Deep Think。

这是最近在今年国际数学奥林匹克(IMO)上“拿金牌”的模型的变体。近期高级版Gemini Deep Think完美解答了IMO 6道题目中的5道,总分35分(满分42分),达到金牌水平。

该模型需要几个小时才能推理出复杂的数学问题。新发布的版本在日常使用中速度更快、更易用,根据内部评估,在2025年IMO基准测试中仍达到铜牌水平。

谷歌在今年5月的I/O开发者大会上首次预览了Gemini 2.5 Deep Think。新版本进行了“重大改进”。在具有挑战性的编程、科学、知识、推理基准测试中,与OpenAI o3、Grok 4等其他不使用工具的模型相比,Gemini 2.5 Deep Think在LiveCodeBench V6和Humanity’s Last Exam均取得最佳性能。


Gemini app中的Deep Think模型,使用思考技巧来提供更详细、更有创意和更周到的回答,甚至可以帮助数学家来测试数学猜想,还能提高Web开发任务的美观性。


Deep Think支持文本、图像、音频、视频等输入和1M tokens上下文窗口,输出长度为192K tokens。

其工作原理是利用谷歌的并行思维技术,能同时生成多个想法,并同时进行思考,甚至随着时间的推移不断修改或整合不同的想法,最终得出最佳答案。

此外,通过延长推理时间或“思考时间”,谷歌给了Gemini更多的时间来探索不同的假设,并为复杂问题找到创造性的解决方案。

谷歌还开发了新颖的强化学习技术,鼓励模型利用这些扩展的推理路径,从而使Deep Think随时间推移成为更好、更直观的问题解决者。

Deep Think可以帮助人们解决需要创造力、战略规划和逐步改进的问题,例如:

  • 迭代开发和设计:在需要逐块构建复杂事物的任务上的表现出色,比如可以提高网络开发任务的美学和功能。
  • 科学和数学发现:可推理出高度复杂的问题,通过复杂的科学文献帮助制定和探索数学猜想或推理,可能加速发现之路。
  • 算法开发和代码:在棘手的编码问题上特别出色,其中问题制定和仔细考虑权衡和时间复杂性是最重要的。

目前仅有最高级别的Google AI Ultra订阅者可选用“Deep Think”,每月订阅费为249.99美元(约合人民币1803元)。

Deep Think自动与代码执行和谷歌搜索等工具配合使用,并能产生更长的响应。

同时,达到IMO金牌水平的Deep Think模型将进一步测试,并向一小部分数学家和学者分享,用于辅助研究。谷歌计划利用这些反馈来完善该模型的未来版本。

谷歌还正在努力在未来几周内通过Gemini API向一组受信任的测试人员发布带和不带工具的Deep Think,以更好地了解其对开发者和企业用例的可用性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
乌克兰,不要放过这个千载难逢的机会!

乌克兰,不要放过这个千载难逢的机会!

近距离
2025-11-12 11:51:40
福建省赖氏宗亲会秘书长喊话赖清德,国台办回应

福建省赖氏宗亲会秘书长喊话赖清德,国台办回应

界面新闻
2025-11-12 11:06:35
才买2年就被车企“抛弃”?这群车主开始破解车机了。

才买2年就被车企“抛弃”?这群车主开始破解车机了。

差评XPIN
2025-11-11 00:09:14
总在凌晨3-5点醒来的人,并非睡不好,而是你的“前世”在求救

总在凌晨3-5点醒来的人,并非睡不好,而是你的“前世”在求救

古怪奇谈录
2025-11-06 14:50:51
建国后,许世友在南京外出散步碰到歹徒抢劫,将军说:把东西放下

建国后,许世友在南京外出散步碰到歹徒抢劫,将军说:把东西放下

云端小院
2025-11-12 08:30:59
你要打多久我就陪多久!只要大陆战机敢越线,台军就开第1枪击落

你要打多久我就陪多久!只要大陆战机敢越线,台军就开第1枪击落

许穋很机智
2025-11-10 01:52:53
暂停供热通知!涉及长春这些区域

暂停供热通知!涉及长春这些区域

鲁中晨报
2025-11-12 11:23:01
韩国男演员吴永秀涉嫌猥亵罪案二审被判无罪,此前曾凭《鱿鱼游戏》获得金球奖

韩国男演员吴永秀涉嫌猥亵罪案二审被判无罪,此前曾凭《鱿鱼游戏》获得金球奖

红星新闻
2025-11-11 20:30:11
陪玩陪睡不够!集体开嫖、舔手指、目无王法,阴暗面彻底藏不住了

陪玩陪睡不够!集体开嫖、舔手指、目无王法,阴暗面彻底藏不住了

好贤观史记
2025-11-09 21:58:39
有内幕?浙江男篮淘汰四川男篮后发文:将和广东男篮争冠

有内幕?浙江男篮淘汰四川男篮后发文:将和广东男篮争冠

邹维体育
2025-11-11 19:01:21
金鸡奖开幕式,陈飞宇粉底厚,49岁曾黎美若天仙,万茜泡面头翻车

金鸡奖开幕式,陈飞宇粉底厚,49岁曾黎美若天仙,万茜泡面头翻车

小徐讲八卦
2025-11-12 07:16:34
目前获5支NBL球队报价!媒体人曝曾凡博即将回国参加国家队集训

目前获5支NBL球队报价!媒体人曝曾凡博即将回国参加国家队集训

狼叔评论
2025-11-12 13:34:05
荒野手艺人张老六请假参赛,公司领导:请假期间工资照发,进决赛还有奖励

荒野手艺人张老六请假参赛,公司领导:请假期间工资照发,进决赛还有奖励

极目新闻
2025-11-12 13:59:17
特朗普不得不访华,美国人已经发现,中国跟二战时期美国一样强大

特朗普不得不访华,美国人已经发现,中国跟二战时期美国一样强大

阿七说史
2025-11-11 12:50:28
中国有权在日本驻军,高市早苗闯了大祸,日方意识到大事不妙!

中国有权在日本驻军,高市早苗闯了大祸,日方意识到大事不妙!

天气观察站
2025-11-12 12:41:06
曝白百何资源受影响!好友还在嘴硬,多位业内下场内涵:太任性了

曝白百何资源受影响!好友还在嘴硬,多位业内下场内涵:太任性了

萌神木木
2025-11-11 17:30:11
苏州初中门口现黄毛男青年,校方称管不了马路上的事

苏州初中门口现黄毛男青年,校方称管不了马路上的事

小史家
2025-11-12 10:12:20
重要提醒!12月31日截止,请抓紧办理!

重要提醒!12月31日截止,请抓紧办理!

崇义融媒体
2025-11-12 07:42:38
64岁的刘德华终于开始大大方方的公开自己和老婆朱丽倩的照片。

64岁的刘德华终于开始大大方方的公开自己和老婆朱丽倩的照片。

科学发掘
2025-11-11 13:33:40
13岁被侵犯,30年无性婚姻,这个女人是疯子、天才!却治愈了千万人

13岁被侵犯,30年无性婚姻,这个女人是疯子、天才!却治愈了千万人

十点读书
2025-11-11 12:24:39
2025-11-12 15:28:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
10726文章数 116895关注度
往期回顾 全部

科技要闻

Meta"宫斗"持续,AI教父杨立昆被"气"走了

头条要闻

美主持人污蔑中国人窃取知识产权 遭特朗普反驳

头条要闻

美主持人污蔑中国人窃取知识产权 遭特朗普反驳

体育要闻

太阳三连胜&活塞东部第一 哪个更想不到

娱乐要闻

辛芷蕾配得上威尼斯影后吗?

财经要闻

专家建议设立5万亿房地产稳定基金

汽车要闻

能得到央视的肯定 长安马自达EZ-60可不简单

态度原创

时尚
本地
艺术
公开课
军事航空

“廓形穿衣法”太火了!掌握这5个法则让你美一整个冬天

本地新闻

云游安徽 | 凌滩玉魄淬千年,诗意钢城马鞍山

艺术要闻

毛主席珍贵签名照曝光,鲜为人知的历史瞬间!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美媒爆出猛料 "北溪"破坏行动由扎卢日内指挥

无障碍浏览 进入关怀版