网易首页 > 网易号 > 正文 申请入驻

Google推出下一代人工智能推理模型Gemini 2.5

0
分享至

周二,Google发布了 Gemini 2.5,这是一系列新的人工智能推理模型,可以在回答问题之前停下来“思考”。为了启动新模型系列,Google推出了 Gemini 2.5 Pro Experimental,这是一款多模式推理 AI 模型,该公司声称这是迄今为止最智能的模型。

该模型将于周二在公司的开发者平台 Google AI Studio 以及 Gemini 应用程序中推出,供该公司每月 20 美元的 AI 计划 Gemini Advanced 的订阅者使用。

展望未来,Google表示其所有新人工智能模型都将具备推理能力。

自 OpenAI于 2024 年 9 月推出首个 AI 推理模型以来,科技行业一直在竞相用自己的模型来匹敌或超越该模型的能力。如今,Anthropic、DeepSeek、Google 和 xAI 都拥有 AI 推理模型,这些模型利用额外的计算能力和时间来核实事实并推理问题,然后再给出答案。

推理技术帮助人工智能模型在数学和编码任务上取得了新的高度。科技界的许多人认为推理模型将成为人工智能代理的关键组成部分,人工智能代理是可以执行基本无需人工干预的任务的自主系统。然而,这些模型也更昂贵。

Google声称,Gemini 2.5 Pro 在多个基准测试中的表现均优于其之前的前沿 AI 模型以及一些领先的 AI 竞争模型。具体来说,Google表示,Gemini 2.5 的设计初衷是打造出视觉效果出众的 Web 应用和代理编码应用程序。

在一项名为 Aider Polyglot 的代码编辑评估中,Google表示 Gemini 2.5 Pro 的得分为 68.6%,超过了 OpenAI、Anthropic 和中国人工智能实验室 DeepSeek 的顶尖人工智能模型。

然而,在另一项衡量软件开发能力的测试 SWE-bench Verified 中,Gemini 2.5 Pro 的得分为 63.8%,优于 OpenAI 的 o3-mini 和 DeepSeek 的 R1,但低于 Anthropic 的 Claude 3.7 Sonnet,后者的得分为 70.3%。

在著名的“人类的最后考试”中的一项包括数千道数学、人文和自然科学众包问题的多模式测试——Google表示,Gemini 2.5 Pro 的得分为 18.8%,优于 OpenAI、Anthropic 和 DeepSeek 的领先 AI 模型。

首先,Google表示 Gemini 2.5 Pro 配备了 100 万个 token 上下文窗口,这意味着 AI 模型可以在一个提示中吸收大约 75 万个单词。这比整个《指环王》系列丛书还要长。不过,Google表示,200 万个 token 上下文窗口即将推出。

Google之前曾尝试过人工智能推理模型——此前曾于 12 月发布过 Gemini 的“思考”版本——但 Gemini 2.5 是该公司迄今为止对 OpenAI o 系列模型最强劲的竞争对手。

Google并未透露 Gemini 2.5 Pro 的 API 定价。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
郭正亮:毛选第四卷令我惊讶,毛主席的判断几乎跟后来的历史吻合

郭正亮:毛选第四卷令我惊讶,毛主席的判断几乎跟后来的历史吻合

浩渺青史
2026-05-24 17:21:27
上海水果摊老板免费送杨梅,一上午送出5000斤!“烂在树上很可惜,都有检测证书的”

上海水果摊老板免费送杨梅,一上午送出5000斤!“烂在树上很可惜,都有检测证书的”

大风新闻
2026-05-24 11:19:04
借账户炒股19年,不赚反亏476万!财达证券从业人员迟伟收25万元罚单

借账户炒股19年,不赚反亏476万!财达证券从业人员迟伟收25万元罚单

红星新闻
2026-05-24 13:54:45
武契奇刚下飞机就去长城了 在纪念品商店买买买

武契奇刚下飞机就去长城了 在纪念品商店买买买

看看新闻Knews
2026-05-24 21:47:25
乌克兰收复400平方公里领土,俄军星链终端被定向断网,指挥系统瘫痪

乌克兰收复400平方公里领土,俄军星链终端被定向断网,指挥系统瘫痪

爆角追踪
2026-05-24 17:27:23
中超形势:蓉城仍10分领跑 3豪门同分+跌至下半区,下轮3场焦点战

中超形势:蓉城仍10分领跑 3豪门同分+跌至下半区,下轮3场焦点战

我爱英超
2026-05-24 22:06:25
3-2爆冷!黄博文率领西海岸队狂飙:4轮拿8分,完胜郑智

3-2爆冷!黄博文率领西海岸队狂飙:4轮拿8分,完胜郑智

何老师呀
2026-05-24 21:20:26
一单封神!滴滴司机跑完三千多公里大单,同行:笑着去,哭着回?

一单封神!滴滴司机跑完三千多公里大单,同行:笑着去,哭着回?

用车指南
2026-05-24 10:00:45
武契奇抵京:这无疑是我政治生涯中最重要的一次访问

武契奇抵京:这无疑是我政治生涯中最重要的一次访问

政知新媒体
2026-05-24 15:33:48
杨梅产业崩盘真相:不是泡药毁了市场,而是消费者终于看透了底牌

杨梅产业崩盘真相:不是泡药毁了市场,而是消费者终于看透了底牌

奇思妙想草叶君
2026-05-24 13:15:32
官方通报“都溪林场家属小区马匹受惊致一女童死亡”

官方通报“都溪林场家属小区马匹受惊致一女童死亡”

界面新闻
2026-05-24 22:33:16
江苏常熟一仓库发生火灾,系隆力奇产品仓库,工作人员:火灾为晚间发生,未造成人员伤亡,经济损失暂无统计报告

江苏常熟一仓库发生火灾,系隆力奇产品仓库,工作人员:火灾为晚间发生,未造成人员伤亡,经济损失暂无统计报告

台州交通广播
2026-05-24 17:51:29
巴奴火锅北京悠唐店致歉!顾客排队到凌晨4点仍未能用餐?补偿:300元储值卡

巴奴火锅北京悠唐店致歉!顾客排队到凌晨4点仍未能用餐?补偿:300元储值卡

北京商报
2026-05-24 12:02:36
暴雨黄色预警!江南江汉江淮黄淮等地警惕强降雨可能引发次生灾害

暴雨黄色预警!江南江汉江淮黄淮等地警惕强降雨可能引发次生灾害

环球网资讯
2026-05-24 08:56:09
科学证实:女人真正着迷的,不是身高和肌肉

科学证实:女人真正着迷的,不是身高和肌肉

月亮打烊了发
2026-05-24 00:20:54
山西发生中毒事件已致1死5伤

山西发生中毒事件已致1死5伤

中国能源网
2026-05-24 00:40:10
大陆首位!国家杰青、211校长,当选终身院士

大陆首位!国家杰青、211校长,当选终身院士

新浪财经
2026-05-24 22:16:24
工人坠亡赔偿约100万,因瞒报等被罚175万,老板抵押父亲房产证贷款缴罚金5年后被发现,不服处罚起诉被驳回

工人坠亡赔偿约100万,因瞒报等被罚175万,老板抵押父亲房产证贷款缴罚金5年后被发现,不服处罚起诉被驳回

大风新闻
2026-05-24 17:34:04
快讯!美国的大门已经彻底关上了!

快讯!美国的大门已经彻底关上了!

达文西看世界
2026-05-24 08:43:14
为何日本面积那么小,还能住下1.24亿人,且家家都是独栋?

为何日本面积那么小,还能住下1.24亿人,且家家都是独栋?

抽象派大师
2026-05-22 16:51:49
2026-05-24 23:40:49
cnBeta.COM incentive-icons
cnBeta.COM
提供IT行业即时资讯
68183文章数 70201关注度
往期回顾 全部

科技要闻

我戴着摄像头上班,正在帮AI抢走我饭碗

头条要闻

山西矿难遇难者家属:父亲年过半百 我们一直劝他别干了

头条要闻

山西矿难遇难者家属:父亲年过半百 我们一直劝他别干了

体育要闻

唐斯发牌,大头逆袭:骑士跌向残忍夏季

娱乐要闻

王鹤棣掉粉超20万!代言和作品遭抵制

财经要闻

什么情况下,本轮AI大行情会结束?

汽车要闻

国民家轿再上新 帝豪向上系列限时5.59万起

态度原创

数码
旅游
时尚
手机
公开课

数码要闻

618游戏本怎么选?ROG魔霸新锐2026来袭,福利秒杀让战力飞

旅游要闻

漫步黄山脚下 邂逅茶香与绿野风光(组图)

《低智商犯罪》一半惊喜,一半可惜

手机要闻

为什么建议大家赶紧换新机?五点原因,望周知!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版