网易首页 > 网易号 > 正文 申请入驻

Google推出下一代人工智能推理模型Gemini 2.5

0
分享至

周二,Google发布了 Gemini 2.5,这是一系列新的人工智能推理模型,可以在回答问题之前停下来“思考”。为了启动新模型系列,Google推出了 Gemini 2.5 Pro Experimental,这是一款多模式推理 AI 模型,该公司声称这是迄今为止最智能的模型。

该模型将于周二在公司的开发者平台 Google AI Studio 以及 Gemini 应用程序中推出,供该公司每月 20 美元的 AI 计划 Gemini Advanced 的订阅者使用。

展望未来,Google表示其所有新人工智能模型都将具备推理能力。

自 OpenAI于 2024 年 9 月推出首个 AI 推理模型以来,科技行业一直在竞相用自己的模型来匹敌或超越该模型的能力。如今,Anthropic、DeepSeek、Google 和 xAI 都拥有 AI 推理模型,这些模型利用额外的计算能力和时间来核实事实并推理问题,然后再给出答案。

推理技术帮助人工智能模型在数学和编码任务上取得了新的高度。科技界的许多人认为推理模型将成为人工智能代理的关键组成部分,人工智能代理是可以执行基本无需人工干预的任务的自主系统。然而,这些模型也更昂贵。

Google声称,Gemini 2.5 Pro 在多个基准测试中的表现均优于其之前的前沿 AI 模型以及一些领先的 AI 竞争模型。具体来说,Google表示,Gemini 2.5 的设计初衷是打造出视觉效果出众的 Web 应用和代理编码应用程序。

在一项名为 Aider Polyglot 的代码编辑评估中,Google表示 Gemini 2.5 Pro 的得分为 68.6%,超过了 OpenAI、Anthropic 和中国人工智能实验室 DeepSeek 的顶尖人工智能模型。

然而,在另一项衡量软件开发能力的测试 SWE-bench Verified 中,Gemini 2.5 Pro 的得分为 63.8%,优于 OpenAI 的 o3-mini 和 DeepSeek 的 R1,但低于 Anthropic 的 Claude 3.7 Sonnet,后者的得分为 70.3%。

在著名的“人类的最后考试”中的一项包括数千道数学、人文和自然科学众包问题的多模式测试——Google表示,Gemini 2.5 Pro 的得分为 18.8%,优于 OpenAI、Anthropic 和 DeepSeek 的领先 AI 模型。

首先,Google表示 Gemini 2.5 Pro 配备了 100 万个 token 上下文窗口,这意味着 AI 模型可以在一个提示中吸收大约 75 万个单词。这比整个《指环王》系列丛书还要长。不过,Google表示,200 万个 token 上下文窗口即将推出。

Google之前曾尝试过人工智能推理模型——此前曾于 12 月发布过 Gemini 的“思考”版本——但 Gemini 2.5 是该公司迄今为止对 OpenAI o 系列模型最强劲的竞争对手。

Google并未透露 Gemini 2.5 Pro 的 API 定价。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
韩媒:韩国冰联轻率处罚导致林孝埈换国籍 曾有女队友大胆为他作证

韩媒:韩国冰联轻率处罚导致林孝埈换国籍 曾有女队友大胆为他作证

劲爆体坛
2026-02-20 09:26:02
斯诺克比赛结果:6-3晋级4强,赵心童大满贯出局

斯诺克比赛结果:6-3晋级4强,赵心童大满贯出局

墨史轩
2026-02-20 06:22:06
第一集就要打码,这部新剧太生猛了

第一集就要打码,这部新剧太生猛了

来看美剧
2026-02-20 21:32:52
断供来了,斯洛伐克真扛不住了,接下来咋办?

断供来了,斯洛伐克真扛不住了,接下来咋办?

奇思妙想生活家
2026-02-20 06:04:47
林徽因落选的国徽方案,网友看后感叹:审美确实一绝,但真不合适

林徽因落选的国徽方案,网友看后感叹:审美确实一绝,但真不合适

抽象派大师
2026-01-03 02:13:54
贝克汉姆坚持儿子离婚,16亿婚前协议导致和解困难

贝克汉姆坚持儿子离婚,16亿婚前协议导致和解困难

君笙的拂兮
2026-01-26 15:51:34
剑桥科技(06166.HK)尾盘跌超6% 股价创上市新低

剑桥科技(06166.HK)尾盘跌超6% 股价创上市新低

每日经济新闻
2026-02-20 15:54:08
德媒:德国总理的北京之行非常的棘手,德国不能接受中国主导

德媒:德国总理的北京之行非常的棘手,德国不能接受中国主导

我心纵横天地间
2026-02-20 21:43:22
他是"乒乓神童",关键时刻狠心拒绝国外优厚待遇,执意只为回中国

他是"乒乓神童",关键时刻狠心拒绝国外优厚待遇,执意只为回中国

以茶带书
2026-02-20 23:41:44
国行 iPhone,开启 AI 设置界面!

国行 iPhone,开启 AI 设置界面!

花果科技
2026-02-19 22:00:48
春节档破35亿!《飞驰人生3》领跑,《镖人》逆袭至单日票房第2

春节档破35亿!《飞驰人生3》领跑,《镖人》逆袭至单日票房第2

露珠聊影视
2026-02-20 20:48:55
特朗普回应奥巴马涉外星人言论:我不知道是否真实存在,但奥巴马肯定泄密了

特朗普回应奥巴马涉外星人言论:我不知道是否真实存在,但奥巴马肯定泄密了

环球网资讯
2026-02-20 09:26:07
年初二,53岁董卿回江苏亲戚家吃饭,穿3千元马甲,皮肤白气质好

年初二,53岁董卿回江苏亲戚家吃饭,穿3千元马甲,皮肤白气质好

天天热点见闻
2026-02-19 06:31:51
纽约市长不但免费之说食言,还要加税

纽约市长不但免费之说食言,还要加税

移光幻影
2026-02-20 20:55:17
盐城“415大案”主犯,到底有多残忍?审判后旁听群众:应判凌迟

盐城“415大案”主犯,到底有多残忍?审判后旁听群众:应判凌迟

谈史论天地
2026-02-03 06:05:28
法国专家:中国电力已经让世界畏惧!为何中国人自己却浑然不知?

法国专家:中国电力已经让世界畏惧!为何中国人自己却浑然不知?

行者聊官
2026-01-23 09:26:28
42岁霍启山和“妲己”娜然携手出游,家族默认儿媳,细节太戳人

42岁霍启山和“妲己”娜然携手出游,家族默认儿媳,细节太戳人

独步天涯
2026-02-20 15:42:10
调兵遣将一个月后,美军转过头一看,一支中国海军舰队现身阿曼湾

调兵遣将一个月后,美军转过头一看,一支中国海军舰队现身阿曼湾

锋芒点兵
2026-02-16 10:25:31
中国终止越南核电站合作,十年投入成泡影,日本计划落空

中国终止越南核电站合作,十年投入成泡影,日本计划落空

聚焦真实瞬间
2026-01-21 08:04:16
看了观众对陈丽君电影首秀的评价,何赛飞的话,终于有人信了!

看了观众对陈丽君电影首秀的评价,何赛飞的话,终于有人信了!

听风喃
2026-02-20 19:08:34
2026-02-21 01:40:49
cnBeta.COM incentive-icons
cnBeta.COM
提供IT行业即时资讯
66653文章数 70097关注度
往期回顾 全部

科技要闻

莫迪举手欢呼 两大AI掌门人却握拳尴尬对峙

头条要闻

贝加尔湖遇难者遗体已被发现 涉事司机系私下接单

头条要闻

贝加尔湖遇难者遗体已被发现 涉事司机系私下接单

体育要闻

金牌夫妻!王心迪徐梦桃赛后拥抱太甜了

娱乐要闻

《将门独后》开拍,王鹤棣孟子义主演

财经要闻

特朗普全球关税被推翻!有何影响?

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

教育
房产
手机
本地
公开课

教育要闻

出炉,2026考研初试成绩查询!

房产要闻

春节三亚楼市再放大招!千亿巨头,重磅推出超性价比海景现房

手机要闻

春节后影像机皇之争:OPPO Find X9 Ultra与vivo X300 Ultra规格曝光

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版