网易首页 > 网易号 > 正文 申请入驻

Gemini 2.5 Pro 问世:提供更强大的性能和更出色的体验

0
分享至

继几个月前发布首个 Gemini 2.0 AI 模型后,Google 又推出了全新升级。该公司称新的 Gemini 2.5 Pro Experimental 是其"最智能"的模型,具有超大的上下文窗口、多模态能力和推理能力。Google 展示了一系列基准测试,显示新版 Gemini 远超其他大语言模型 (LLM),我们的测试也证实了这一点——Gemini 2.5 Pro 是我们见过的最令人印象深刻的生成式 AI 模型之一。

与 Google 未来所有的模型一样,Gemini 2.5 内置推理功能。AI 在生成输出的过程中会对自身进行事实核查。我们称之为"模拟推理",因为目前没有证据表明这个过程类似于人类推理。不过,这确实能大幅提升 LLM 的输出质量。Google 特别提到模型的"主动性"编程能力得益于这一过程。例如,Gemini 2.5 Pro Experimental 可以通过单个提示生成一个完整的可运行视频游戏。我们已经测试过这个功能,在公开版本中确实可用。

Google 对 Gemini 2.5 Pro 做出了诸多描述:更智能、更懂上下文、会思考—但很难量化生成式 AI 机器人的提升程度。不过,有一些明显的技术优势。Gemini 2.5 Pro 具有 100 万 token 的上下文窗口,这对 Gemini 大模型来说很常见,但相比 OpenAI GPT 或 Anthropic Claude 等竞争模型要大得多。你可以在单个提示中向 Gemini 2.5 Pro 输入多本很长的书,输出最多可达 64,000 个 token。这与 Flash 2.0 相同,但与其他 LLM 相比仍然是相当大的 token 数量。

当然,Google 已经对 Gemini 2.5 Experimental 进行了一系列基准测试,结果略高于其他 AI 系统。例如,在衡量 AI 回答科学和数学复杂问题能力的 GPQA 和 AIME 2025 测试中,它略胜于 OpenAI 的 o3-mini。在由领域专家策划的 3,000 个问题组成的"人类最后考试"基准测试中,它也创造了新纪录,Google 新 AI 的得分为 18.8%,而 OpenAI 为 14%。

这些试图客观衡量 AI 能力的方法效果如何还不清楚。有时,主观评估可能更有帮助——可以称之为"氛围评分"。Google 的新 AI 已经位居 LMSYS Chatbot 竞技场排行榜榜首,这是一个值得注意的成就。这表明用户普遍更喜欢 Gemini 2.5 Pro Experimental 的输出,而不是 OpenAI o3-mini、Grok、DeepSeek 等产品的输出。

即时 AI 升级

在使用 Gemini 2.5 Pro Experimental 时,我们也感受到了良好的体验。我们向 Gemini 2.5 提出了一些复杂的任务——这些任务经常让 2.0 模型感到困惑——升级后的 AI 处理得更好。编程、数学和科学问题的表现也比之前版本的 Gemini 更好。

Google 的新专业模型速度也非常快。它仍然像其他模型一样逐个输出 token,在"推理"过程中得出答案,但整体感觉比最新的 OpenAI 和 Anthropic 模型都要快。Google 拥有大量 AI 计算资源,这里显然得到了很好的利用。这也解释了为什么像 Gemini 2.5 Pro Experimental 这样的 Gemini 模型具有如此大的上下文窗口——在这种情况下,大约是 o3-mini 输入限制的五倍。而这仅仅是开始,Google 表示上下文窗口很快将增加到 200 万个 token。

几个月前发布时,Google 的 2.0 Pro 模型看起来相当令人印象深刻,但那个 AI 已经成为过去。Google 表示,Gemini 2.5 Pro 是 2.0 的直接替代品,拥有 Gemini Advanced 订阅 (每月 20 美元) 的用户都可以在 Google 的各种产品中使用它。新模型现在已在移动应用程序和网页上可用,也可以在 Google 的 AI Studio 中使用。它很快也将在 Vertex AI 中推出。

Google 尚未公布 Gemini 2.5 Pro Experimental 的 API 定价,但目前你能用它做的事情也不多。Google 设置了与旧实验模型相同的每日 50 条消息限制,目前是免费的。不过这种情况将会改变。Google 的 Logan Kilpatrick 在 X (前 Twitter) 上表示,2.5 Pro Experimental 将是第一个具有更高 API 限制和定价的实验模型。具体细节将在稍后公布。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
55岁李菁菁现状曝光:京郊务农每月注射,前夫在她治疗时直播分手

55岁李菁菁现状曝光:京郊务农每月注射,前夫在她治疗时直播分手

做一个合格的吃瓜群众
2026-07-04 18:53:25
奇才交易艾顿,道金斯的第三次低价抄底

奇才交易艾顿,道金斯的第三次低价抄底

快乐加载中21
2026-07-05 00:04:53
母亲住院三十六天,妻子一次都没来探望,我坦然接受现状。二十八天后,妻子发来消息

母亲住院三十六天,妻子一次都没来探望,我坦然接受现状。二十八天后,妻子发来消息

王二哥老搞笑
2026-07-04 18:47:23
突然宣布!王玉雯工作室发声事情反转,终究为年少轻狂付出了代价

突然宣布!王玉雯工作室发声事情反转,终究为年少轻狂付出了代价

余鴡搞笑段子
2026-07-03 22:09:15
1958年,李锐问毛主席:您在农村长大,相信一亩地产几万斤粮食?

1958年,李锐问毛主席:您在农村长大,相信一亩地产几万斤粮食?

文史季季红
2026-07-04 10:15:03
保险卖不动了,700万人集体离场。

保险卖不动了,700万人集体离场。

流苏晚晴
2026-07-04 18:54:07
心理学:一个家庭长期没饭局,不串门、不社交,就已经说明了两个现实,很准

心理学:一个家庭长期没饭局,不串门、不社交,就已经说明了两个现实,很准

心理观察局
2026-07-02 06:05:10
财政部回复:搭乘他人顺风车或者自驾车(费用由出差人自己承担)前往,市内交通补助该如何报销?

财政部回复:搭乘他人顺风车或者自驾车(费用由出差人自己承担)前往,市内交通补助该如何报销?

新理财杂志
2026-07-03 19:20:21
38.2万元!一尾号1111111手机号被成功拍卖:归属地为四川绵阳,过户后无最低消费

38.2万元!一尾号1111111手机号被成功拍卖:归属地为四川绵阳,过户后无最低消费

红星新闻
2026-07-03 13:07:31
破案了!洪明甫这些年不是看不上孙兴慜,是压根没正眼瞧过他

破案了!洪明甫这些年不是看不上孙兴慜,是压根没正眼瞧过他

莫地方
2026-07-04 00:05:15
国家在江门布下惊天大局,江门真正的王牌正在悄悄崛起

国家在江门布下惊天大局,江门真正的王牌正在悄悄崛起

三农老历
2026-07-04 14:45:03
基努·里维斯在飞机上看的烂片,把主演自己都看崩溃了

基努·里维斯在飞机上看的烂片,把主演自己都看崩溃了

峡谷一级保护废物
2026-07-02 19:47:14
佛得角:最不像非洲的非洲国家

佛得角:最不像非洲的非洲国家

舆图司马
2026-07-02 21:05:03
饮料含甜蜜素被美国“预警进口”!娃哈哈:经销商私自出口

饮料含甜蜜素被美国“预警进口”!娃哈哈:经销商私自出口

南方都市报
2026-07-03 17:22:32
哈梅葬礼暗藏杀机?中俄高层出席不止吊唁,或能镇住美以斩首阴谋

哈梅葬礼暗藏杀机?中俄高层出席不止吊唁,或能镇住美以斩首阴谋

快看张同学
2026-07-04 09:51:49
涨涨涨!一夜全线飘红,全球市场风向彻底反转

涨涨涨!一夜全线飘红,全球市场风向彻底反转

魏家东
2026-07-04 13:42:19
《百年孤独》:你给子女搭的每一座桥都是多余,你替爹娘扛的每一座山都是没用的,亲情里最凉的孤单,是你操碎了心他们却各活各的命

《百年孤独》:你给子女搭的每一座桥都是多余,你替爹娘扛的每一座山都是没用的,亲情里最凉的孤单,是你操碎了心他们却各活各的命

心理观察局
2026-06-30 06:43:12
小杨的好兄弟,Shams:开拓者后卫乐福与76人签下双向合同

小杨的好兄弟,Shams:开拓者后卫乐福与76人签下双向合同

懂球帝
2026-07-04 15:50:37
金融男的三件套,变了

金融男的三件套,变了

叫我娱乐菌
2026-03-30 19:35:53
1983年,陈云亲自批示:立即枪毙广东县委书记王仲,原因为何?

1983年,陈云亲自批示:立即枪毙广东县委书记王仲,原因为何?

大运河时空
2026-07-03 08:50:03
2026-07-05 00:52:49
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
19861文章数 49713关注度
往期回顾 全部

数码要闻

热搜第一!到底是谁带头取消了有线耳机 网友:耳机线才是灵魂

头条要闻

老人被一次拔12颗牙种10颗:能刷的钱都刷走 只剩30块

头条要闻

老人被一次拔12颗牙种10颗:能刷的钱都刷走 只剩30块

体育要闻

揭法国锋线最大优势 有人比姆巴佩还快?

娱乐要闻

白鹿打戏抠图惹非议 连累丞磊遭扒皮

财经要闻

韩国股市杠杆失控:450亿美元资金狂飙

科技要闻

韬定律论文V2版,充工程细节和实测数据

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

时尚
旅游
房产
数码
军事航空

别再说"露肩衣服 "难驾驭!看看这几组日常穿搭,大方有回头率

旅游要闻

聊城市旅行社协会成立凝聚行业合力共促水城文旅高质量发展

房产要闻

总裁空缺17个月、现金缺口超1000亿:金融局“局外人”入局万科

数码要闻

苏姿丰签名同款!极摩客EVO-X3 AI工作站全球开卖:国行版21699元起

军事要闻

普京宣布俄军“完全解放”卢甘斯克

无障碍浏览 进入关怀版