网易首页 > 网易号 > 正文 申请入驻

Gemini 2.5 Pro 问世:提供更强大的性能和更出色的体验

0
分享至

继几个月前发布首个 Gemini 2.0 AI 模型后,Google 又推出了全新升级。该公司称新的 Gemini 2.5 Pro Experimental 是其"最智能"的模型,具有超大的上下文窗口、多模态能力和推理能力。Google 展示了一系列基准测试,显示新版 Gemini 远超其他大语言模型 (LLM),我们的测试也证实了这一点——Gemini 2.5 Pro 是我们见过的最令人印象深刻的生成式 AI 模型之一。

与 Google 未来所有的模型一样,Gemini 2.5 内置推理功能。AI 在生成输出的过程中会对自身进行事实核查。我们称之为"模拟推理",因为目前没有证据表明这个过程类似于人类推理。不过,这确实能大幅提升 LLM 的输出质量。Google 特别提到模型的"主动性"编程能力得益于这一过程。例如,Gemini 2.5 Pro Experimental 可以通过单个提示生成一个完整的可运行视频游戏。我们已经测试过这个功能,在公开版本中确实可用。

Google 对 Gemini 2.5 Pro 做出了诸多描述:更智能、更懂上下文、会思考—但很难量化生成式 AI 机器人的提升程度。不过,有一些明显的技术优势。Gemini 2.5 Pro 具有 100 万 token 的上下文窗口,这对 Gemini 大模型来说很常见,但相比 OpenAI GPT 或 Anthropic Claude 等竞争模型要大得多。你可以在单个提示中向 Gemini 2.5 Pro 输入多本很长的书,输出最多可达 64,000 个 token。这与 Flash 2.0 相同,但与其他 LLM 相比仍然是相当大的 token 数量。

当然,Google 已经对 Gemini 2.5 Experimental 进行了一系列基准测试,结果略高于其他 AI 系统。例如,在衡量 AI 回答科学和数学复杂问题能力的 GPQA 和 AIME 2025 测试中,它略胜于 OpenAI 的 o3-mini。在由领域专家策划的 3,000 个问题组成的"人类最后考试"基准测试中,它也创造了新纪录,Google 新 AI 的得分为 18.8%,而 OpenAI 为 14%。

这些试图客观衡量 AI 能力的方法效果如何还不清楚。有时,主观评估可能更有帮助——可以称之为"氛围评分"。Google 的新 AI 已经位居 LMSYS Chatbot 竞技场排行榜榜首,这是一个值得注意的成就。这表明用户普遍更喜欢 Gemini 2.5 Pro Experimental 的输出,而不是 OpenAI o3-mini、Grok、DeepSeek 等产品的输出。

即时 AI 升级

在使用 Gemini 2.5 Pro Experimental 时,我们也感受到了良好的体验。我们向 Gemini 2.5 提出了一些复杂的任务——这些任务经常让 2.0 模型感到困惑——升级后的 AI 处理得更好。编程、数学和科学问题的表现也比之前版本的 Gemini 更好。

Google 的新专业模型速度也非常快。它仍然像其他模型一样逐个输出 token,在"推理"过程中得出答案,但整体感觉比最新的 OpenAI 和 Anthropic 模型都要快。Google 拥有大量 AI 计算资源,这里显然得到了很好的利用。这也解释了为什么像 Gemini 2.5 Pro Experimental 这样的 Gemini 模型具有如此大的上下文窗口——在这种情况下,大约是 o3-mini 输入限制的五倍。而这仅仅是开始,Google 表示上下文窗口很快将增加到 200 万个 token。

几个月前发布时,Google 的 2.0 Pro 模型看起来相当令人印象深刻,但那个 AI 已经成为过去。Google 表示,Gemini 2.5 Pro 是 2.0 的直接替代品,拥有 Gemini Advanced 订阅 (每月 20 美元) 的用户都可以在 Google 的各种产品中使用它。新模型现在已在移动应用程序和网页上可用,也可以在 Google 的 AI Studio 中使用。它很快也将在 Vertex AI 中推出。

Google 尚未公布 Gemini 2.5 Pro Experimental 的 API 定价,但目前你能用它做的事情也不多。Google 设置了与旧实验模型相同的每日 50 条消息限制,目前是免费的。不过这种情况将会改变。Google 的 Logan Kilpatrick 在 X (前 Twitter) 上表示,2.5 Pro Experimental 将是第一个具有更高 API 限制和定价的实验模型。具体细节将在稍后公布。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“你不跑有的是人跑”,网约车内卷严重,多名司机请求规范运价,交通局回复了!

“你不跑有的是人跑”,网约车内卷严重,多名司机请求规范运价,交通局回复了!

网约车观察室
2026-05-31 09:57:38
如果“落后就要挨打”,哪来“强大就遭打压”?

如果“落后就要挨打”,哪来“强大就遭打压”?

山间听雨
2026-06-01 11:15:32
美方得寸进尺:只要总部在中国,都不准买

美方得寸进尺:只要总部在中国,都不准买

观察者网
2026-06-01 09:15:20
87分钟绝杀欧洲队!日本剑指世界杯8强,韩国5-0狂胜,孙兴慜双响

87分钟绝杀欧洲队!日本剑指世界杯8强,韩国5-0狂胜,孙兴慜双响

小徐讲八卦
2026-06-01 05:24:49
史上最和谐的皇室兄弟:哥哥将皇位让给弟弟,弟弟追封哥哥为皇帝

史上最和谐的皇室兄弟:哥哥将皇位让给弟弟,弟弟追封哥哥为皇帝

鹤羽说个事
2026-05-30 23:07:30
巴萨回应马竞嘲讽:一亿欧元报价确实发了

巴萨回应马竞嘲讽:一亿欧元报价确实发了

乐道足球C
2026-06-01 10:07:02
300万留学换纪念杯!清华大学博导晒出儿子美国天价留学,引热议

300万留学换纪念杯!清华大学博导晒出儿子美国天价留学,引热议

火山詩话
2026-06-01 06:20:46
59岁何音近况曝光!与黄志忠离婚后嫁小9岁许云帆,活成人生赢家

59岁何音近况曝光!与黄志忠离婚后嫁小9岁许云帆,活成人生赢家

代军哥哥谈娱乐
2026-05-31 09:47:07
杀人诛心!巴黎老板霸气发声:甩掉姆巴佩,球队才成为顶级豪门!

杀人诛心!巴黎老板霸气发声:甩掉姆巴佩,球队才成为顶级豪门!

田先生篮球
2026-05-31 10:22:15
破案!全场9次摊手,王博却不敢骂孙总原因找到,浙迷说出大实话

破案!全场9次摊手,王博却不敢骂孙总原因找到,浙迷说出大实话

后仰大风车
2026-06-01 08:15:12
徐州女幼师用热熔枪连烫两次孩子嘴唇!多名家长称早发现孩子有伤

徐州女幼师用热熔枪连烫两次孩子嘴唇!多名家长称早发现孩子有伤

听心堂
2026-05-29 21:22:08
除了俄乌战争,还有一场伤亡更大的战争已经打了两年多

除了俄乌战争,还有一场伤亡更大的战争已经打了两年多

商业模式桑博士
2026-05-29 07:49:46
6月1日重启,新天涯社区将发售9999份创世成员服务包,售价1999元,“众筹”总额近2000万元,用于数据存续、恢复访问等

6月1日重启,新天涯社区将发售9999份创世成员服务包,售价1999元,“众筹”总额近2000万元,用于数据存续、恢复访问等

台州交通广播
2026-06-01 06:39:42
残阵上海3-0卫冕冠军! 篮球圈彻底炸锅了,苏群段冉的分析太扎心

残阵上海3-0卫冕冠军! 篮球圈彻底炸锅了,苏群段冉的分析太扎心

林子说事
2026-06-01 10:09:12
男团成员裤腰低到离谱?网友怒批:这是公共猥亵

男团成员裤腰低到离谱?网友怒批:这是公共猥亵

时光慢旅人
2026-05-30 01:29:08
消息称尊界S800成功后,华为在帮助国产供应商发展高端子品牌

消息称尊界S800成功后,华为在帮助国产供应商发展高端子品牌

IT之家
2026-05-31 12:33:24
活久见!巴萨被塞 8500 万天价水货!他已经 3 个月没踢过球了

活久见!巴萨被塞 8500 万天价水货!他已经 3 个月没踢过球了

澜归序
2026-06-01 05:27:09
刘诗诗“从此不敢见观音”!

刘诗诗“从此不敢见观音”!

八卦疯叔
2026-06-01 10:12:43
“都把儿子养雌化了!”初中男孩出现雌化现象,家长却执迷不悟

“都把儿子养雌化了!”初中男孩出现雌化现象,家长却执迷不悟

妍妍教育日记
2026-05-29 07:55:13
日韩股市续创新高 韩国综合指数涨近1.5%

日韩股市续创新高 韩国综合指数涨近1.5%

每日经济新闻
2026-06-01 08:25:12
2026-06-01 12:08:49
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
18906文章数 49707关注度
往期回顾 全部

数码要闻

Intel掌机芯片逆袭!锐炫G3 Extreme仅需一半功耗:就能追平AMD

头条要闻

牛弹琴:巴黎又乱了火光冲天 马克龙都看得目瞪口呆

头条要闻

牛弹琴:巴黎又乱了火光冲天 马克龙都看得目瞪口呆

体育要闻

哭过之后,文班亚马想给波波维奇打电话

娱乐要闻

张凌赫活动商场玻璃被挤爆5人受伤

财经要闻

网红驱蚊产品,标注化妆品竟含农药成分

科技要闻

关停三年后,天涯社区今起开放访问

汽车要闻

上市三周交付3603台!华境S跻身旗舰大六座第一梯队

态度原创

艺术
教育
房产
游戏
军事航空

艺术要闻

吴镇写竹,清清爽爽

教育要闻

打印准考证!2026山东高考|准考证打印全流程(含时间 + 入口 + 问题解答)

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

2026年实况足球8怎么下载最安全?告别捆绑病毒,上KK对战平台一键获取

军事要闻

解放军代表质问日防卫大臣:日本何时道歉

无障碍浏览 进入关怀版