Gemini 2.5家族上新！不仅有更稳的Pro版，还带来了史上最快最省的Lite版|lite|谷歌|flash|gemini

Gemini 2.5家族上新！不仅有更稳的Pro版，还带来了史上最快最省的Lite版

2025-06-18 07:43:33　来源: 网易科技报道

北京举报

分享至

核心提示

01 谷歌正式发布了Gemini 2.5 Pro和2.5 Flash的稳定版本，并全面开放使用。同时还推出了全新的预览版模型——Gemini 2.5 Flash-Lite，这是迄今为止成本效益最高、速度最快的2.5模型。
02 2.5 Pro和Flash稳定版的推出，旨在帮助开发者安心构建生产级应用。新增的2.5 Flash-Lite预览版，则在代码、数学、推理等多项基准测试中优于2.0版本，尤其适合翻译、分类等高并发、对延迟敏感的任务。
03 同时，谷歌调整了2.5 Flash的定价结构，旨在解决此前“思考”与“非思考”两档定价给开发者带来的困惑。

6月18日消息，谷歌周二宣布对其Gemini 2.5模型家族进行更新。根据公告，Gemini 2.5 Pro和Gemini 2.5 Flash模型已进入稳定版本并全面开放使用。同时，该公司还发布了一款新的预览版模型——Gemini 2.5 Flash-Lite，并调整了2.5 Flash模型的定价结构。

主要更新情况

Gemini 2.5 Flash-Lite (预览版)

定位：该系列中“延迟最低、成本最低”的模型，被描述为对1.5及2.0版本Flash模型的经济型升级。尤其适合大规模分类、摘要等高吞吐量任务。

功能：具备“思考”能力，但与其他模型不同，该功能默认关闭以优化成本和速度，可通过API参数启用。

Gemini 2.5 Flash (稳定版)

状态：现已进入稳定版本，与05-20预览版一致。

定价调整：

输入成本从每百万Tokens 0.15美元上调至0.30美元。

输出成本从每百万Tokens 3.50美元下调至2.50美元。

取消了“思考”与“非思考”的两档价格区分，采用统一价格。

兼容性：该公司称，尽管进行了价格调整，该模型依然提供业内最优的“智能成本比”。

Gemini 2.5 Pro (稳定版)

状态：现已进入稳定版本，与06-05预览版一致。

应用情况：据称其增长和需求强劲，已成为众多主流开发者工具的核心引擎，包括Cursor、Bolt、GitHub、Replit和Zed Industries等。

以下是谷歌两篇公告全文：

【我们正在扩展Gemini 2.5模型家族】

我们设计Gemini 2.5，旨在打造一系列混合推理模型（hybrid reasoning model），不仅具备卓越性能，还能在成本与速度之间实现帕累托最优（Pareto Frontier）。今天，我们正式发布2.5 Pro和2.5 Flash这两款稳定版本，并全面开放使用。同时，我们还带来了全新预览版——2.5 Flash-Lite，这是迄今为止成本效益最高、速度最快的2.5模型。
2.5 Flash和2.5 Pro全面开放
感谢大家的反馈，2.5 Flash与Pro现已推出稳定版，助力你们安心构建生产级应用。像Spline和Rooms这样的开发者，以及Snap和SmartBear等企业，过去几周已经在生产环境中使用了这些最新版本。
全新Gemini 2.5 Flash-Lite预览版
我们还同步推出了Gemini 2.5 Flash-Lite的预览版。这是我们目前成本效益最高、速度最快的2.5模型。你现在就可以开始基于该预览版进行开发，期待收到你的反馈。
2.5 Flash-Lite在代码、数学、科学、推理和多模态基准测试中，整体质量优于2.0 Flash-Lite。它在翻译、分类等高并发、对延迟敏感的任务上表现尤为出色。相比2.0 Flash-Lite和2.0 Flash，在大样本测试中延迟更低。该模型还具备Gemini 2.5系列的全部核心能力，包括可按不同预算灵活调用的推理能力、与Google搜索及代码执行等工具的连接、多模态输入，以及100万token的上下文长度。
更多关于Gemini 2.5系列模型的详细信息，请参见最新Gemini技术报告。

图：Gemini 2.5 Flash-Lite基准测试表
Gemini 2.5 Flash-Lite预览版现已在Google AI Studio和Vertex AI上线，可与2.5 Flash和Pro的稳定版一同使用。2.5 Flash和Pro也可通过Gemini应用访问。我们还为搜索引擎带来了定制版的2.5 Flash-Lite和Flash。
我们非常期待看到你们基于Gemini 2.5持续创造的成果。

【Gemini 2.5：思考型模型家族的最新进展】

今天，我们非常高兴为大家带来Gemini 2.5模型家族的全线更新内容：

Gemini 2.5 Pro现已全面上线并进入稳定版本（与06-05预览版一致，无变动）；

Gemini 2.5 Flash现已全面上线并进入稳定版本（与05-20预览版一致，无变动，定价调整见下文）；

Gemini 2.5 Flash-Lite现已开放预览版。

Gemini 2.5系列为“思考型模型（thinking model）”，能够在生成回复前自主推理思考，从而提升性能与准确性。每款模型都可灵活设置“思考预算（thinking budget）”，开发者可根据需求决定模型在生成回复前“思考”的时机与强度。

图：Gemini 2.5思考型模型家族概览
全新Gemini 2.5 Flash-Lite预览版
我们今天推出了2.5 Flash-Lite预览版，这是2.5系列中延迟最低、成本最低的模型。它面向对成本敏感的场景，是对1.5及2.0版本Flash模型的经济型升级。2.5 Flash-Lite在多数评测中表现更优，首token响应更快，解码速度（每秒生成token数）也显著提升。该模型尤其适合大规模分类、摘要等高吞吐量任务。
2.5 Flash-Lite同样是一款推理模型，允许通过API参数动态调控“思考预算”。由于Flash-Lite对成本和速度进行了优化，与其他模型不同，“思考”功能默认为关闭。2.5 Flash-Lite还支持所有原生工具，包括基于Google搜索的事实校验（Grounding）、代码执行、URL上下文及函数调用等功能。

图：Gemini 2.5 Flash-Lite基准测试
Gemini 2.5 Flash及定价调整
过去一年，我们的研究团队在Flash模型系列上持续推进帕累托前沿（Pareto Frontier）。2.5 Flash最初发布时，2.5 Flash-Lite的能力尚未最终确定。我们当时还采用了“思考”与“非思考”两档定价，导致开发者产生困惑。
随着Gemini 2.5 Flash稳定版上线（即Google I/O期间提供的05-20预览版），并凭借2.5 Flash的卓越性能，我们对2.5 Flash定价进行了如下调整：

输入：0.30美元/百万tokens（从0.15美元上调）

输出：2.50美元/百万tokens（从3.50美元下调）

取消了“思考”与“非思考”两档价格的区分

无论输入token数量多少，均采用统一价格档位

我们始终努力在预览版与稳定版间保持价格一致，以减少用户迁移成本。本次调整是针对Flash模型出色性价比的特殊优化，依然提供业内最优的“智能成本比”。
有了Gemini 2.5 Flash-Lite，无论是否开启“思考”功能，我们都能为对成本和延迟极为敏感、对模型智能要求相对较低的场景，提供更低价的选择。

图：Gemini Flash系列定价更新
若你仍在使用Gemini 2.5 Flash Preview 04-17，原有预览定价将持续有效，直至该模型于2025年7月15日下线。届时，该模型终端将关闭。你可迁移至正式版“gemini-2.5-flash”，或选择2.5 Flash-Lite预览版作为更经济的替代方案。
Gemini 2.5 Pro持续增长
Gemini 2.5 Pro的增长和需求强劲，远超我们以往任何一款模型。为了让更多客户能够在生产环境中使用这款模型，我们将06-05版本定为稳定版，并延续此前的帕累托最优定价。
在对智能和能力要求最高的场景，如代码生成、智能体任务等，Pro的优势尤为突出。Gemini 2.5 Pro已成为众多主流开发者工具的核心引擎。

图：主流开发者工具已集成Gemini 2.5 Pro，包括Cursor、Bolt、Cline、Cognition、Windsurf、GitHub、Lovable、Replit和Zed Industries等
如果你正在使用2.5 Pro Preview 05-06，该模型将持续可用至2025年6月19日，届时将被关闭。若你已在使用2.5 Pro Preview 06-05，仅需将模型字符串更新为“gemini-2.5-pro”即可。
我们期待2.5 Pro的智能能力惠及更多行业场景，并将在不久的将来分享更多Pro系列扩展的最新进展。