网易首页 > 网易科技 > IT业界 > 正文

Gemini 2.5家族上新!不仅有更稳的Pro版,还带来了史上最快最省的Lite版

0
分享至
核心提示
  • 01 谷歌正式发布了Gemini 2.5 Pro和2.5 Flash的稳定版本,并全面开放使用。同时还推出了全新的预览版模型——Gemini 2.5 Flash-Lite,这是迄今为止成本效益最高、速度最快的2.5模型。
  • 02 2.5 Pro和Flash稳定版的推出,旨在帮助开发者安心构建生产级应用。新增的2.5 Flash-Lite预览版,则在代码、数学、推理等多项基准测试中优于2.0版本,尤其适合翻译、分类等高并发、对延迟敏感的任务。
  • 03 同时,谷歌调整了2.5 Flash的定价结构,旨在解决此前“思考”与“非思考”两档定价给开发者带来的困惑。

6月18日消息,谷歌周二宣布对其Gemini 2.5模型家族进行更新。根据公告,Gemini 2.5 Pro和Gemini 2.5 Flash模型已进入稳定版本并全面开放使用。同时,该公司还发布了一款新的预览版模型——Gemini 2.5 Flash-Lite,并调整了2.5 Flash模型的定价结构。

主要更新情况

Gemini 2.5 Flash-Lite (预览版)

定位:该系列中“延迟最低、成本最低”的模型,被描述为对1.5及2.0版本Flash模型的经济型升级。尤其适合大规模分类、摘要等高吞吐量任务。

功能:具备“思考”能力,但与其他模型不同,该功能默认关闭以优化成本和速度,可通过API参数启用。

Gemini 2.5 Flash (稳定版)

状态:现已进入稳定版本,与05-20预览版一致。

定价调整:

输入成本从每百万Tokens 0.15美元上调至0.30美元。

输出成本从每百万Tokens 3.50美元下调至2.50美元。

取消了“思考”与“非思考”的两档价格区分,采用统一价格。

兼容性:该公司称,尽管进行了价格调整,该模型依然提供业内最优的“智能成本比”。

Gemini 2.5 Pro (稳定版)

状态:现已进入稳定版本,与06-05预览版一致。

应用情况:据称其增长和需求强劲,已成为众多主流开发者工具的核心引擎,包括Cursor、Bolt、GitHub、Replit和Zed Industries等。

以下是谷歌两篇公告全文:

【我们正在扩展Gemini 2.5模型家族】

我们设计Gemini 2.5,旨在打造一系列混合推理模型(hybrid reasoning model),不仅具备卓越性能,还能在成本与速度之间实现帕累托最优(Pareto Frontier)。今天,我们正式发布2.5 Pro和2.5 Flash这两款稳定版本,并全面开放使用。同时,我们还带来了全新预览版——2.5 Flash-Lite,这是迄今为止成本效益最高、速度最快的2.5模型。

2.5 Flash和2.5 Pro全面开放

感谢大家的反馈,2.5 Flash与Pro现已推出稳定版,助力你们安心构建生产级应用。像Spline和Rooms这样的开发者,以及Snap和SmartBear等企业,过去几周已经在生产环境中使用了这些最新版本。

全新Gemini 2.5 Flash-Lite预览版

我们还同步推出了Gemini 2.5 Flash-Lite的预览版。这是我们目前成本效益最高、速度最快的2.5模型。你现在就可以开始基于该预览版进行开发,期待收到你的反馈。

2.5 Flash-Lite在代码、数学、科学、推理和多模态基准测试中,整体质量优于2.0 Flash-Lite。它在翻译、分类等高并发、对延迟敏感的任务上表现尤为出色。相比2.0 Flash-Lite和2.0 Flash,在大样本测试中延迟更低。该模型还具备Gemini 2.5系列的全部核心能力,包括可按不同预算灵活调用的推理能力、与Google搜索及代码执行等工具的连接、多模态输入,以及100万token的上下文长度。

更多关于Gemini 2.5系列模型的详细信息,请参见最新Gemini技术报告。


图:Gemini 2.5 Flash-Lite基准测试表

Gemini 2.5 Flash-Lite预览版现已在Google AI Studio和Vertex AI上线,可与2.5 Flash和Pro的稳定版一同使用。2.5 Flash和Pro也可通过Gemini应用访问。我们还为搜索引擎带来了定制版的2.5 Flash-Lite和Flash。

我们非常期待看到你们基于Gemini 2.5持续创造的成果。

【Gemini 2.5:思考型模型家族的最新进展】

今天,我们非常高兴为大家带来Gemini 2.5模型家族的全线更新内容:

  • Gemini 2.5 Pro现已全面上线并进入稳定版本(与06-05预览版一致,无变动);
  • Gemini 2.5 Flash现已全面上线并进入稳定版本(与05-20预览版一致,无变动,定价调整见下文);
  • Gemini 2.5 Flash-Lite现已开放预览版。

Gemini 2.5系列为“思考型模型(thinking model)”,能够在生成回复前自主推理思考,从而提升性能与准确性。每款模型都可灵活设置“思考预算(thinking budget)”,开发者可根据需求决定模型在生成回复前“思考”的时机与强度。

图:Gemini 2.5思考型模型家族概览

全新Gemini 2.5 Flash-Lite预览版

我们今天推出了2.5 Flash-Lite预览版,这是2.5系列中延迟最低、成本最低的模型。它面向对成本敏感的场景,是对1.5及2.0版本Flash模型的经济型升级。2.5 Flash-Lite在多数评测中表现更优,首token响应更快,解码速度(每秒生成token数)也显著提升。该模型尤其适合大规模分类、摘要等高吞吐量任务。

2.5 Flash-Lite同样是一款推理模型,允许通过API参数动态调控“思考预算”。由于Flash-Lite对成本和速度进行了优化,与其他模型不同,“思考”功能默认为关闭。2.5 Flash-Lite还支持所有原生工具,包括基于Google搜索的事实校验(Grounding)、代码执行、URL上下文及函数调用等功能。

图:Gemini 2.5 Flash-Lite基准测试

Gemini 2.5 Flash及定价调整

过去一年,我们的研究团队在Flash模型系列上持续推进帕累托前沿(Pareto Frontier)。2.5 Flash最初发布时,2.5 Flash-Lite的能力尚未最终确定。我们当时还采用了“思考”与“非思考”两档定价,导致开发者产生困惑。

随着Gemini 2.5 Flash稳定版上线(即Google I/O期间提供的05-20预览版),并凭借2.5 Flash的卓越性能,我们对2.5 Flash定价进行了如下调整:

  • 输入:0.30美元/百万tokens(从0.15美元上调)
  • 输出:2.50美元/百万tokens(从3.50美元下调)
  • 取消了“思考”与“非思考”两档价格的区分
  • 无论输入token数量多少,均采用统一价格档位

我们始终努力在预览版与稳定版间保持价格一致,以减少用户迁移成本。本次调整是针对Flash模型出色性价比的特殊优化,依然提供业内最优的“智能成本比”。

有了Gemini 2.5 Flash-Lite,无论是否开启“思考”功能,我们都能为对成本和延迟极为敏感、对模型智能要求相对较低的场景,提供更低价的选择。

图:Gemini Flash系列定价更新

若你仍在使用Gemini 2.5 Flash Preview 04-17,原有预览定价将持续有效,直至该模型于2025年7月15日下线。届时,该模型终端将关闭。你可迁移至正式版“gemini-2.5-flash”,或选择2.5 Flash-Lite预览版作为更经济的替代方案。

Gemini 2.5 Pro持续增长

Gemini 2.5 Pro的增长和需求强劲,远超我们以往任何一款模型。为了让更多客户能够在生产环境中使用这款模型,我们将06-05版本定为稳定版,并延续此前的帕累托最优定价。

在对智能和能力要求最高的场景,如代码生成、智能体任务等,Pro的优势尤为突出。Gemini 2.5 Pro已成为众多主流开发者工具的核心引擎。

图:主流开发者工具已集成Gemini 2.5 Pro,包括Cursor、Bolt、Cline、Cognition、Windsurf、GitHub、Lovable、Replit和Zed Industries等

如果你正在使用2.5 Pro Preview 05-06,该模型将持续可用至2025年6月19日,届时将被关闭。若你已在使用2.5 Pro Preview 06-05,仅需将模型字符串更新为“gemini-2.5-pro”即可。

我们期待2.5 Pro的智能能力惠及更多行业场景,并将在不久的将来分享更多Pro系列扩展的最新进展。

(易句)

(本文由AI翻译,网易编辑负责校对)

延伸阅读
相关推荐
热点推荐
1499元,特斯拉为Model Y推出手动车顶遮阳帘

1499元,特斯拉为Model Y推出手动车顶遮阳帘

金融界
2026-05-31 17:00:10
穷果然不养人!家里破产后,王文也面相都变了,公主开始吃路边摊

穷果然不养人!家里破产后,王文也面相都变了,公主开始吃路边摊

蹲坑看世界
2026-05-30 10:22:43
74岁老人烧杨絮引燃20辆汽车:起因是认为大量杨絮影响其健身走步,因涉嫌失火罪,被采取刑事强制措施

74岁老人烧杨絮引燃20辆汽车:起因是认为大量杨絮影响其健身走步,因涉嫌失火罪,被采取刑事强制措施

极目新闻
2026-05-31 18:46:22
雨量中到大,局部暴雨!江苏天气最新预测

雨量中到大,局部暴雨!江苏天气最新预测

江南晚报
2026-06-01 02:44:09
宇树科技亚洲首店开业首日人气火爆

宇树科技亚洲首店开业首日人气火爆

看看新闻Knews
2026-05-31 22:25:30
汽车圈的寒冬来了!广州一配套厂全员降薪,希望员工“同舟共济”

汽车圈的寒冬来了!广州一配套厂全员降薪,希望员工“同舟共济”

火山詩话
2026-05-30 15:44:48
长征伊始,耿飚就缴获一件宝物,没有它,红军在湘江可能全军覆灭

长征伊始,耿飚就缴获一件宝物,没有它,红军在湘江可能全军覆灭

云霄纪史观
2026-06-01 02:12:42
广州女孩清华硕士毕业做纹眉师一年,曾最高月入10万元,回应关注:在广州创业太便利,用上所学知识就不算浪费学历

广州女孩清华硕士毕业做纹眉师一年,曾最高月入10万元,回应关注:在广州创业太便利,用上所学知识就不算浪费学历

环球网资讯
2026-05-31 14:41:18
5亿美元重压下雷霆被迫拆队,亚历山大超越杜兰特难度增大

5亿美元重压下雷霆被迫拆队,亚历山大超越杜兰特难度增大

郭蛹包工头
2026-05-31 14:14:57
心酸!登哥放下身段!!只求一座冠军!!

心酸!登哥放下身段!!只求一座冠军!!

柚子说球
2026-05-31 19:58:44
卫冕失败!亚历山大空砍35+9功亏一篑 两连庄MVP却无缘两连冠

卫冕失败!亚历山大空砍35+9功亏一篑 两连庄MVP却无缘两连冠

醉卧浮生
2026-05-31 10:49:15
《家业》大结局:入赘生龙凤胎,昔日对头抢当带娃保姆

《家业》大结局:入赘生龙凤胎,昔日对头抢当带娃保姆

陈意小可爱
2026-05-31 01:13:31
歌手2026网传剧本应验了!庾澄庆魏如萱接连被做掉,4人内定月决

歌手2026网传剧本应验了!庾澄庆魏如萱接连被做掉,4人内定月决

一盅情怀
2026-05-31 14:49:56
女生长的太漂亮是什么体验?网友:母以子贵,父以女荣

女生长的太漂亮是什么体验?网友:母以子贵,父以女荣

另子维爱读史
2026-03-10 22:56:08
14岁女孩和同学吵架后吞下3枚刀片,医生:刀片已穿过胃部进入小肠,随时都有危险…

14岁女孩和同学吵架后吞下3枚刀片,医生:刀片已穿过胃部进入小肠,随时都有危险…

都市快报橙柿互动
2026-05-30 23:40:54
张雪深夜发飙!给经销商270人发命令,张雪:删视频,马上,重罚

张雪深夜发飙!给经销商270人发命令,张雪:删视频,马上,重罚

阿纂看事
2026-05-29 11:15:42
乡村女老师性感穿搭火了,内衣搭长裤,网友:你真不怕老光棍吗?

乡村女老师性感穿搭火了,内衣搭长裤,网友:你真不怕老光棍吗?

妍妍教育日记
2026-05-30 08:55:07
山大博士就业拿到4个offer,电网、选调、医院、留校,选哪个?

山大博士就业拿到4个offer,电网、选调、医院、留校,选哪个?

趣笔谈
2026-06-01 08:21:09
谁干的?深夜,北约成员国遇袭,特朗普失声,普京表态

谁干的?深夜,北约成员国遇袭,特朗普失声,普京表态

墨羽怪谈
2026-06-01 05:47:51
百万网红边牧被卖后续!母亲崩溃怒斥,当事人放话,收狗人曝内情

百万网红边牧被卖后续!母亲崩溃怒斥,当事人放话,收狗人曝内情

奇思妙想草叶君
2026-05-30 22:22:07
2026-06-01 08:56:49

科技要闻

关停三年后,天涯社区今起开放访问

头条要闻

山西矿难致82死 实控人花几个亿修庙行善对矿工苛刻

头条要闻

山西矿难致82死 实控人花几个亿修庙行善对矿工苛刻

体育要闻

阿森纳用最悲壮的方式,成就了巴黎王朝

娱乐要闻

朱军退休,正义虽迟但到,女方受惩

财经要闻

网红驱蚊产品,标注化妆品竟含农药成分

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

健康
艺术
亲子
教育
房产

尝试干细胞疗法如何避免踩坑?

艺术要闻

李讷刘思齐邵华童年照曝光!"红二代"狂草热榜,大草为何难写好?

亲子要闻

六一儿童节快乐!

教育要闻

这个六一,给孩子一份来自前沿科技的启蒙!

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

无障碍浏览 进入关怀版
×