网易首页 > 网易号 > 正文 申请入驻

Gemini 2.5 Flash 推出 “思考预算” 调低时可降低 AI 成本 600%

0
分享至

Google 今天推出了 Gemini 2.5 Flash,这是一款重要升级的 AI 产品,赋予企业和开发人员前所未有的掌控权,可以指定 AI 执行“思考”过程的程度。该新模型已通过 Google AI Studio 和 Vertex AI 以预览版形式发布,代表了 Google 在竞争愈发激烈的 AI 市场中,一边提升推理能力、一边保持具有竞争力的定价策略的战略努力。

该模型引入了 Google 所称的“思考预算”,这是一种机制,允许开发人员设定在生成回答前,分配多少计算资源用于处理复杂问题的推理。其做法旨在解决当前 AI 市场中的根本性矛盾:更高级的推理通常会带来更高的延迟和费用。

Google DeepMind Gemini 模型产品总监 Tulsee Doshi 在接受 VentureBeat 独家采访时表示:“我们知道成本和延迟对于许多开发人员的用例来说至关重要,因此我们希望为开发人员提供灵活性,可根据他们的需求调节模型的思考幅度。”

这种灵活性展现了 Google 在 AI 部署方面的务实方法,因为该技术正日益嵌入那些对成本可预测性要求极高的企业应用中。通过允许关闭或开启思考功能,Google 创造了其所谓的“首个完全混合推理模型”。

付费只为您所需的“脑力”:Google 新 AI 定价模型解析

新的定价结构突显了当前 AI 系统中推理的成本。在使用 Gemini 2.5 Flash 时,开发人员对于输入 Token 的费用为每百万 Token 0.15 美元。而输出费用则根据推理设置大幅变化:若关闭思考,则为每百万 Token 0.60 美元;若启用推理,则跳升至每百万 Token 3.50 美元。

这一近 6 倍的费用差异反映了“思考”过程计算负载之高,该过程中模型在生成回答前会评估多种可能性和考量因素。

Doshi 告诉 VentureBeat:“客户为模型所生成的任何思考和输出 Token 付费。在 AI Studio 的用户体验界面中,你可以在得到回答前看到这些思考过程。在 API 中,目前我们不提供查看思考过程的功能,但开发者可以看到生成的 Token 数量。”

思考预算可以在 0 至 24,576 Token 之间调整,其作用是作为上限而非固定分配。Google 表示,该模型会根据任务的复杂性智能决定使用多少预算,在不需要复杂推理时可节省资源。

Gemini 2.5 Flash 的表现如何:与领先 AI 模型的基准测试结果对比

Google 称,Gemini 2.5 Flash 在主要基准测试中展现了具有竞争力的表现,而且其模型规模比其他方案更小。在 Humanity’s Last Exam——一项旨在评估推理和知识的严格测试中,2.5 Flash 得分为 12.1%,表现超过 Anthropic 的 Claude 3.7 Sonnet(8.9%)和 DeepSeek R1(8.6%),尽管略逊于 OpenAI 最近推出的 o4-mini(14.3%)。

该模型在诸如 GPQA diamond(78.3%)和 AIME 数学考试(2025 年测试成绩 78.0%,2024 年测试成绩 88.0%)等技术基准测试上也取得了强劲成绩。

Doshi 表示:“企业应选择 2.5 Flash,因为它在成本和速度上提供了最优性价比。它在数学、多模态推理、长上下文处理等多个关键指标上相对于竞争对手表现尤为突出。”

业界分析师指出,这些基准测试结果表明 Google 正在缩小与竞争对手之间的性能差距,同时保持定价优势——这一策略可能会受到那些关注 AI 预算的企业客户的青睐。

智能与迅捷:何时需要让您的 AI 深度思考?

可调节的推理功能代表了企业部署 AI 模型的一大进化。传统模型往往让用户对模型内部的推理过程几乎毫无可见性或控制权。

Google 的方法允许开发人员针对不同场景进行优化。对于诸如语言翻译或基础信息检索等简单查询,可以通过禁用思考来实现最大成本效益;而对于需要多步推理的复杂任务,如数学问题求解或细致分析,则可以启用并细化思考功能。

一个关键的创新点在于该模型能够根据查询内容自动判断适当的推理深度。Google 举例说明:一个简单问题比如“加拿大有几个省?”只需极少量推理,而关于梁应力计算的复杂工程问题则会自动调用更深层次的思考过程。

Doshi 介绍说:“将思考功能整合到我们主线 Gemini 模型中,再加上全面的改进,使得答案质量得以提升。这些改进在包括评估事实性指标的 SimpleQA 在内的学术基准测试中均有体现。”

Google 的 AI 周:免费学生使用权和视频生成功能伴随 2.5 Flash 同步发布

Gemini 2.5 Flash 的发布正值 Google 在 AI 领域采取多项激进举措的一周内。周一,Google 向 Gemini Advanced 用户推出了 Veo 2 视频生成功能,允许用户将文本提示转换为八秒的视频剪辑。今天,在发布 2.5 Flash 的同时,Google 宣布所有美国大学生将获得免费使用 Gemini Advanced 的权利,直至 2026 年春季——分析师将此举视为围绕未来知识工作者建立忠诚度的努力。

这些公告反映了 Google 的多管齐下策略,以期在由 OpenAI 的 ChatGPT 主导的市场中竞争。据第三方分析,ChatGPT 每周活跃用户超过 8 亿,而 Gemini 估计月活跃用户约为 2.5 到 2.75 亿。

凭借对成本效率和性能自定义的明确关注,2.5 Flash 模型似乎专为那些需要精细管理 AI 部署成本同时又要求高端能力的企业客户而设计。

Doshi 表示:“我们非常期待开发人员就他们基于 Gemini Flash 2.5 构建的应用以及如何使用思考预算提供反馈。”

预览之外:Gemini 2.5 Flash 成熟后企业可期望的功能

尽管此次发布处于预览阶段,该模型已供开发人员开始构建应用使用,但 Google 尚未明确何时普遍可用。公司表示将根据开发者在预览阶段的反馈,继续完善这项动态的思考能力。

对于企业 AI 用户来说,此次发布提供了试验更细致 AI 部署方式的机会,有可能在高风险任务上配置更多计算资源,同时在常规应用中节约成本。

该模型也通过 Gemini 应用面向消费者提供,在模型下拉选单中显示为“2.5 Flash (Experimental)”,取代了之前的 2.0 Thinking (Experimental) 选项。这种面向消费者的部署表明,Google 正借助应用生态系统收集关于其推理架构的更广泛反馈。

随着 AI 越来越深入地嵌入企业工作流程中,Google 采用可自定义推理的方式反映了一个日趋成熟的市场,在该市场中成本优化和性能调优的重要性正逐步与原始能力并驾齐驱——这预示着生成式 AI 技术商业化的新阶段。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
《权游》龙妈自嘲:我还演过这些翻车大片

《权游》龙妈自嘲:我还演过这些翻车大片

时光慢旅人
2026-06-02 01:18:48
中方严肃定性,16国加入联合军团围剿俄,日本也已经介入战斗了!

中方严肃定性,16国加入联合军团围剿俄,日本也已经介入战斗了!

墨印斋
2026-06-03 00:52:19
学历大放水!清华一年毕业3000多博士,比哈佛耶鲁等五所世界名校加起来多出30%

学历大放水!清华一年毕业3000多博士,比哈佛耶鲁等五所世界名校加起来多出30%

爆角追踪
2026-06-02 22:12:58
季新杰被曝与未成年发生关系 若真或构成强奸 女友若造谣涉嫌诽谤

季新杰被曝与未成年发生关系 若真或构成强奸 女友若造谣涉嫌诽谤

念洲
2026-06-02 19:18:06
46岁董洁花期太短了,这是董洁为某时尚杂志拍的大片,董洁贴上假胡子,脸上戴着厚重的网纱,脖子上挂着繁复的花朵,这妆造真的太前卫了

46岁董洁花期太短了,这是董洁为某时尚杂志拍的大片,董洁贴上假胡子,脸上戴着厚重的网纱,脖子上挂着繁复的花朵,这妆造真的太前卫了

牛油果生活观
2026-06-02 19:09:43
“宿迁阿斗”,国补都扶不起京东?

“宿迁阿斗”,国补都扶不起京东?

七使2022
2026-06-02 16:21:50
女选手泳衣移位被无码直播,近万人围观!主办方道歉,摄影师封杀

女选手泳衣移位被无码直播,近万人围观!主办方道歉,摄影师封杀

酷侃体坛
2026-06-02 09:09:51
惊掉下巴!女生索要9000元换手机,男友转账附上“以结婚为目的”

惊掉下巴!女生索要9000元换手机,男友转账附上“以结婚为目的”

火山詩话
2026-06-02 16:32:30
悲催!江苏一工厂突然停产放假1个月,员工哭诉国际形势不容乐观

悲催!江苏一工厂突然停产放假1个月,员工哭诉国际形势不容乐观

火山詩话
2026-06-02 08:34:49
收割机纷纷驶离襄阳,短短十天大转变,多地跨区麦客为何转身就走

收割机纷纷驶离襄阳,短短十天大转变,多地跨区麦客为何转身就走

奇思妙想草叶君
2026-06-02 22:41:36
山西沁源县委书记赵永进被查,此前当地煤矿爆炸致82人死亡

山西沁源县委书记赵永进被查,此前当地煤矿爆炸致82人死亡

知知贵阳
2026-06-02 22:06:03
挪威深海发现载有中国瓷器的18世纪沉船:大量青花瓷碗重见天日,文物达数千件,目前正开展船只溯源工作并努力还原历史真相

挪威深海发现载有中国瓷器的18世纪沉船:大量青花瓷碗重见天日,文物达数千件,目前正开展船只溯源工作并努力还原历史真相

大风新闻
2026-06-02 12:15:18
割四赔五后续:麦客撤了,麦烂了,农户跪了,这锅谁背?

割四赔五后续:麦客撤了,麦烂了,农户跪了,这锅谁背?

番外行
2026-06-02 14:19:47
亢奋女主硬刚导演:我是OnlyFans模特,裸戏别想删!

亢奋女主硬刚导演:我是OnlyFans模特,裸戏别想删!

自愈小日子
2026-06-02 00:21:55
诺贝尔经济学奖得主克鲁格曼:对中国经济的评估

诺贝尔经济学奖得主克鲁格曼:对中国经济的评估

生命可以承受之轻
2026-06-02 15:57:17
2026年最寒心的“农夫与蛇”:恩将仇报连狗都不如

2026年最寒心的“农夫与蛇”:恩将仇报连狗都不如

红色少女主播
2026-05-31 15:18:01
055和基洛夫并排的对比图,我才惊觉军舰设计已经隔了一个时代

055和基洛夫并排的对比图,我才惊觉军舰设计已经隔了一个时代

安安说
2026-06-02 12:46:29
随着19岁乔达尔0-3完败,法网男单四强诞生第一席:世界第3率先晋级

随着19岁乔达尔0-3完败,法网男单四强诞生第一席:世界第3率先晋级

侧身凌空斩
2026-06-02 23:15:57
“办案人员篡改伪造证人笔录,没被追责还升职了”,云南镇雄公安局原副局长刑满出狱后公开举报

“办案人员篡改伪造证人笔录,没被追责还升职了”,云南镇雄公安局原副局长刑满出狱后公开举报

大风新闻
2026-06-02 19:35:11
铜价:大家做好心理准备!从今天6月2日开始,或有更大调整行情

铜价:大家做好心理准备!从今天6月2日开始,或有更大调整行情

花小猫的美食日常
2026-06-02 18:20:46
2026-06-03 03:00:49
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
18986文章数 49708关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

房产
艺术
时尚
游戏
公开课

房产要闻

5200巨量投资曝光!未来五年,海南格局大变!

艺术要闻

抖音砸60个亿,要盖一座“不像医院”的医院?

蓝色系下装看着清爽不闷,裤子、裙子都凉快,随便穿都不出错

离发售不远了!《寂静岭》系列新作已公开游戏评级

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版