网易首页 > 网易号 > 正文 申请入驻

谷歌推出最快最高性价比Gemini 3模型,响应时间提高2.5倍、输出速度提升45%

0
分享至

美东时间3月3日周二,谷歌推出Gemini 3系列中速度最快、性价比最高的模型——Gemini 3.1 Flash-Lite。它专为开发者大规模高频工作负载设计,以更低价格实现不妥协的智能表现。

Gemini 3.1 Flash-Lite于3日当天起以预览版形式向开发者开放,可通过谷歌AI Studio的Gemini API接入,企业用户则可经由谷歌云Vertex AI平台使用。使用该模型无需特定硬件或软件配置,用户只需通过API调用即可接入。

谷歌透露,根据Artificial Analysis基准测试,3.1 Flash-Lite在首个答案响应时间上较Gemini 2.5 Flash提高2.5倍,输出速度提升45%,同时维持相近或更优的质量水准。

谷歌表示,该模型在Arena.ai排行榜上获得1432的Elo评分,并在多项推理与多模态理解基准测试中超越同级别其他模型,甚至优于上一代体量更大的Gemini模型。目前已有Latitude、Cartwheel、Whering等企业在早期测试中使用该模型,并反馈出显著的效率与成本优势。

定位与价格:高频场景下的性价比首选

谷歌DeepMind在模型说明文件中将3.1 Flash-Lite定位为“具备成本效益、速度快,针对高频、对延迟敏感的任务(如翻译和内容分类)进行优化”的模型,是Gemini 3系列原生多模态推理模型家族的新成员。

在价格方面,3.1 Flash-Lite定价为每百万输入token 0.25美元、每百万输出token 1.50美元。谷歌在官方博客中指出,该定价仅为大型模型的一小部分,适合需要大规模部署、同时对成本高度敏感的开发者和企业用户。

该模型支持文本、图像、音频与视频等多模态输入,上下文窗口最长达100万token,输出上限为6.4万token,可满足从文件摘要到复杂多模态任务的广泛需求。

性能基准:超越同级并挑战上一代旗舰

在核心性能指标上,谷歌援引Artificial Analysis基准测试数据称,3.1 Flash-Lite的首个答案响应时间(Time to First Answer Token)比Gemini 2.5 Flash快2.5倍,输出速度提升45%。

在智能能力评估方面,该模型在Arena.ai排行榜上获得1432的Elo评分,在GPQA Diamond测试中得分86.9%,在MMMU Pro测试中得分76.8%,谷歌表示这两项成绩均超越同级别竞争模型。

值得注意的是,谷歌特别强调3.1 Flash-Lite在部分基准测试中甚至超越了上一代体量更大的Gemini 2.5 Flash,这意味着在特定工作负载下,用户无需支付旗舰模型的价格即可获得更优性能。

核心特性:可调节的“思考层级”

除速度与成本外,3.1 Flash-Lite的一项差异化功能是在AI Studio和Vertex AI中内置“思考层级”(thinking levels)控制,允许开发者根据任务复杂程度灵活调整模型的推理深度。

谷歌在官方博客中写道,这一功能“对于管理高频工作负载至关重要”。对于翻译、内容审核等以成本为优先的批量任务,开发者可选用较低思考层级以压缩成本;对于生成用户界面、创建模拟场景或遵循复杂指令等需要深度推理的任务,则可调高思考层级以提升输出质量。

在架构层面,谷歌DeepMind披露,3.1 Flash-Lite基于Gemini 3 Pro构建,训练使用谷歌自研的张量处理单元(TPU)及JAX与ML Pathways软件框架完成。

企业反馈:效率与指令遵循能力获高度认可

多家早期测试企业对3.1 Flash-Lite给出了正面评价,尤其集中于速度、指令遵循能力和规模化处理能力三个维度。

AI叙事平台Latitude的AI负责人Kolby Nottingham表示:“谷歌的模型在同类产品中展现出无与伦比的指令遵循能力和速度,成功率比我们之前使用的模型高出20%,推理速度快60%,使Latitude能够为更广泛的受众提供复杂的叙事体验。”

AI动画工具Cartwheel首席科学家Andrew Carr则称该模型为“智能与速度比无可匹敌”,并指出:"它在工具调用方面表现出色,能够在更大模型所需时间的一小部分内快速探索代码库。我们拥有大量多模态标注使用场景,在大规模应用中,Flash-Lite成为我们处理更多数据、获取更多洞察的关键解锁工具。"

时尚应用Whering的CEO Bianca Rangecroft表示,通过将3.1 Flash-Lite整合进分类流程,Whering在商品标签标注上实现了"100%的一致性",即使面对复杂的时尚品类,也能提供"确定、可重复的结果"。

企业AI平台HubX联合创始人Kaan Ortabas则提供了具体数据:“作为根编排与内容引擎,Gemini 3.1 Flash-Lite持续实现10秒以内的完成时间、接近实时的流式输出、约97%的结构化输出合规率以及94%的意图路由准确率,在速度、指令精准度和成本效益之间取得了卓越平衡。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗国防部警告:我们还没动用最先进的武器,不会在最初几天全部部署

伊朗国防部警告:我们还没动用最先进的武器,不会在最初几天全部部署

西游日记
2026-03-05 13:55:48
为了印度得罪中国,要中国归还港口99年使用权,看到违约金后闭嘴

为了印度得罪中国,要中国归还港口99年使用权,看到违约金后闭嘴

安珈使者啊
2026-01-24 11:44:51
尼克松访华,毛主席只送了4两茶叶被嫌弃?周总理笑着说出4个字,美国总统立马变了脸色

尼克松访华,毛主席只送了4两茶叶被嫌弃?周总理笑着说出4个字,美国总统立马变了脸色

文史明鉴
2025-12-13 22:15:21
安徽美女程雨婷睡梦中去世,年仅24岁,原因公开,男友在灵堂长跪

安徽美女程雨婷睡梦中去世,年仅24岁,原因公开,男友在灵堂长跪

观察鉴娱
2026-03-06 09:23:06
粟裕提问袁振盛:解放这么多年了,为何解放军不改名叫国防军?

粟裕提问袁振盛:解放这么多年了,为何解放军不改名叫国防军?

历史龙元阁
2026-03-05 13:35:06
德罗赞总分超库里!国王负鹈鹕联盟50败首队 威少19+10

德罗赞总分超库里!国王负鹈鹕联盟50败首队 威少19+10

醉卧浮生
2026-03-06 13:25:34
数名院士呼吁糖尿病患者停止食用,比甜食还粘血管,趁早撤下餐桌

数名院士呼吁糖尿病患者停止食用,比甜食还粘血管,趁早撤下餐桌

蜉蝣说
2026-03-03 14:40:04
花499装了只OpenClaw,然后就放那吃灰了?我不允许!

花499装了只OpenClaw,然后就放那吃灰了?我不允许!

卡尔的AI沃茨
2026-03-04 18:04:48
完成加盟北京后首次训练,麦基社媒晒图:与球队的首次合练!

完成加盟北京后首次训练,麦基社媒晒图:与球队的首次合练!

懂球帝
2026-03-06 13:41:07
汽车圈“大地震”!比亚迪大将投奔行业巨头,叫嚣:三年内没对手

汽车圈“大地震”!比亚迪大将投奔行业巨头,叫嚣:三年内没对手

长星寄明月
2026-01-20 21:00:46
不是迷信!明日正月十九,牢记:1不吃,2不做,3要封,别大意了

不是迷信!明日正月十九,牢记:1不吃,2不做,3要封,别大意了

百变小厨坊VS龙儿美食
2026-03-06 13:51:07
上港与河南的首轮中超比赛还没踢,球队就做出重要决定,赢得点赞

上港与河南的首轮中超比赛还没踢,球队就做出重要决定,赢得点赞

818体育
2026-03-06 18:07:03
做完手术人就废了,这5种手术不需要做,别让无知害了自己

做完手术人就废了,这5种手术不需要做,别让无知害了自己

医学科普汇
2026-01-29 06:25:03
都逼中国出手?伊朗截断中国石油通道,普京催促:中俄要联手抗美

都逼中国出手?伊朗截断中国石油通道,普京催促:中俄要联手抗美

简简单单的说
2026-03-05 18:25:29
2026楼市突然变天,上海打响第一枪,手里有钱的人开始还房贷了

2026楼市突然变天,上海打响第一枪,手里有钱的人开始还房贷了

华史谈
2026-03-06 13:22:27
看成龙、洪金宝近况,才知巅峰时隐退,移居加拿大的他,有多英明

看成龙、洪金宝近况,才知巅峰时隐退,移居加拿大的他,有多英明

查尔菲的笔记
2026-03-06 17:16:01
一千亿美元打了水漂?今天终于可以大声说:中国这钱花得太值了!

一千亿美元打了水漂?今天终于可以大声说:中国这钱花得太值了!

郭蛹包工头
2026-03-05 18:09:59
高中的潜规则:60%多的人上不了本科,能上985的,不会在普高出现

高中的潜规则:60%多的人上不了本科,能上985的,不会在普高出现

好爸育儿
2026-02-12 16:04:52
在中国一颗也卖不出去!NVIDIA无奈停产H200芯片:加速Vera Rubin量产

在中国一颗也卖不出去!NVIDIA无奈停产H200芯片:加速Vera Rubin量产

快科技
2026-03-06 12:05:08
硬杠同行?莲花CEO炮轰激光雷达丑,被网友们骂惨了

硬杠同行?莲花CEO炮轰激光雷达丑,被网友们骂惨了

雷科技
2026-03-06 18:35:35
2026-03-06 20:24:49
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
142558文章数 2652768关注度
往期回顾 全部

科技要闻

独家|除夕加班、毫无黑料!林俊旸无奈离场

头条要闻

美媒询问中方对伊朗的支持是否涉军事援助 外交部回应

头条要闻

美媒询问中方对伊朗的支持是否涉军事援助 外交部回应

体育要闻

跑了24年,他终于成为英超“最长的河”

娱乐要闻

周杰伦社交媒体晒昆凌,夫妻感情稳定

财经要闻

关于经济、股市等,五部门都说了啥?

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

本地
教育
时尚
旅游
公开课

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

教育要闻

少年新闻频道·新闻百科丨不仅“涨知识”,更为了“长脑子”

看来看去还是这些穿搭最高级,不老套、不死板,舒适又显气质

旅游要闻

黄河岸边山桃花竞放春意盎然

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版