谷歌宣布推出 Gemini 3.1 Flash-LITE 模型,面向开发者大规模高频工作负载优化,预览版正式开放。该模型号称 Gemini 系列中速度最快、性价比最高版本,在多项基准测试中超越同类竞品,引发全球开发者关注。
![]()
AI生成
官方数据显示,Gemini 3.1 Flash-LITE 首个答案响应时间较上一代提升 2.5 倍,输出速度提升 45%,在 GPQA Diamond、MMMU Pro 等权威测试中表现优异,超过 GPT-5 Mini 等对手。模型支持最长 100 万 Token 上下文窗口,定价为 0.25 美元 / 百万输入、1.5 美元 / 百万输出,适合高频调用、批量处理、实时交互场景。
谷歌表示,新模型专为企业客服、内容生产、代码开发、数据解析等高频场景设计,在保持能力的同时大幅降低成本与延时,推动 AI 从实验走向规模化商用。
随着模型开放,更多应用将迎来速度与成本优化,尤其是 AI Agent、自动化工具、实时交互产品将显著受益。未来,极速轻量模型将成为行业标配,推动 AI 渗透到更多实时性要求高的场景。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.