网易首页 > 网易号 > 正文 申请入驻

谷歌更新安卓开发最佳AI模型榜单,Gemini 3.5 Flash成本最贵

0
分享至

IT之家 6 月 16 日消息,谷歌昨日(6 月 15 日)更新其 Android Bench 榜单,自家 Gemini 3.5 Flash 模型成绩明显低于外界预期。

IT之家注:Android Bench 是谷歌官方推出的安卓开发任务基准测试,用来评估不同 AI 模型在代码编写、问题解决与开发辅助方面的实际能力。

该测试更贴近真实开发场景,专门衡量 AI 模型完成安卓开发任务的能力,因此对开发者选择模型有较强参考价值。

根据谷歌官方更新的 Android Bench 榜单,OpenAI 的 GPT-5.5 模型以 74 得分位居榜首,GPT-5.4 模型以 72.4 得分位居第二。

谷歌自家的 Gemini 3.1 Pro Preview 以 72.4 得分位居第三;而 Claude Opus 4.7(68.7 分)和 Opus 4.6(66.6 分)位居第四和第五。

其中让 Android Authority 等媒体感到惊讶的是,谷歌 Gemini 3.5 Flash 只拿到 63.7 分,最终排在第 6,未进入前 5。

在平均 Token 消耗量(每次基准测试包括 100 个任务,执行 10 次计算平均消耗)方面,谷歌 Gemini 3.5 Flash 平均消耗 3.559 亿 Tokens,折合单次运行平均成本 147.1 美元(现汇率约合 996.1 元人民币),成为整个榜单里最贵的模型。

谷歌在 I/O 2026 上发布 Gemini 3.5 Flash 时,称其是迄今最强的 Flash 模型,并强调编码能力更稳健,也更适合 AI 智能体与复杂工作流。

谷歌还表示,这款模型在部分内部基准测试中优于 Gemini 3.1 Pro,输出速度最高可达竞争性前沿模型的 4 倍。

但 Android Bench 给出的结论并不一致,至少在真实的安卓开发任务场景里,Gemini 3.5 Flash 没有体现出应有优势。

Gemini 3.1 Pro Preview 不仅分数更高,成本也大约只有 Gemini 3.5 Flash 的 1/3,这让开发者很难忽视它在性价比上的落差。

此外基于页面信息,智谱的 GLM 5.1 以 59.7 分位居第七;而 Kimi K2.6 以 58.6 分位居第八,DeepSeek V4 Pro 以 55.4 分位居第十;而 DeepSeek V4 Flash 以 52.7 分位居第 12 位,折合单次运行平均成本只需要 8.4 美元(现汇率约合 56.9 元人民币)。Gemini 3.5 Flash 单次运行平均成本是 Deepseek V4 Flash 的 17.5 倍。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不要再为贺红梅感到惋惜了,55岁升任高官的她,早已走上另一路

不要再为贺红梅感到惋惜了,55岁升任高官的她,早已走上另一路

落雪听梅a
2026-06-21 10:14:57
江苏多地机关将“处长”调整为“科长”,是什么原因?属于降级吗

江苏多地机关将“处长”调整为“科长”,是什么原因?属于降级吗

手工制作阿爱
2026-06-21 12:40:46
帕公主隐秘男友再度守灵!帕里塔特少将满脸悲伤,迟迟走不出丧痛

帕公主隐秘男友再度守灵!帕里塔特少将满脸悲伤,迟迟走不出丧痛

笑一个吧
2026-06-21 14:17:00
穆里尼奥出手!当年被全英超骂成水货的球员,皇马 6000 万抢着要

穆里尼奥出手!当年被全英超骂成水货的球员,皇马 6000 万抢着要

澜归序
2026-06-15 05:14:22
女人偷情时的“嗯嗯”声代表着什么?

女人偷情时的“嗯嗯”声代表着什么?

思絮
2026-06-22 00:04:28
中央再发铁令!领导干部出现这15种情形 , 将不能再担任现职!

中央再发铁令!领导干部出现这15种情形 , 将不能再担任现职!

细说职场
2026-06-20 15:03:51
二十余年遗憾终圆满!陈伟霆首个父亲节,一双定制亲子鞋戳哭全网

二十余年遗憾终圆满!陈伟霆首个父亲节,一双定制亲子鞋戳哭全网

繁华羽淡洛
2026-06-21 16:05:36
英国又为乌克兰研发出一款大杀器

英国又为乌克兰研发出一款大杀器

史政先锋
2026-06-21 23:18:32
今夏已完成8笔重磅转会!皇马独揽4笔,热刺也签下了两员大将!

今夏已完成8笔重磅转会!皇马独揽4笔,热刺也签下了两员大将!

田先生篮球
2026-06-20 20:36:40
土耳其为啥世界杯改名Türkiye?两个原因一个比一个尴尬

土耳其为啥世界杯改名Türkiye?两个原因一个比一个尴尬

李絙在北漂
2026-06-20 10:24:46
笑死人!客服笑了两个小时才舍得发出,评论区已沦陷

笑死人!客服笑了两个小时才舍得发出,评论区已沦陷

另子维爱读史
2026-06-20 22:40:00
宝马全新一代 X5 曝光:换脸换芯,2026年还要让你掏钱包?

宝马全新一代 X5 曝光:换脸换芯,2026年还要让你掏钱包?

音乐时光的娱乐
2026-06-19 14:41:52
浙江民富实力十强县!慈溪仅排第六,温州入围两城

浙江民富实力十强县!慈溪仅排第六,温州入围两城

城市生态圈
2026-06-21 15:47:55
先2-2,再4-0!淘汰赛还要赢巴西,世界杯日本喊出夺冠?醒醒吧

先2-2,再4-0!淘汰赛还要赢巴西,世界杯日本喊出夺冠?醒醒吧

以茶带书
2026-06-22 00:31:22
林生斌现状:定居澳洲富人区,如今儿女双全,妻子是之前公司员工

林生斌现状:定居澳洲富人区,如今儿女双全,妻子是之前公司员工

离离言几许
2026-06-19 17:17:57
你知道吗?这些公安部门以前全是独立的!

你知道吗?这些公安部门以前全是独立的!

音乐时光的娱乐
2026-06-21 12:38:39
太难了!知名车厂再宣布裁员5万

太难了!知名车厂再宣布裁员5万

新浪财经
2026-06-21 15:10:07
“初中女生坏起来比男孩更可怕”,班主任曝内情:三观都被刷新了

“初中女生坏起来比男孩更可怕”,班主任曝内情:三观都被刷新了

泽泽先生
2026-06-18 19:58:44
“山东最大酒商”爆雷?只是个倒爷

“山东最大酒商”爆雷?只是个倒爷

茅小福
2026-06-21 08:58:11
离婚 无孩 五年空窗,43岁尼格买提终于摊牌了 我心里那个人:是我妈

离婚 无孩 五年空窗,43岁尼格买提终于摊牌了 我心里那个人:是我妈

TVB的四小花
2026-06-18 08:12:23
2026-06-22 01:51:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
350828文章数 607300关注度
往期回顾 全部

科技要闻

马斯克拿下7800亿元天价薪酬 2028年可兑现

头条要闻

媒体:两大核武国家“水仗”升级 巴基斯坦陷入恐慌

头条要闻

媒体:两大核武国家“水仗”升级 巴基斯坦陷入恐慌

体育要闻

德国的超级替补,10年前还在工厂上班

娱乐要闻

原来她就是张颂文老婆

财经要闻

“床垫界的特斯拉”破产了

汽车要闻

惊出冷汗!重庆实测奥迪A5L,华为智驾这波操作绝了…

态度原创

旅游
房产
健康
游戏
数码

旅游要闻

不用远赴江南,安宁这条河既有山泉灵气,又藏国人专属山水乡愁!

房产要闻

商业清零式退潮,大量住宅登场!三亚又要大规模调规!

吃粽子的3条保胃法则,消化科医生推荐

《STRANGER THAN HEAVEN》游先看试玩报告:散装拳脚,也可以很爽"/> 主站 商城 论坛 自运营 登录 注册 《STRANGER THA...

数码要闻

曝英特尔"Raptor Lake Next"处理器移动端仅提供"HX"版本

无障碍浏览 进入关怀版