网易首页 > 网易号 > 正文 申请入驻

每秒289个token,Gemini 3.5 Flash能打破"智能必慢"的魔咒吗?

0
分享至

开发者们早就习惯了这个妥协:模型越聪明,响应越慢。深度推理需要等待,上线部署往往要在智能和速度之间二选一。Google I/O 2026上,Gemini 3.5 Flash直接挑战了这个假设。

Google这次发布了Antigravity 2.0——一个专为AI智能体设计的独立桌面环境,底层完全跑在Gemini 3.5 Flash上。官方给出的数字很刺眼:每秒处理289个token,把Claude Opus 4.7的67 tps和GPT-5.5的71 tps甩在身后。


但速度只是入场券。真正的问题从来不是模型跑多快,而是能不能把演示视频里的流畅操作,变成企业能放心上线的系统。我们拉来了2026年的几款旗舰模型,用同一套测试标准验货。

实测结果:快是真的快,但长板短板都很明显

Gemini 3.5 Flash的绝对优势在多工具协同场景。MCP Atlas测试的是智能体同时操作多个开发者工具、遇到运行错误时自主修复的能力——这里Gemini拿了第一。对于需要完全无人值守的自动化工作流,这是硬门槛。技术图表解析、数据库路由这些任务也做得漂亮,AA Intel Index综合评分和CharXiv Reasoning测试都有不错的表现。

短板出现在两个地方。一是复杂架构重构:虽然读GitHub issue、生成代码修复(SWE-bench Verified)很顺手,但涉及多文件大规模改写的SWE-bench Pro,还是输给了Claude 4.7 Opus。二是陌生逻辑和复杂界面:面对从未见过的逻辑网格(ARC-AGI-2),以及跨应用桌面UI导航(OSWorld),Gemini偶尔会"迷路",GPT-5.5在这类空间推理上更稳。

还有个意外发现:耐力。GDPval-AA的连续Elo评分追踪的是智能体循环执行任务时多久会卡死,Gemini虽然很强,但纯耐力不如GPT-5.5。Terminal-Bench 2.1的bash语法严格判分、GPQA Diamond的学术难题边缘情况,也会让它偶尔翻车。

Antigravity 2.0的"思考"开关到底是什么?

新功能里有个"Thinking"档位,从Minimal到High可调。从API表现来看,这更像是控制推理token的生成量,而非底层架构的革新。对开发者来说够用了,但别误会成换了新引擎。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
神舟二十三号深夜出征!一年期驻留、首位香港航天员、百项实验

神舟二十三号深夜出征!一年期驻留、首位香港航天员、百项实验

海右那人
2026-05-23 13:12:33
活久见!在校女大学生追求年轻未婚男教师引争议,网友:一票否决

活久见!在校女大学生追求年轻未婚男教师引争议,网友:一票否决

火山詩话
2026-05-22 09:44:44
被德比斯绝杀1周后,亚军晒黑脸照复仇!拒绝加入张雪机车后悔吗

被德比斯绝杀1周后,亚军晒黑脸照复仇!拒绝加入张雪机车后悔吗

念洲
2026-05-24 12:53:00
炒不了港美股了,怎么办?

炒不了港美股了,怎么办?

佩妮penny的世界
2026-05-22 20:05:07
60岁才醒悟:为什么当年那些呼风唤雨的老领导,退休后连个饭局都组不起来?

60岁才醒悟:为什么当年那些呼风唤雨的老领导,退休后连个饭局都组不起来?

心理观察局
2026-05-22 07:51:06
5月22日养老金上调通知发布了?真相和网传不一样!

5月22日养老金上调通知发布了?真相和网传不一样!

李博世财经
2026-05-24 14:13:03
当俄罗斯不再提顿巴斯

当俄罗斯不再提顿巴斯

民间胡扯老哥
2026-05-12 18:07:35
纪实:河南“恶魔首富”吴天喜,年近60却死性不改,是噩梦般的存在

纪实:河南“恶魔首富”吴天喜,年近60却死性不改,是噩梦般的存在

卡西莫多的故事
2025-01-06 10:41:00
他没秃,但变强了,一个44岁日本大叔的三年“一拳超人”实修录

他没秃,但变强了,一个44岁日本大叔的三年“一拳超人”实修录

国创漫话
2026-05-24 14:24:45
7课题经费4303万!被耿同学第一枪瞄准:同济王平院长有多牛?

7课题经费4303万!被耿同学第一枪瞄准:同济王平院长有多牛?

大江看潮
2026-05-22 15:13:03
中信建投:迎接MLCC超级周期, 重视产业链投资机遇

中信建投:迎接MLCC超级周期, 重视产业链投资机遇

新浪财经
2026-05-24 19:52:18
大佬陈惠敏:李小龙儿子说自己不是中国人,我站起来就是一巴掌

大佬陈惠敏:李小龙儿子说自己不是中国人,我站起来就是一巴掌

飘飘然的娱乐汇
2026-05-23 19:15:05
帕利尼亚:赛后主教练哭了,俱乐部每个人都配得上今天这一刻

帕利尼亚:赛后主教练哭了,俱乐部每个人都配得上今天这一刻

懂球帝
2026-05-25 04:47:16
一月八万不够花,李双江“赖”学校不退休,儿子改名出国后再作妖

一月八万不够花,李双江“赖”学校不退休,儿子改名出国后再作妖

一盅情怀
2026-05-16 20:12:47
联盟最性价比续约!5年1.85亿,火箭捡大漏,活塞彻底羡慕坏了

联盟最性价比续约!5年1.85亿,火箭捡大漏,活塞彻底羡慕坏了

体育大朋说
2026-05-24 12:06:01
为什么炒股赚钱了,不能告诉身边人?4个原因

为什么炒股赚钱了,不能告诉身边人?4个原因

作家出版人姚茂敦
2026-05-24 21:02:26
皇马全员开宝马打卡上班,唯独这位大佬开法拉利搞特殊!

皇马全员开宝马打卡上班,唯独这位大佬开法拉利搞特殊!

仰卧撑FTUer
2026-05-24 10:52:52
要打?奉陪到底!中方出手,拒绝收回港口租约,澳防长咬死装委屈

要打?奉陪到底!中方出手,拒绝收回港口租约,澳防长咬死装委屈

近史博览
2026-05-25 06:35:39
香港女航天员黎家盈为何人?拥有港大博士学位,擅长电脑科技,去年已成功晋升警司

香港女航天员黎家盈为何人?拥有港大博士学位,擅长电脑科技,去年已成功晋升警司

红星新闻
2026-05-23 11:16:56
主角:古存孝惨死!原来,这才是忆秦娥移情别恋,嫁刘红兵的真相

主角:古存孝惨死!原来,这才是忆秦娥移情别恋,嫁刘红兵的真相

慢半拍sir
2026-05-23 23:57:01
2026-05-25 07:24:49
赛博兰博
赛博兰博
专注捣鼓AI效率工具,试图在这个时代留下数字分身的探索者。
3694文章数 41关注度
往期回顾 全部

科技要闻

我戴着摄像头上班,正在帮AI抢走我饭碗

头条要闻

山西矿难遇难者家属:父亲年过半百 我们一直劝他别干了

头条要闻

山西矿难遇难者家属:父亲年过半百 我们一直劝他别干了

体育要闻

唐斯发牌,大头逆袭:骑士跌向残忍夏季

娱乐要闻

王鹤棣掉粉超20万!代言和作品遭抵制

财经要闻

什么情况下,本轮AI大行情会结束?

汽车要闻

国民家轿再上新 帝豪向上系列限时5.59万起

态度原创

艺术
家居
数码
教育
手机

艺术要闻

他把葡萄画成了美少女

家居要闻

低调传承 温润沉静

数码要闻

618游戏本怎么选?ROG魔霸新锐2026来袭,福利秒杀让战力飞

教育要闻

女教师"幼态字体"走红,被家长建议停职, 学校:停职,接受调查

手机要闻

iPhone 20周年纪念款渲染图出炉:曲面屏加持,配置规格更激进了

无障碍浏览 进入关怀版