网易首页 > 网易号 > 正文 申请入驻

谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了

0
分享至

梦晨 闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

不得了。

谷歌Gemini 3 Pro进步太大了,与上一代2.5 Pro之间差出一个GPT-5.1(狗头)。

新模型在几乎所有基准测试中超过GPT-5.1和Claude4.5,包括人类最后的考试、ARC-AGI-2这些专为AGI准备的测试,数学的AIME 2025带工具拿满分,还刷新了之前让大模型全员得0分的LiveCodeBench Pro纪录。



用户投票的大模型竞技场也是一样,马斯克的Grok4.1昨天才刷完榜,今天就被反超了。



这下奥特曼和马斯克也不得不佩服了,前后脚出来点赞祝贺。





测试期间看Gemini 3模拟Windows、Mac、Linux三大操作系统界面,还以为它只擅长设计前端呢,原来设计出的程序他真能用啊。

设计一个乐高编辑器,一次尝试就完成了界面+负责空间逻辑和所有编辑器功能。



谷歌官方用Gemini 3 Pro设计的游戏更是发布在了油管上可以直接玩,纯靠AI都能搭起一个4399小游戏网了你敢信?

在智能体任务上,Gemini 3 Pro不光擅长编程,还强化了现实生活任务的长期规划能力,模拟管理自动售货机一年赚了5000美元,取得所有模型中最高的收入。



从今天起,谷歌宣布“以整个公司的体量”发布Gemini 3系列模型,包括首次在发布当天就将Gemini整合进搜索,上线独立APP,还推出全新的智能体开发平台。

还有一个更强Gemini 3 Deep Think深度思考模式,正在路上。

至于这么大的能力飞跃如何实现的,只有研究VP Oriol Vinyals透露了一点:预训练还没结束,后训练也还有很大改进空间。



Gemini系列的集大成者

回看Gemini系列这几年的演进,有点像打怪升级了,每一代都在补上一代的短板,然后在下一代里又把所有能力都打磨一遍。

1代奠定根基,把多模态能力和超长上下文打通,Gemini成为第一个能够处理百万级tokens上下文的大模型。

2代就开始变得有行动力,在1代的基础上记住大量信息后,它就整合海量信息进行决策和规划,这也为智能体能力铺了路。

到了Gemini 2.5,谷歌则开始认真搞思考和推理,给它加了思考引擎,让它能做更深入的推理、链式思考,甚至模仿人类分步解决问题。

现在的3代更是能力的集大成者,不是简单堆料,而是深度融合,多模态、推理、Agent能力这些特性一起进化,主打“你敢想,我实现”。

而且,Gemini 3更明显的变化是更懂人话了。



不用纠结提示词是否写得“有水平”,只要把需求一丢,再长的提示词它也能抓住语境、明白意图,然后回你一句更简洁又直接的答案,没有彩虹屁的那种(doge)。



多模态方面更是开挂,文本、图像、视频、音频和代码一股脑地无缝理解。

比如说,给它看一段球赛的长视频,它就能总结打法,把球员技巧整理出来,然后顺便教你复现动作。

怎么感觉,上传自己的训练视频,就可以直接让Gemini 3当教练了……



在搜索场景里,Gemini 3也不是直接扔给你一堆链接,而是把即时查询的信息组织成你真正能用的东西,生成可交互式的内容。



反重力开发平台,杀入AI编程战场

这次与旗舰模型Gemini 3 Pro同步推出的,还有Google Antigravity(反重力)实验性智能体开发平台。

其核心理念是构建一个“智能体优先”(agent-first)的开发环境,将开发者从繁琐的编码工作中解放出来,转向更高层次、面向任务的架构师角色。

官方展示了如何用1分钟开发一个航班追踪程序。



与Cursor为代表的AI IDE相比,Google Antigravity的智能体已被提升到一个独立的界面,并可直接访问编辑器、终端和浏览器。智能体可以代表用户自主规划和执行复杂的端到端软件任务,同时验证自身的代码。

全新的管理器视图旨在同时控制多个智能体,使每个智能体都能更加自主地工作。



谷歌对这款开发工具的野心很大,他不仅支持Gemini系列模型,也允许使用GPT-OSS、Claude第三方模型。

Antigravity目前以公共预览版的形式免费提供,并承诺为Gemini 3 Pro的使用提供“慷慨的速率限制”,一发布就吸引了大量开发者来“薅羊毛”。

目前Claude Code收入占Anthropic总营收约21%,OpenAI也在不断围绕Codex做文章。

AI编程工具,看来是下一个必争之地了。


[1]https://blog.google/products/gemini/gemini-3/#learn-anything

— 完 —

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陈俊崧惊艳多哈,不被看好的左手在扛旗,谁又能定义他这特殊打法

陈俊崧惊艳多哈,不被看好的左手在扛旗,谁又能定义他这特殊打法

徐骧老表哥
2026-01-16 12:35:13
U23男足3场亚洲杯总结:2人少用,3人快调整,6人能踢国足主力

U23男足3场亚洲杯总结:2人少用,3人快调整,6人能踢国足主力

男足的小球童
2026-01-15 16:43:30
聂卫平本可以安享晚年!生前生活放纵、烟不离手,坏习惯害了他

聂卫平本可以安享晚年!生前生活放纵、烟不离手,坏习惯害了他

老吴教育课堂
2026-01-16 01:34:54
女演员佟丽娅连续三年收到苏翊鸣赠送的滑板,承诺“今年一定站上雪道”,两人因《智取威虎山》结缘

女演员佟丽娅连续三年收到苏翊鸣赠送的滑板,承诺“今年一定站上雪道”,两人因《智取威虎山》结缘

极目新闻
2026-01-15 11:22:20
跟了自己十几年的贴身秘书,是美国间谍?仅一个眼神就发现不对劲

跟了自己十几年的贴身秘书,是美国间谍?仅一个眼神就发现不对劲

墨兰史书
2026-01-03 05:45:03
1995年,葛优拍戏赚了350万,谁知贺聪转身就在北京买了4套房。

1995年,葛优拍戏赚了350万,谁知贺聪转身就在北京买了4套房。

南权先生
2025-12-24 16:55:06
大当家没打!勇士半场领先3分,巴特勒15+4+2攻防一体!

大当家没打!勇士半场领先3分,巴特勒15+4+2攻防一体!

运筹帷幄的篮球
2026-01-16 12:17:59
新一轮货币宽松到来

新一轮货币宽松到来

泽平宏观展望
2026-01-16 00:07:16
王鸥王仁君新年拜访曹翠芬,81岁没子女住北京,家里简朴挺温馨

王鸥王仁君新年拜访曹翠芬,81岁没子女住北京,家里简朴挺温馨

李健政观察
2026-01-15 12:06:39
1950年,师级首长在成都遭活剥?毛主席拍案而起:116万土匪,一个不留!

1950年,师级首长在成都遭活剥?毛主席拍案而起:116万土匪,一个不留!

寄史言志
2026-01-07 20:37:09
大学生偷外卖被拘5日,警方的通报公开立在外卖架旁,派出所:是为了警示教育

大学生偷外卖被拘5日,警方的通报公开立在外卖架旁,派出所:是为了警示教育

极目新闻
2026-01-15 19:44:57
中年觉醒:经营好自己的40-50岁

中年觉醒:经营好自己的40-50岁

诗词中国
2026-01-14 20:47:21
特朗普开战前,中方先发制人,2则警告按住美军,断的就是美后路

特朗普开战前,中方先发制人,2则警告按住美军,断的就是美后路

浪子阿邴聊体育
2026-01-15 12:03:37
罗马诺:皇马内部很欣赏克洛普,但请他的前提他想重返教练席

罗马诺:皇马内部很欣赏克洛普,但请他的前提他想重返教练席

懂球帝
2026-01-16 00:27:11
金立群卸任亚投行行长

金立群卸任亚投行行长

三湘都市报
2026-01-16 00:35:37
美军集结!特朗普或24小时内打击伊朗,中国能源命脉将遭受冲击?

美军集结!特朗普或24小时内打击伊朗,中国能源命脉将遭受冲击?

纾瑶
2026-01-15 20:11:46
毛远新叫江青“妈妈”,毛主席严厉呵斥:你亲爹是毛泽民,不要六亲不认!

毛远新叫江青“妈妈”,毛主席严厉呵斥:你亲爹是毛泽民,不要六亲不认!

历史回忆室
2026-01-13 23:39:16
大姑子一家欧洲游花30万,账单寄我家,我转发给婆婆,她秒回

大姑子一家欧洲游花30万,账单寄我家,我转发给婆婆,她秒回

热心市民小黄
2026-01-16 11:14:51
难道我们都被当年明月的叙述 “带偏” 了?现实中的徐霞客处境十分艰难,根本不是可以效仿的对象

难道我们都被当年明月的叙述 “带偏” 了?现实中的徐霞客处境十分艰难,根本不是可以效仿的对象

老杉说历史
2026-01-15 22:45:26
杨瀚森带领混音队豪取胜利,展现新星内线统治力

杨瀚森带领混音队豪取胜利,展现新星内线统治力

诗远文案馆
2026-01-16 12:40:11
2026-01-16 13:11:00
量子位 incentive-icons
量子位
追踪人工智能动态
12023文章数 176359关注度
往期回顾 全部

数码要闻

行业首个:鸿蒙电视大屏操作系统FunOS发布,预计下半年商用

头条要闻

特朗普终于拿到诺奖 马查多或为换取委内瑞拉总统宝座

头条要闻

特朗普终于拿到诺奖 马查多或为换取委内瑞拉总统宝座

体育要闻

聂卫平:黑白棋盘上的凡人棋圣

娱乐要闻

黄慧颐手撕保剑锋 曾黎意外卷入风波

财经要闻

深圳有白银商家爆雷 维权群超350人

科技要闻

被网友"催"着走,小米紧急"抄"了特斯拉

汽车要闻

从 "商务" 变 "潮酷" 全新一汽奥迪A6L首秀亮相

态度原创

游戏
亲子
时尚
本地
军事航空

谁都能做恐怖游戏 但迅哥留下的“人窟”你敢进吗?

亲子要闻

好物齐刷刷|新生命 乳酸菌

年度最扎心电影,看得中年男女坐立难安

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

军事要闻

美国已正式开始出售委内瑞拉石油

无障碍浏览 进入关怀版