网易首页 > 网易号 > 正文 申请入驻

Hinton最新预言刷屏:谷歌必赢,而且「早该赢了」!

0
分享至


新智元报道

编辑:元宇 好困

【新智元导读】Google凭借Gemini 3、自研芯片、强大数据与研究团队,正在重新超越OpenAI,并带动市占与用户活跃度快速提升。在Google与OpenAI的双雄之争中,辛顿押谷歌会赢。

「我猜,谷歌一定会赢」!

刚刚,辛顿发话:

Google已经开始超越OpenAI了。


「AI教父」辛顿(Geoffrey Hinton)

超越就算了,他还说了一句更让OpenAI扎心的话:

我觉得更让人意外的是,Google居然花了这么久才超越OpenAI。

3年前,ChatGPT的发布让Google内部拉响了「红色警报」。

如今,拉响警报的变成了OpenAI。

Google刚发布的Gemini 3版本获得业内广泛认可,有业内人士认为其表现已经超过OpenAI的GPT-5。

Nano Banana Pro图像模型也非常受欢迎。

除了这些模型和产品之外,在辛顿看来,自研芯片也是Google的一个非常大的优势。

此外,辛顿还提到Google拥有很多非常优秀的研究人员,以及大量数据和庞大的数据中心。

这些综合优势,让辛顿认为Google会超越OpenAI并赢得最终胜利。

从市场反应来看,Gemini 3、Nano Banana Pro等模型的发布,AI与现有搜索产品的整合,以及TPU与Meta达成价值十亿美元的订单,这些综合优势推动了谷歌母公司市值逼近4万亿美元大关。

Hinton在Google Brain任职期间帮助推动了早期的AI研究。

他提到,Google曾长期引领AI,但后来变得有所顾虑。

Google发明了Transformer,也比其他公司更早拥有自己的大型聊天机器人。


辛顿表示,当微软2016年发布的「Tay」因发表极具种族歧视的推文而迅速下线后,Google开始变得格外谨慎。

Google一直有很好的品牌声誉,他们担心类似的事情如果发生会把名声毁了。

此前,Google CEO Sundar Pichai也曾表示,公司之所以没有更早推出聊天机器人,是因为当时的产品成熟度还不够。

以往,Google也曾经历一些不太顺利的产品发布。

就在去年,Google因用户抱怨其AI图像生成器产出的部分历史人物肤色错误、显得过度政治正确,而不得不中止该功能。

其最初的AI搜索摘要,也曾给出荒唐建议,例如为了防止披萨上的芝士掉下来,可以在披萨上抹胶水。

Gemini 3 Pro视觉推理封神

在Google的官方介绍中,将Gemini 3 Pro称为「我们迄今为止最强大的多模态模型」。


Google在介绍Gemini 3 Pro时,提到了一个重要的改变:

从「看见」,迈向了「理解」。

Gemini 3 Pro在文档、空间、屏幕和视频理解方面都实现了惊人的表现,实现了从简单识别迈向真正视觉与空间推理的跨代提升。

Gemini 3 Pro在MMMU Pro和Video MMMU等复杂视觉推理基准上刷新纪录,并在文档、空间、界面以及长视频理解等特定任务的测试中取得卓越成绩。

文档理解

现实世界的文档往往混乱、缺乏结构、难以解析,通常包含交错的图像、难辨认的手写字、嵌套表格、复杂数学符号和非线性布局。

Gemini 3 Pro在文档处理能力上实现重大突破,从精准OCR到复杂视觉推理,都有显著提升。

它不仅看懂「是什么」,还能看懂「为什么」和「怎么关联」。

谷歌的一个核心能力叫「反渲染」(derendering):能将文档画面还原为结构化代码(HTML、LaTeX、Markdown)。

例如,它能把18世纪商人日志转换成复杂表格,也能将带有数学标注的图像精准恢复为LaTeX。


18世纪奥尔巴尼商人手册中的手写复杂表格

要真正理解一份文档,模型需要准确识别文本、表格、数学公式、图形和图表,无论存在噪点还是格式混乱。

除了智能感知,还要具备高级推理能力。

Gemini 3能在长文档中执行跨表格与图表的多步复杂推理。

在CharXiv基准中,它甚至以80.5%的成绩超过了人类基线。

举例来说,用户分析美国人口普查局62页的《Income in the United States: 2022》报告时提出以下提示词:

「比较2021–2022年货币收入与税后收入的基尼指数变化百分比;并解释是什么导致了税后收入指标的偏离。另外,就货币收入而言,最低收入五分位的份额是上升还是下降?」

下方图片展示了模型的逐步推理。


空间理解

空间理解,是让模型真正开始理解「物理世界」。

Gemini 3 Pro可结合其推理能力更好地理解物理世界。

其中一项关键能力是指向坐标,即通过输出像素级坐标,模型可精确指向图像中的某个位置。

比如,可以估计人体姿态或分析动作轨迹。

多个二维点串联起来,就能执行较复杂任务,这是2D图像迈向「世界模型」的关键一步。

此外,还有开放词汇指代,即模型能用开放词汇识别物体及其意图。

例如在机器人领域,用户说桌子很乱,帮我设计一个垃圾分类的整理步骤。

模型不仅可以看到「物体」,还知道什么是垃圾,哪些要分类,应该如何整理它们。

这一能力也延伸至AR/XR设备,用户可请求AI助手「根据用户手册指出螺丝的位置。」




左右滑动查看

屏幕理解

Gemini 3.0 Pro的空间能力在理解桌面与移动设备界面时表现尤为突出,让计算机使用型智能体更加可靠,可自动化许多重复任务。

屏幕理解还能支持QA测试、用户上手指导及UX分析。

视频理解

视频是最复杂的数据形式:信息密集、变化快速、多模态且背景丰富。Gemini 3 Pro在视频理解上迈出巨大一步。

其中一个核心能力是高帧率理解,经优化后,模型在高于1 FPS的取样下能更好地理解物体的快速运动。

例如以10 FPS处理视频,Gemini 3 Pro可以捕捉每一次挥杆动作和重心转移,从而支持深入的运动机理分析。

此外,「思考模式」下的视频推理,能够让模型跟踪复杂的因果关系。

不仅能「看到发生了什么」,还能理解「为什么发生」。

甚至能把长视频总结成可执行的应用程序。

视频不再是内容,而是知识源。

  • 文档理解,让AI不仅可以识别字,更能理解内容;

  • 空间理解,让AI可以理解三维世界;

  • 屏幕理解,让AI可以看懂手机电脑屏幕正在发生什么;

  • 视频理解,让AI看懂视频里的动作、原因和逻辑。

Gemini 3 Pro让AI第一次像一个「真正能看懂世界的人」一样工作。

如果说GPT-4开启了「语言智能」时代,那么Gemini 3 Pro正在开启一个视觉与行动智能时代。

AI不再只会说话,而是开始理解世界。

ChatGPT增速放缓,Gemini快速追赶

在互联网和AI行业,同样遵循「飞轮效应」的经典模型,而用户始终居于「飞轮效应」的核心位置。

谷歌正是靠着这个原则,才筑起了搜索帝国。

每一次搜索、每一次点击,都会反哺它的反馈循环:用户行为改进排序系统,排序系统让结果更好,结果更好又吸引更多用户。

时间一长,飞轮形成的正向循环就形成了难以攻破的护城河。

根据市场情报公司Sensor Tower的最新数据,ChatGPT的增长势头正在趋缓。

尽管它仍稳居行业第一,在移动端全球下载量中占50%,在全球月活用户中占55%,但Gemini正在快速追赶,在下载增速、月活增速以及用户使用时长增速方面全面超越ChatGPT。

从趋势上看,在用户数量和活跃度等方面,Gemini正在缩小与ChatGPT的差距。

截至2025年11月,ChatGPT的全球月活同比增长180%,而Gemini同比增长170%。


新数据显示,ChatGPT的月活在8月到11月之间仅增长约6%,达到约8.1亿。

Sensor Tower表示,这可能意味着ChatGPT正逐渐接近市场饱和。

相比之下,Gemini的全球月活在同期跃升约30%,主要受其新图像生成模型Nano Banana推出后带来的用户激增影响。

报告还指出,在美国Android用户中,通过系统内置Gemini使用服务的人数,是使用独立Gemini应用的两倍。

这可能让Google在全球市场形成优势,因为Android占据主导地位,意味着Gemini不再受限于移动App或网页端使用。

在与ChatGPT、Copilot、Claude、Perplexity和Grok等应用的对比中,Gemini在整个市场的月活份额也在提升。

该机构估算,过去七个月(5月至11月),Gemini的全球月活市占率提升了3个百分点。

相比之下,ChatGPT的全球月活市占率在过去四个月(8至11月)下降了3个百分点。

来自Perplexity和Claude等竞品的压力也愈发明显。


这两款产品在2025年均迎来三位数增长:Perplexity同比上涨370%,Claude同比上涨190%。

ChatGPT截至11月的全球下载量同比增长85%,但仍落后于AI应用整体110%的平均增长速度。

其中,Perplexity与Gemini的下载量增速最高,分别达到215%和190%的同比增长。

此外,Sensor Tower表示,Gemini用户的日均使用时长在过去几个月翻倍增长。

截至11月,Gemini用户日均使用时长达到11分钟,比3月增长120%,很可能是受9月上线的图像生成模型Nano Banana的带动。

同期ChatGPT用户的日均使用时长仅增长6%,且与7月相比,11月的使用时长下降了10%。

虽然目前的数据表明Google正在逼近市场领头羊,但其近期的大部分增长主要来自Nano Banana的成功。

OpenAI还有胜算吗?

庞大的用户基数,以及对用户心智的占领,一直是OpenAI强大的护城河,也是它领先其他竞争对手的重要资本。

因此,OpenAI能否在与谷歌的竞争中取胜,一个重要的指标就是看能否守住用户基数上的优势。

前段时间,OpenAI把摊子铺得有点太大,势必会放缓在模型产品上的迭代速度。

当面对Gemini 3、Claude Opus 4.5等模型在benchmark(基准测试)中突出表现时,必然会造成OpenAI用户的流失。

用户在选择大模型时,更多是看模型的性能和体验,而不是考虑用户忠诚度。

前段时间,Salesforce CEO马克·贝尼奥夫曾表示,在上手了Gemini 3两小时后,立刻就抛弃了用了近三年的ChatGPT。


这才是真正让奥特曼担心的地方。

就在前几天,奥特曼在致员工的备忘录中发出「红色警报」,称要把精力拉回到提升ChatGPT上,其他优先级不高的项目暂时往后放。

现在,每周有接近十亿的人在使用ChatGPT,庞大的用户规模使得OpenAI拥有了一个前所未有的窗口,去洞察人类的意图、好奇心和决策方式。

每个提示词、每段对话,都能被喂回模型训练、评估和强化学习,进一步强化这个可能是全球最强的AI反馈循环。

而奥特曼的「红色警报」核心,就是要保护这个优势。

如果ChatGPT变得更好用,人们用它的频率就会更高,使用越多循环越强,循环越强产品又会变得更好——一个不断自我加速的飞轮效应。

这也是OpenAI抵御谷歌进攻的强大堡垒。

如今,Gemini 3已经吸引了一波用户,OpenAI强大的堡垒已经有了一些松动的迹象。

在这个节骨眼上,如果ChatGPT的质量有波动,或者界面变得杂乱,用户跳去谷歌就更容易了。

此前,就不断有用户对OpenAI在其产品中推送商品信息的行为表示反感。


因此,就在外部紧盯OpenAI财务状况的时候,奥特曼仍然决定先稳定自己的用户飞轮,把上线广告和赚钱的事情先放一放。

目前,OpenAI把希望押在新模型的发布上,以推动ChatGPT再次加速增长。

但AI的投入成本极高,OpenAI已经承诺要投入数千亿美元来建设基础设施,把ChatGPT推向真正的全球规模。

因此,商业化的事情也不能一直拖着。

先通过聚焦ChatGPT稳住用户的基本盘,然后再探索广告商业化机会,正是奥特曼在强敌压境之下的重要考量。

如今,相比较OpenAI,Google在模型上已经赶上,在芯片、产品矩阵、商业化能力等方面不断巩固优势。

奥特曼是否能有机会让Google再次拉响「红色警报」,可能要看新模型「Garlic」推出后的市场反应了。

参考资料:

https://www.businessinsider.com/ai-godfather-geoffrey-hinton-google-overtaking-openai-2025-12

https://blog.google/technology/developers/gemini-3-pro-vision/

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
维修资金成了“提款机”?上海一小区物业被曝疯狂敛财:1.3万修个插头 300元椅子敢报1000

维修资金成了“提款机”?上海一小区物业被曝疯狂敛财:1.3万修个插头 300元椅子敢报1000

闪电新闻
2026-05-11 18:42:48
2026年NBA选秀预测:奇才状元选Dybantsa

2026年NBA选秀预测:奇才状元选Dybantsa

篮坛第一线
2026-05-12 07:07:25
明知是饮鸩止渴,唐朝为何非要搞节度使?

明知是饮鸩止渴,唐朝为何非要搞节度使?

舆图司马
2026-05-10 21:00:03
停止焦虑最好的办法,不是读书,不是运动,而是……

停止焦虑最好的办法,不是读书,不是运动,而是……

壹心理
2026-04-19 11:03:36
万科最值钱的资产浮出水面

万科最值钱的资产浮出水面

36氪财经
2026-05-11 19:03:06
曹德旺关闭8.84亿美厂:美国不讲理,不再陪玩

曹德旺关闭8.84亿美厂:美国不讲理,不再陪玩

最新声音
2026-05-07 07:04:47
整治了20年,网游工作室为何屡禁不止?

整治了20年,网游工作室为何屡禁不止?

17173游戏网
2026-05-09 16:06:29
牛津中国留学生当选辩论社主席即被罢免?“冒名投票”风波引爆舆论

牛津中国留学生当选辩论社主席即被罢免?“冒名投票”风波引爆舆论

最英国
2026-05-10 18:06:41
赵露思泰国演唱会,穿三角裤大玩性感,腿上纹身,尺度不比Lisa低

赵露思泰国演唱会,穿三角裤大玩性感,腿上纹身,尺度不比Lisa低

嫹笔牂牂
2026-05-12 07:12:55
曝湖南一小区业主私挖地下室成三室一厅,当地住建局回应:将多部门联动进行现场复查

曝湖南一小区业主私挖地下室成三室一厅,当地住建局回应:将多部门联动进行现场复查

大象新闻
2026-05-11 14:46:08
高市早苗好狠:赶在特朗普访华前,给了他一刀,连中国都没想到!

高市早苗好狠:赶在特朗普访华前,给了他一刀,连中国都没想到!

老范谈史
2026-05-11 11:29:39
赛前狂言赛后沉默!日本集体破防,国乒两场逆转撕碎57年金牌梦

赛前狂言赛后沉默!日本集体破防,国乒两场逆转撕碎57年金牌梦

林子说事
2026-05-11 16:13:04
极速变脸!张本智和赛前:要跟中国队算总账 赛后:2年后再算账吧

极速变脸!张本智和赛前:要跟中国队算总账 赛后:2年后再算账吧

风过乡
2026-05-12 07:38:44
斯诺克巨星邀请赛:小特不败夺冠!进账462万奖金,吴宜泽险垫底

斯诺克巨星邀请赛:小特不败夺冠!进账462万奖金,吴宜泽险垫底

刘姚尧的文字城堡
2026-05-11 07:57:47
莱温斯基:1995年,我的蓝裙子被总统克林顿脱下,就在白宫办公室

莱温斯基:1995年,我的蓝裙子被总统克林顿脱下,就在白宫办公室

史不语
2026-05-06 08:50:06
梁靖崑:嫁人就嫁梁甜甜!有颜有钱疼老婆,老婆看决赛绝对不能输

梁靖崑:嫁人就嫁梁甜甜!有颜有钱疼老婆,老婆看决赛绝对不能输

阿废冷眼观察所
2026-05-11 18:11:26
不再藏着掖着让人猜了! 中国自由泳天后和蛙泳世界名将恋情公开

不再藏着掖着让人猜了! 中国自由泳天后和蛙泳世界名将恋情公开

威猛孟巍
2026-05-11 01:44:19
大伯出狱全家没人接,我开车去接他,他偷偷塞我一张卡说有1200万

大伯出狱全家没人接,我开车去接他,他偷偷塞我一张卡说有1200万

千秋文化
2026-05-09 20:08:48
手机顶部出现这4个图标,马上关机!你的手机可能正在被人控制

手机顶部出现这4个图标,马上关机!你的手机可能正在被人控制

职场资深秘书
2026-05-10 13:51:21
国民党副主席张荣恭:中华文化一直是台湾,台湾人也是堂堂正正的中国人

国民党副主席张荣恭:中华文化一直是台湾,台湾人也是堂堂正正的中国人

海峡导报社
2026-05-12 07:16:03
2026-05-12 09:20:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15185文章数 66864关注度
往期回顾 全部

科技要闻

纳德拉法庭爆料:拒当“AI时代的IBM”

头条要闻

牛弹琴:特朗普要来了 可以肯定这不是一次寻常的访问

头条要闻

牛弹琴:特朗普要来了 可以肯定这不是一次寻常的访问

体育要闻

梁靖崑:可能是最后一届了,想让大家记住这个我

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

特朗普要来了,我们且淡定

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

家居
健康
时尚
艺术
公开课

家居要闻

多元生活 此处无声

干细胞能让人“返老还童”吗

推广|| 你们都想要的绝美白衬衫,链接来了!

艺术要闻

江青早年电影照曝光,手稿惊艳引热议。

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版