网易首页 > 网易号 > 正文 申请入驻

【关注】胡延平:Gemini 3释放了12个信号——打脸怀疑论,渐进范式也可以逼近AGI?

0
分享至




在模型底层原理(Transformer-Difussion-Mamba等)、智能的数学世界观等层面,以及进一步面向以融合感知、持续学习、内生自主为基础的认知与行为智能等方面,存在着范式变革的需求。

本文作者系
盘古智库学术委员、
上海财经大学特聘教授、智能科技产业与智能经济研究学者
胡延平,
文章来源于“
胡延平研思小笔记

本文大约2100字,读完约5分钟。


在Yann LeCun、Richard Sutton等声称现有技术方向死路一条的时候,在多方认为范式效率陷入停滞的时候,Gemini 3以智能水准的显著跃升打脸了怀疑论。

都知道Google动静不会小,只是没想到这次憋出来的有点大:ARC-AGI-2、Humanity’s Last Exam、ScreenSpot-Pro等新型基准测试成绩数倍于GPT-5.1,提升幅度之大远超挤牙膏的OpenAI,有Google提前发布了GPT-6的即视感。AIME 2025更是得到了100%的满分。

试用和讨论过程中,提炼出Gemini 3释放的12个信号:

1.代码、视觉理解、数学、智能体、工具利用等构成能力内核,智能水准走向可用的交付而不是尚未闭环的生成,尤其代码通则智能通;

2.AIME 2025(美国数学邀请赛)是个有点普通的基准,但测试满分可以理解为AGI的第一个预演。AGI有没有到来,关键看如何定义AGI。一直认为AGI不是只有一个时点、一个刻度。AGI是从多方面分无数次到来的。从知识到推理,从问答到感知和行动,从AGI到ASI,测试机构和业界始终在前移路标,但是如果路标一直上调标准,意味着AGI始终难以到达。

3.数据-算法-算力-能源、Transformer-LLMs-MLLMs-Agent-Tools的范式即使不颠覆,渐进发展下去也可以逐步逼近AGI。

4.芯片-操作系统-浏览器-云平台-大模型-智能体-软件-Apps-开发生态-亿万用户,全栈-全生态能力不仅有利于竞争,也有利于做出更高水准的智能。

5.Gemini 3在ARC-AGI-2、Humanity’s Last Exam等更具挑战的创新基准测试中,一骑绝尘的表现尤其增强了业者的信心和希望,不仅Scaling Law继续有效,网络效应、规模奇点、整体最优等生态法则也在起作用;Scaling Law不是成效显著衰减了,而是潜力才刚开始释放;缺乏足够的低成本算力、缺少用之不尽的高质量训练数据以及被电力问题搞得焦头烂额,至少部分原因其实不是智能范式的锅,是大模型的creator们资源实力有限的错。

6.超级平台和超级智能合体对打造强智能来说是好事,但是对防止生态极化和生态依附没有好处,头部人工智能企业的强者恒强、赢者通吃、虹吸效应、生态失衡等发展特征越来越明显。打造了Transformer的Google王者归来意味着OpenAI-Microfost联盟(超级智能+超级平台)多了一个竞争对手,但Google仍然是AI极化发展趋向的一部分,超级智能和超级平台在Google这里天然是一体的。

7.如果说之前2和2.5版本的Gemini只是对GPT产生冲击,Gemini 3意味着Google生态实力对OpenAI的地位构成动摇。OpenAI真正的劲敌不是Anthropic,接下来围绕OpenAI融资、估值、上市的一系列过程,必然跌宕起伏变化多端。此前这个势头从原生多模态、Veo等多个技术和产品节点已经初现端倪。不过试用比较Gemini 3 Pro和GPT-5.1的Deep Research,GPT-5.1还是有肉眼可见的优等生即视感。模型之间真正的比拼不在常规问答,在Deep Think、Deep Research等“深”水区域,真实水准往往在200美元左右而不是20美元左右的账户里使用才能够比较出来。然而即使如此,Gemini 3还是会让OpenAI的压力山大,GPT-5.5、GPT-6只可能加快节奏。

8.奥特曼称GPT-6会显著优于GPT-5,尤其记忆方面;不过Gemini 3力证了业界的一个基本共识,比较现实且高ROI的智能水准提升途径,是智能体、工具、代码等方面的生态协同,模型要么将Agent与工具等能力内化,要么对Agent与工具调用有更好的支持,而只有更好的内化才会有更好的支持。

9.Gemini 3主要是范式的渐进,不过也有能力的突变,否则不会多项基准表现大幅度跃升。更为复杂的深度推理成为亮点,是强化学习、思维链有新进展?还是有创新的方法?有待继续观察。

10.使用自家TPU而非GPU训练和推理,Gemini可以称之为非英伟达生态也能走出来的一个成功范例,其它非英伟达生态由此增添了一些想象力。

11.题外话,DeepSeek奇迹再次复现的概率不大,因为AI生态的竞争游戏不再是单点突破,而是整体的生态推进能力。

12.另一个题外话,去年乌镇峰会期间主持AI OS讨论时我曾经问过一个问题,安卓生态App向鸿蒙生态的迁移主要靠堆工程师且bug比较多,是不是可以用专门训练的代码能力较强的AI大模型来做编译转换。今年乌镇峰会期间再次主持的时候,没好意思再提这个问题。走到随Gemini 3一起发布的Antigravity开发平台这一步,至少大量相对简单的长尾安卓App,未来通过“标准+模型+工具+人工”,一键迁移到鸿蒙生态其实越来越接近可行。简而言之,鸿蒙生态化出现的卡顿,其实也显示了AI能力的不足。

重复之前答媒体问时的观点,LeCun等所谓死路,其实不是死路,而是要走的路,至少是其中一条路,而且是必经的路,并且是已经走通的路。怀疑论认为是未来之路的路,目前还没有究竟,目前所谓世界模型其实主要是基于视觉的空间智能或时空智能,真正的世界模型还比较遥远。倒是在模型底层原理(Transformer-Difussion-Mamba等)、智能的数学世界观等层面,以及进一步面向以融合感知、持续学习、内生自主为基础的认知与行为智能等方面,存在着范式变革的需求。■




文章来源于“胡延平研思小笔记”微信公众号

图文编辑:张洵

责任编辑:刘菁波

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
在钢铁与梦想之间:一名女销售的无声叙事

在钢铁与梦想之间:一名女销售的无声叙事

疾跑的小蜗牛
2025-12-24 13:31:39
146分+24记三分!绿军造31分惨案,布朗刷爆NBA纪录,快船太难了

146分+24记三分!绿军造31分惨案,布朗刷爆NBA纪录,快船太难了

世界体育圈
2026-01-04 15:47:36
它是止咳第一名,放到锅中蒸一蒸,轻松排出黄痰,做法真的很简单

它是止咳第一名,放到锅中蒸一蒸,轻松排出黄痰,做法真的很简单

江江食研社
2025-12-11 10:30:10
曼城稳步前行,英超调查已成“烂尾剧”?

曼城稳步前行,英超调查已成“烂尾剧”?

乐道足球
2026-01-04 17:17:17
存取现金超5万元不需再登记体现对个人尊严的尊重

存取现金超5万元不需再登记体现对个人尊严的尊重

第一财经资讯
2026-01-03 15:39:18
司晓迪事件最全瓜!檀健次私下是舔狗,林更新爱约,张一山最大方

司晓迪事件最全瓜!檀健次私下是舔狗,林更新爱约,张一山最大方

萌神木木
2026-01-03 11:40:35
朝鲜战争中,美军原本已接近击败中国,却碰上了中国决死的师长

朝鲜战争中,美军原本已接近击败中国,却碰上了中国决死的师长

兴趣知识
2025-12-18 01:04:23
“准切尔西新帅”:现在还无事发生

“准切尔西新帅”:现在还无事发生

体坛周报
2026-01-04 17:23:12
马杜罗被抓,“幕后主使”现身,委内瑞拉二号人物对美提一要求

马杜罗被抓,“幕后主使”现身,委内瑞拉二号人物对美提一要求

可乐谈情感
2026-01-04 15:43:11
马云预言兑现?2026年手上还握有存款的人,别忽视这三大现实

马云预言兑现?2026年手上还握有存款的人,别忽视这三大现实

来科点谱
2025-12-29 09:01:09
立即撤离!特朗普的一纸通牒,把普京残存的最后幻想浇了个透心凉

立即撤离!特朗普的一纸通牒,把普京残存的最后幻想浇了个透心凉

探史
2026-01-04 15:35:08
刘涛元旦晒美照,眼镜配黑色毛衣,知性又优雅!

刘涛元旦晒美照,眼镜配黑色毛衣,知性又优雅!

农城浪子
2026-01-04 15:56:46
特朗普下令抓走马杜罗,梅德韦杰夫表态:只有核武库才能保证安全

特朗普下令抓走马杜罗,梅德韦杰夫表态:只有核武库才能保证安全

混沌录
2026-01-04 16:34:08
格林吃T!库里20分率勇士逆转爵士,马尔卡宁35分空砍

格林吃T!库里20分率勇士逆转爵士,马尔卡宁35分空砍

小齐艰难度日
2026-01-04 16:42:38
留洋最强战!韩旭狂轰30+15创新高 爆冷输鱼腩终结7连胜吞首败

留洋最强战!韩旭狂轰30+15创新高 爆冷输鱼腩终结7连胜吞首败

醉卧浮生
2026-01-04 12:28:12
中美彻底变天了?中方正式向全世界宣布,禁止美军该项合作

中美彻底变天了?中方正式向全世界宣布,禁止美军该项合作

花花娱界
2026-01-03 20:23:38
媒体票选2025最佳女乒运动员:王曼昱5976票领跑,陈梦暂居第二

媒体票选2025最佳女乒运动员:王曼昱5976票领跑,陈梦暂居第二

乒谈
2026-01-03 17:49:39
1985 年,许世友途经济南,专门提出要见迟浩田,开口便说:“帮忙找下九纵烈士墓在何处”

1985 年,许世友途经济南,专门提出要见迟浩田,开口便说:“帮忙找下九纵烈士墓在何处”

清风鉴史
2025-12-21 17:07:20
不敢相信!中国游客的日本住宿预订量,在春节期间同比增加六成!

不敢相信!中国游客的日本住宿预订量,在春节期间同比增加六成!

奇思妙想草叶君
2026-01-04 11:48:00
贾国龙摊牌了:若西贝活不下来,绝不会再创业,和夫人回草原养羊

贾国龙摊牌了:若西贝活不下来,绝不会再创业,和夫人回草原养羊

削桐作琴
2025-12-26 23:57:15
2026-01-04 17:40:49
盘古智库 incentive-icons
盘古智库
盘古智库官方账号
5642文章数 9846关注度
往期回顾 全部

科技要闻

独家|宇树科技上市绿色通道被叫停

头条要闻

2026年新年首个工作日 中纪委连打4“虎”

头条要闻

2026年新年首个工作日 中纪委连打4“虎”

体育要闻

球队陷入危难,一名44岁教练选择复出打球

娱乐要闻

《小城大事》上星央八 热血筑梦正当时

财经要闻

委内瑞拉变局对原油美元黄金的连锁冲击

汽车要闻

最高续航310km 岚图泰山8或将上半年发布

态度原创

时尚
健康
游戏
旅游
军事航空

伊姐元旦热推:电视剧《剥茧》;电视剧《玉茗茶骨》......

这些新疗法,让化疗不再那么痛苦

国产ARPG单机大作招新人!月薪1万-1.5万

旅游要闻

凤阳县2026元旦大明文化巡游启幕 沉浸式解锁千年古都新年味

军事要闻

美军突袭抓获马杜罗 三个细节值得关注

无障碍浏览 进入关怀版