网易首页 > 网易号 > 正文 申请入驻

谷歌看了都沉默:自家「黑科技」火了,但为啥研发团队一无所知?

0
分享至

  

  新智元报道

  编辑:KingHZ

  【新智元导读】当整个科技圈都在为「谷歌黑魔法」集体高潮时,真相恐给了所有人一记耳光。那套被捧上神坛的「并行验证循环」,不过是社交网络上AI生成的「赛博跳大神」。

  如果说之前的AI模型是在模拟人类的思考,那么Gemini 3 Flash就是在模拟人类的「直觉」。

  3倍于Gemini 2.5 Pro的速度,却拥有超越Pro级的推理能力。

  更离谱的是,它的智力竟然在某些基准测试超越了自家的Pro大哥。

  

  但目前为止,依然没人能说明白:Flash凭为什么比Pro还要「聪明」。

  谷歌DeepMind到底有啥黑魔法?

  「林子打了,什么鸟都有」,以至于X上网友Jainam Parmar爆料:

  AlphaGo团队根本不使用思维链。

  他们采用并行验证循环机制。

  这套方法正在碾压你听说过的所有「高级推理」技术。

  

  成千上万的网友浏览过这个帖子。

  这靠谱吗?这有没有可能是「以讹传讹」、用AI生成的「假新闻」?

  如果是假新闻,难道只是因为「DeepMind碾压同行的推理」这样的噱头吗?

  

  我们先看一下推文到底讲了啥。

  谷歌DeepMind的黑科技?

  首先,这位「万能的网友」直击CoT命门,解释了为什么Chain-of-Thought很糟糕。

  当前的AI推理是线性的:

  思考步骤1→步骤2→步骤3。

  但这并不是专家级问题解决者的思维方式。

  然后,他写道:「DeepMind分析了他们的AlphaGo团队是如何应对复杂问题的,结果发现了一件非常惊人的事情。」

  

  并行验证循环(Parallel Verification Loops):

  专家型思考者并不会沿着一条冗长的推理链一路走到底,而是同时运行多个验证循环。

  他们会提出一个解决方案,用约束条件去检验它;必要时回退;同时探索其他可能的路径——这些过程是并行发生的。

  而Chain-of-Thought做不到这一点。

  

  架构上的差异(The ArchitectureDifference):

  传统的思维链:A→B→C→D(线性)

  DeepMind的框架:A→[B1,B2,B3]→分别验证→精炼→迭代

  这就好比是在一条路上一直往前走,而另一种方式则是同时探索整棵决策树。

  

  结果非常夸张:

  在复杂推理基准测试中:

  相比标准的Chain-of-Thought,性能提升37%

  捕捉逻辑错误的能力提升52%

  收敛到正确解的速度快了3倍

  这不是小幅优化,而是架构层面的飞跃

  

  它实际是如何运作的

  步骤1:同时生成多个候选解决方案

  步骤2:每个方案各自运行一套验证循环

  步骤3:不同方案之间进行交叉验证

  步骤4:剪除较弱的分支,强化更有潜力的路径

  步骤5:持续迭代,直到收敛

  

  自我纠错优势:

  这才是杀手级特性:系统在给出最终答案之前,就能发现并纠正自己的错误。

  传统的CoT(思维链)是按步骤顺序「提交」的,只要其中一步出错,后面就全盘皆输。

  而并行验证允许在不中断整体流程的情况下回溯和修正,而不必从头再来。

  

  对训练方式的影响:

  他们不只是测试了这种方法,而是直接用这一框架来训练模型

  模型学会了:

  提出多个假设

  让这些假设相互检验

  通过验证逐步建立置信度

  尽早剪除错误或低质量的推理路径

  

  现实世界中的应用:

  这一框架在以下场景中表现尤为强大:

  数学证明(一步出错,整体就会崩塌)

  代码调试(可能同时存在多个潜在Bug)

  战略规划(需要探索复杂的决策树)

  科学推理(假设提出与验证)

  凡是正确性优先于速度的地方,它都具备压倒性优势。

  

  如果你正在构建AI智能体或推理系统,Chain-of-Thought已经过时了。

  未来属于并行验证(Parallel Verification)

  生成多条路径。

  对它们进行测试。

  让最优解自然浮现。

  这正是AlphaGo击败世界冠军的方式。

  这也是推理真正运作的方式。

  疑点重重,被AI袭击的一天?

  在这些描述中,「并行验证」简直就是为数学证明和代码调试量身定制的终极武器。

  凡是追求正确性的场景,它似乎都能实现降维打击。

  这套理论听起来是不是太完美了?简直就像是DeepMind真的把人类直觉代码化了一样。

  但恰恰是这种「过度的完美」和「极具煽动性」的文风,引起了业内人士的警觉。

  当成千上万的网友还在为这套「黑魔法」转发点赞时,冷静下来的人们开始追问一个最基本的问题:

  这套东西,到底是谁说的?

  发帖的Jainam Parmar,也不是什么AI研究领域的大牛,也不是谷歌DeepMind的员工。

  他也没有明确给出DeepMind的可信的源链接。

  他说的靠谱吗?

  即使DeepMind放缓发布世界知名的研究成果,以便在AI竞赛中赢得先机。

  

  但DeepMind仍在发布他们的研究成果。

  

  去年11月初,谷歌DeepMind团队还发布了号称解决「可持续学习」难题的新的机器学习范式──嵌套学习(nested learning)。

  

  原推文那种藏头露尾、吊人胃口的写作风格,令人不喜,甚至部分网友怀疑,帖子压根就是大模型生成的!

  

  熟悉DeepMind研究工作的网友,则认为帖子在故弄玄虚,甚至歪曲原意!

  

  

  更有网友毫不客气地指出,发帖人就是蹭热度,半年前他还在鼓吹「CoT就是下一代推理技术」。

  

  

  

  还有更关键的证据,之后,另一网友Chris Laub发布了一模一样的内容:

  

  帖子底下,也有网友怀疑,这就是诱导人点击的AI垃圾!

  

  

  

  事实上,CoT早不是什么先进技术。

  长思维链和短思维链截然不同。

  长思维链,有三大关键特征: 深度推理、广泛探索和可行的反思。

  这些特征使得模型能够处理更复杂的任务,并且与较浅的短思维链相比,产生更高效、更连贯的结果。

  

  回到问题本身:Gemini 3Flash 到底凭什么更聪明?

  至少目前,没有任何可靠证据表明DeepMind已将「并行验证循环」作为核心推理框架,全面取代Chain-of-Thought。

  相反,这场风波更像一次典型的 AI 舆论实验—— 当模型表现出现异常跃迁,人们总是更愿意相信「黑魔法」,而不是渐进式优化。

  真正值得警惕的,也许不是CoT是否过时,而是我们是否过度迷信单一解释

  推理的未来,未必只有一条路,但谣言,往往只需要一条推文。

  参考资料:

  https://github.com/LightChen233/Awesome-Long-Chain-of-Thought-Reasoning

  https://x.com/iruletheworldmo/status/2007550905177256071

  https://x.com/aiwithjainam/status/2005629090943193552

  https://x.com/ChrisLaubAI/status/2006668516280197287

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
先导智能成为苹果OPPO供应链:一场围绕折叠屏的价值估算

先导智能成为苹果OPPO供应链:一场围绕折叠屏的价值估算

速说科技
2026-04-17 17:11:09
如果你现在手里有100万,只能选一个方向放上10年,你会怎么选?

如果你现在手里有100万,只能选一个方向放上10年,你会怎么选?

流苏晚晴
2026-04-19 20:42:00
回国之后才敢说:真实的越南,部分中国人去了简直就是一个小白鼠

回国之后才敢说:真实的越南,部分中国人去了简直就是一个小白鼠

番外行
2026-03-22 00:05:09
1987年毕彦君和陈晓旭的合照:一个剑眉星目,一个清冷淡雅

1987年毕彦君和陈晓旭的合照:一个剑眉星目,一个清冷淡雅

观察鉴娱
2026-04-18 10:01:53
2300一吨,5年收了3万吨!日本狂收东北落叶,24年专家揭露真相

2300一吨,5年收了3万吨!日本狂收东北落叶,24年专家揭露真相

福建平子
2026-02-05 16:37:30
赖清德背后主子浮出水面,大陆擒贼先擒王,誓要斩断幕后黑手!

赖清德背后主子浮出水面,大陆擒贼先擒王,誓要斩断幕后黑手!

琴琴有氧运动
2026-04-19 09:53:39
刘德华罕见谈14岁女儿

刘德华罕见谈14岁女儿

鲁中晨报
2026-04-19 08:52:10
国家一级女演员陈丽云被逮捕!

国家一级女演员陈丽云被逮捕!

许三岁
2026-03-28 09:24:30
手撕薛之谦反被抓,李雨桐被行拘10天,这是先把自己送进去了!

手撕薛之谦反被抓,李雨桐被行拘10天,这是先把自己送进去了!

毒舌八卦
2026-04-19 20:44:39
30分+30分+36分!这才是被严重低估的顶级大外援,下赛季身价暴涨

30分+30分+36分!这才是被严重低估的顶级大外援,下赛季身价暴涨

老叶评球
2026-04-19 16:45:48
火箭没杜兰特真不行!多出手27次仍输球,无牵制点后没一个能进的

火箭没杜兰特真不行!多出手27次仍输球,无牵制点后没一个能进的

篮球资讯达人
2026-04-19 11:52:39
最先喊出全面停售,长安汽车这条路还要走多久?

最先喊出全面停售,长安汽车这条路还要走多久?

正经社
2026-04-17 16:03:24
张本兄妹改名风波再升级,韩媒强烈批评,这就是狠毒的创姓改称

张本兄妹改名风波再升级,韩媒强烈批评,这就是狠毒的创姓改称

有范又有料
2026-04-19 00:03:10
建议收藏!血压、血糖、血脂、尿酸标准对照表及忌口清单盘点

建议收藏!血压、血糖、血脂、尿酸标准对照表及忌口清单盘点

华医网
2026-04-06 05:42:56
她因长得漂亮,被日本兵拖进炮楼,一晚上遭受50多个鬼子的折磨

她因长得漂亮,被日本兵拖进炮楼,一晚上遭受50多个鬼子的折磨

凡人聊史
2026-04-11 03:06:57
爷爷生前录音赠孙女109万元遗产,六个姑姑不服要求平分,法院:录音无效,重新分配,患小儿麻痹症姑姑拿大头

爷爷生前录音赠孙女109万元遗产,六个姑姑不服要求平分,法院:录音无效,重新分配,患小儿麻痹症姑姑拿大头

鲁中晨报
2026-04-17 17:00:03
悲剧还是发生了!近日,安徽一女子同房后,肚子很疼,黄体破裂!

悲剧还是发生了!近日,安徽一女子同房后,肚子很疼,黄体破裂!

川渝视觉
2026-04-18 21:37:48
广州一男子养龙虾炒股月赔10万:暴瘦十几斤甚至想死

广州一男子养龙虾炒股月赔10万:暴瘦十几斤甚至想死

快科技
2026-04-19 17:17:30
Q女士爆料:张婉婷向她索要500万,不是赔偿,而是宋宁峰的转让费

Q女士爆料:张婉婷向她索要500万,不是赔偿,而是宋宁峰的转让费

娱文速递
2026-04-19 16:15:36
我陪寡妇王姐爬山,她小声说:你做我老公,我什么都给你

我陪寡妇王姐爬山,她小声说:你做我老公,我什么都给你

i书与房
2026-04-18 21:46:27
2026-04-19 21:27:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15012文章数 66787关注度
往期回顾 全部

科技要闻

50分26秒破人类纪录!300台机器人狂飙半马

头条要闻

半年下沉22厘米 女子家中坐拥价值上亿别墅却没法住人

头条要闻

半年下沉22厘米 女子家中坐拥价值上亿别墅却没法住人

体育要闻

湖人1比0火箭:老詹比乌度卡像教练

娱乐要闻

张天爱评论区沦陷!被曝卷入小三风波

财经要闻

华谊兄弟,8年亏光85亿

汽车要闻

29分钟大定破万 极氪8X为什么这么多人买?

态度原创

艺术
时尚
游戏
亲子
教育

艺术要闻

俄罗斯画家季莫申科 小幅风景油画写生(二)

装修“精神角落”,就是这么上瘾

LCK第二阶段:NS三局战胜BRO,积分榜力压对手

亲子要闻

也不晓得哪里学来的

教育要闻

高考综合改革成绩突出!绵阳5家单位、12名个人获得表彰

无障碍浏览 进入关怀版