网易首页 > 网易号 > 正文 申请入驻

Google 首席 AI 架构师:Gemini 逆风翻盘的18个关键

0
分享至


如果不是亲耳听到,很难想象一家科技巨头会在镜头前承认:“两年半前,我们远远落后了。”在这次访谈里,DeepMind CTO、Google 首席 AI 架构师 Koray Kavukcuoglu 罕见地拆开了过去两年 Google 的真实处境——不是领先、不是规模,而是被时代加速甩在身后、再一点点追上来的过程。

他没有炫耀参数,也没有谈模型的“神迹”,而是把重点放在更底层、更残酷的问题上:一家全球最强的 AI 实验室,如何在巨大的惯性中重新学会创新、学会工程化、学会组织协作、学会把技术真正变成产品?

Gemini 的故事只是表层。真正发生变化的,是 Google 这家公司的骨架与节奏。


原文访谈链接:
https://www.youtube.com/watch?v=fXtna7UrL44

以下是根据访谈实录整理的关键议题,希望也能帮你更清晰地读懂 Google 的这次“重构”。

1

一、真正的起点不是突破,而是承认自己落后了

访谈中最刺耳也最重要的一句话,出现在结尾:

“当 Gemini 项目开始时,我们离最先进水平还很远,那是一个追赶。”

这句话标志着一个巨大的认知转折:Google 承认自己在 LLM 起跑线上是真正的落后者。不是“状态不好”这种轻描淡写,而是“远远落后”。这意味着 DeepMind 必须抛弃此前十年建立的自信,从最基础的用户使用场景重新学习。

而这种承认,是一切变化的源头。Koray 在访谈里反复强调:真正的转折不是某个新技术,而是 Google 接受自己必须重新建立训练方式、产品方式、工程方式以及组织方式

1

二、为什么中国用户最先明显感觉到 Gemini 变好了?

访谈一开始,主持人提到一个特别中国的反馈:Gemini 3 在中国用户中被形容为“像 Windows XP 一样稳定好使”。Koray 很有兴致地解释,这不是模型本身突然“智商暴涨”,而是 Google 终于把“模型 × UI × 任务链路”统一到了一起。

以前的大模型“聪明”,但不“好使”。而 Gemini 3 的转折来自:

  • 用户界面更直觉

  • 任务拆解更稳定

  • 模型更能理解人类意图

  • 产品团队从训练阶段就介入模型设计

  • 真实用户使用数据可以直接反哺训练

换句话说,Google 终于开始像一家做产品的公司在做大模型。这是 Gemini 3 变化最直观的原因,也是中国用户最先体会到的原因。

1

三、Benchmark 正在失效,但真实世界永远不会

外界批评 Google 的 benchmark 成绩起伏不定,但 Koray 的解释很罕见地触及本质:主流 benchmark 正在靠近它们的自然上限。GPQA、ARC-AGI 等“智商题”已经被模型顶住,HLE 这种曾经难得离谱的测评如今也能“持续提升”。

Benchmark 会枯竭,但真实世界不会。学生写作、科学研究、专业翻译、复杂跨语境对话、跨语言表达……这些场景永远无法被一个固定测试集穷尽。Google 把模型的最终价值从“得分”转向“能不能帮人完成任务”。这是 Gemini 的第一性原理转变。

1

四、Gemini 3 的核心不是智力提升,而是让模型“能干活”

从 Gemini 3 开始,Google 清晰确立了三个优先级最高的能力方向。

第一是 指令遵从。模型要能“无二义性地理解和执行用户的真实意图”。这对用户体验影响巨大,比提升推理指标更重要。

第二是 国际化能力。Google 的用户覆盖超过 200 个国家,“理解全球不同文化语境”成为模型能力的底层指标,而不是翻译能力的延伸。

第三是 工具调用与代码执行。这是未来智能体的基础,模型必须不仅能理解问题,还能执行任务、运行工具链、处理工程环境中的真实任务。

三者加在一起,构成了 Google 的 “Gemini 设计哲学”:智能不是来自“更聪明的对话”,而来自“更可靠的执行”。

1

五、为什么多模态强的 Google,起初 Agent 却不好用?

这是主持人问得最尖锐的问题,也是外界最想知道的矛盾。Koray 的答案意外朴素:研究员可以在实验室推动视觉理解,但 Agent 的任务不是研究员能想出来的,是用户逼出来的。

真正的 Agent 场景来自:

  • 创作者的任务链路

  • 学生的写作流程

  • 工程师的工具调用模式

  • 商业用户的复杂需求

也就是说,Google 走了一条与 OpenAI 不同的路径:不是“demo 优先”,而是“真实用户需求优先”。Agent 的能力不是靠酷炫演示驱动的,而是靠“让百万用户每天用”驱动的。

1

六、Google 真正的反超武器:模型、产品、工程第一次被统一

Koray 多次强调一个过去被低估的事实:Gemini 3 不是“模型团队”的胜利,而是“工程、产品、模型、安全”第一次从第一天就被捏在一起推进。

以往是:

  • 模型训练完了,产品团队接盘

  • 安全团队在最后做审核

  • 工程团队负责部署

而今天是:

  • 产品团队从训练最初就参与

  • 安全成为训练目标,而不是后置规则

  • 真实用户数据(AI Studio、AI Overviews、Anti-Gravity)直接反哺模型

  • 使用成本、延迟、推理路径都在训练阶段就被优化

Google 终于构建出了一个“模型 × 产品 × 工程”的统一体系。这是它在 2024–2025 年真正反超的结构性基础。

1

七、Nano Banana Pro 的突破不是“画图变好看”,而是“理解世界结构”

外界关注图像模型总是看“清晰度”、“风格”,但 Koray 在访谈中反复强调,真正的突破来自:

  • 理解 PDF、表格、图表等复杂文档结构

  • 具备结构化的视觉推理

  • 第一次能生成“概念一致的信息图”

一句值得记下的话是:

“当一个模型能把复杂概念准确地用一张信息图表达出来,你就能感受到真正的理解。”

这是多模态模型的真正价值,也直接指向 Agent 的未来能力。

1

八、多模态不是功能加法,而是真正的“世界模型”入口

Koray 给出了一个简洁但极具说服力的框架:

文本是线性的,视觉是空间的,音频是时序的。真实世界不是只靠线性序列能描述的。因此一个真正智能的模型必须同时具备三种感知维度。

这也是为什么 Google 在推进统一多模态模型上比任何公司都更加坚持——不是因为多模态“更炫酷”,而是因为它是理解世界的基础。

1

九、统一模型并不是“把视觉塞进语言模型”,而是一场架构革命

外界经常把“统一模型”理解成方向正确的趋势,但 Koray 的解释更具技术深度。他指出:文本和图像的输出结构根本不同——文本是一维的,图像是二维的。这意味着训练方式、损失函数、优化器、token 化方式都要重新发明。

统一模型不是“时代潮流”这么简单,而是 必须突破的工程极限。Google 的叙事没有浪漫,也没有玄学,只有工程难题。

1

十、DeepMind 的文化基因:谦逊、科学与大规模协作

这部分是整场访谈里最“人味”的地方。

DeepMind 的文化由三部分组成:

科学心态 —— 所有问题回到实验与学习,而不是路径依赖。
谦逊 —— 那句“我们不知道终极配方”不是客套,而是策略。
协作能力 —— 从 25 个人写论文到 2500 人一起推进单一模型。

在一个公司试图从科研转型为工程、从工程转型为产品的过程中,这种文化结构变得至关重要。

1

十一、规模是 Google 的最大难题,也是最大武器

Koray 承认:规模越大,一致性越难。但规模本身就是推进力。

Google 能够同时推进统一模型、多产品落地、跨部门协作、全球化数据管线、超大规模训练与部署,是因为它拥有世界上最成熟的基础设施链路。

过去两年,这条链路从“沉睡”变回“主力”,重启了 Google 的攻势。

1

十二、安全不是限制能力,而是训练能力

Google 与 OpenAI 在安全策略上最大的差异不是严格程度,而是方式:安全不是“训练后加过滤器”,而是“训练中学会安全”。

这是“让模型可靠”的关键,并且天然适配 Google 的基础设施规模。

1

十三、统一模型与专用模型不是路线争夺,而是成本优化

Koray 说得很实在:这不是意识形态问题,而是效率问题。未来一定会同时存在统一模型与专用模型,Google 的策略是用合适的工具做合适的任务,而不是坚持单一范式。

这种务实,是 Google 过去缺失、现在重新找到的品质。

1

十四、Google 的真正底气:基础设施的重新激活

“我们能成功,不是因为我们更聪明,而是因为基础设施足够强。”Koray 的这句话其实深刻揭示了大模型时代的一个底层事实——智能规模化不是靠天才,而是靠管线。

能训练、能部署、能迭代、能处理全球数据、能保持安全一致性的,是基础设施,而不是算法。

1

十五、Google 不相信有单一路径,也不相信“持续扩参”能走到终点

他说:

“我们不知道最终配方。”

这句话的潜台词是:

  • 扩参不是终局

  • 统一模型不是最终答案

  • 多模态不是最后形态

  • 未来模型的路线还远未定型

这种“带着不确定性继续前行”的姿态,反而比某些公司宣称的“xxx 是通往 AGI 的唯一路径”更具有长寿感。

1

十六、下一阶段的重点:推理、执行与真正的自主性

Gemini 3 的故事才刚开始。Google 的下一个目标是:

  • 深层推理

  • 多步任务执行

  • 在复杂场景中的鲁棒性

从“会回答”到“会行动”,这是整个行业的共同方向,但 Google 给出了相对清晰的内部路径。

1

十七、Google 内部的时间结构:研究 × 工程 × 产品的等权分配

Koray 透露,团队的时间分配不是研究优先,而是三者等权。这意味着一个模型从训练到使用的全过程是统一推进的,而不是线性流程。

这是模型“真正可用”的关键原因。

1

十八、Gemini 是一个全公司规模的“科学工程项目”

访谈的最后,Koray 用“全公司的科学工程任务”来形容 Gemini 的诞生。那更像是一种内部视角的注脚:模型的进步来自结构性调整,而结构性调整本身比模型更难。训练、数据、工程、产品、安全、协作……这些环节重新对齐,才构成了今天的 Gemini。

过去两年,Google 不是在寻找捷径,而是在恢复一个体系应有的速度和一致性。

当这些基础再次稳固起来,一个属于 Google 的节奏也重新出现了。


整理:周华香

点个爱心,再走 吧

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不出中国所料,李在明刚离开日本,韩国就喊话中国:我们尽快谈判

不出中国所料,李在明刚离开日本,韩国就喊话中国:我们尽快谈判

面包夹知识
2026-01-16 16:05:48
柬埔寨副首相放话:特朗普让我们惊醒,不能只依靠中国

柬埔寨副首相放话:特朗普让我们惊醒,不能只依靠中国

扬子晚报
2026-01-15 12:30:47
周琦眼睛出现不适,赵继伟赛季首秀完美,CBA又来超级外援!

周琦眼睛出现不适,赵继伟赛季首秀完美,CBA又来超级外援!

中国篮坛快讯
2026-01-17 00:01:47
升西部第二!文班22+10受伤惊魂 马刺最多领先39分大胜雄鹿

升西部第二!文班22+10受伤惊魂 马刺最多领先39分大胜雄鹿

醉卧浮生
2026-01-16 11:23:40
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
性能突破性提升!我国攻克半导体材料世界难题

性能突破性提升!我国攻克半导体材料世界难题

环球网资讯
2026-01-16 20:33:08
马斯克:2026年科技牛市6大核心主线,核心公司出炉,催化剂明确

马斯克:2026年科技牛市6大核心主线,核心公司出炉,催化剂明确

鹏哥投研
2026-01-16 20:18:53
被禁止关注不到24小时,李湘被扒底朝天,高调炫富仅是冰山一角

被禁止关注不到24小时,李湘被扒底朝天,高调炫富仅是冰山一角

有范又有料
2026-01-16 18:22:52
夫妻性生活的“黄金时长”是多少?别再被电影骗了!

夫妻性生活的“黄金时长”是多少?别再被电影骗了!

精彩分享快乐
2025-11-29 00:00:03
中足联官方:同意上海赛更达、大连可为名称认定事宜

中足联官方:同意上海赛更达、大连可为名称认定事宜

懂球帝
2026-01-16 20:57:11
防守倒是比较积极,但湖人后场新援的得分能力完全没有发挥出来?

防守倒是比较积极,但湖人后场新援的得分能力完全没有发挥出来?

稻谷与小麦
2026-01-17 00:12:40
你知道女性的阴道有多长吗?或许与你所想,完全不同!

你知道女性的阴道有多长吗?或许与你所想,完全不同!

战争茶馆
2025-11-26 10:33:50
1月16日俄乌:美俄配合默契, 欧洲愈发强硬

1月16日俄乌:美俄配合默契, 欧洲愈发强硬

山河路口
2026-01-16 18:15:09
别羡慕“秒睡”的人!医生提醒:“倒头就睡”可能是身体在报警

别羡慕“秒睡”的人!医生提醒:“倒头就睡”可能是身体在报警

人民日报健康客户端
2026-01-03 15:33:43
冬至夜黄晓明带前妻回青岛团圆,婆媳相拥破镜难重圆却获赞体面

冬至夜黄晓明带前妻回青岛团圆,婆媳相拥破镜难重圆却获赞体面

老吴教育课堂
2026-01-16 05:08:31
泡沫破裂!高端白酒价格大跳水

泡沫破裂!高端白酒价格大跳水

中国能源网
2026-01-16 10:32:11
闫学晶风波再升级!一人已被行拘,婚变丑闻被扒,这回恐彻底栽了

闫学晶风波再升级!一人已被行拘,婚变丑闻被扒,这回恐彻底栽了

奇思妙想草叶君
2026-01-14 22:49:54
单论军事指挥能力而言,十大元帅该怎么排名,徐帅肯定不是第八

单论军事指挥能力而言,十大元帅该怎么排名,徐帅肯定不是第八

兴趣知识
2026-01-16 14:56:20
CBA|刘传兴:并非有意弄伤曾凡博

CBA|刘传兴:并非有意弄伤曾凡博

北青网-北京青年报
2026-01-16 13:18:05
神仙姐姐的野生图,太美了。

神仙姐姐的野生图,太美了。

微微热评
2026-01-09 12:20:53
2026-01-17 00:40:49
硅星人 incentive-icons
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
2795文章数 10428关注度
往期回顾 全部

科技要闻

贾国龙与罗永浩被禁言,微博CEO回应

头条要闻

罗永浩、贾国龙微博账号均被禁言

头条要闻

罗永浩、贾国龙微博账号均被禁言

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

李湘翻车,早就有迹可循!

财经要闻

清流|酒店商家在携程和美团之间沦为炮灰

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

亲子
游戏
房产
家居
公开课

亲子要闻

精神科医生:家长的“为你好”也可能对孩子造成创伤

《人中之龙 极3/人中之龙3 外传 Dark Ties》制作人专访"/> 主站 商城 论坛 自运营 登录 注册 《人中之龙 极3/人中之龙3 外传 Da...

房产要闻

喜封金顶 臻境初呈丨中粮·铂悦壹号3#楼封顶大吉!

家居要闻

岁月柔情 现代品质轻奢

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版