网易首页 > 网易号 > 正文 申请入驻

DeepMind科学掌门人首次揭秘:拿完诺奖只是开始,终极目标是打造「科学API」,让人人都能搞科研

0
分享至


从破解生命密码、催生诺贝尔奖级成果的 AlphaFold,到为谷歌节省数亿美元、优化千亿级别计算资源的 AlphaEvolve,再到找到连顶尖数学家都未曾发现的新解法……这些颠覆性成果的背后,并非简单的模型迭代,而是一套严谨到近乎苛刻的问题筛选法则

今天,Google DeepMind 科学负责人 Pushmeet Kohli 首次为我们揭开这套内部心法:他们只瞄准三类问题——具有变革性、公认 5 到 10 年内无人能解、但 DeepMind 却有信心在短时间内攻克的不可能的任务


DeepMind 的科学框架:如何筛选并攻克变革性挑战

在访谈的一开始,Pushmeet Kohli 便明确指出,DeepMind 的科学团队并非寻求渐进式的改进,而是专注于那些能够带来变革性影响(transformative impact)的宏大目标。为了系统性地筛选这些项目,他们建立了一套独特的框架和方法论,确保资源能被投入到最关键、最有可能产生颠覆性成果的领域。

首先,Kohli 将智能的能力划分为三个层次,这为理解 DeepMind 的问题选择提供了背景:
第一层:普遍人类智能 这是大多数人都具备的基础能力,例如图像识别、阅读手写文字等。AI 在这个领域已经取得了长足的进步

第二层:专家级智能 这类智能需要经过专门的训练和学习,例如医生根据症状进行诊断,或程序员根据需求编写复杂的代码

第三层:超人类智能 这是指那些即便是最聪明的人类专家也无法凭直觉或推理解决的问题。一个典型的例子就是蛋白质折叠预测:在 AlphaFold 出现之前,即使给一位顶尖生物学家一个蛋白质的氨基酸序列,他也无法直接推断出其复杂的三维结构。解决这类问题往往需要耗费数年时间和数百万美元的实验成本

DeepMind 的科学项目正是瞄准了第三个层次——那些未知的领域,致力于构建能够解决人类当前无法解决问题的智能系统。为了从众多可能性中筛选出合适的项目,团队遵循一个由三条核心原则构成的决策算法:

1.变革性与可行性 项目的首要标准是必须具备产生变革性影响的潜力,无论是科学、商业还是社会层面。同时,它必须是可行的,即在科学规律的范畴内,而非像“时间旅行”那样天马行空的幻想。社区需要普遍认同该问题的解决将带来巨大价值。
2.公认的难度 项目必须具有极高的挑战性,以至于行业内的普遍共识是,在未来 5 到 10 年内无人能够解决它。如果一个问题在 6 个月内就可能被其他人攻克,那么它就不属于 DeepMind 科学团队的目标范畴。他们专注于那些需要跨学科合作、顶尖 AI 研究、卓越工程能力以及庞大计算或数据资源才能解决的硬骨头

3.颠覆共识的信心 尽管外界普遍认为该问题需要 5 到 10 年才能解决,但 DeepMind 团队必须有充分的信心,相信自己能够凭借独特的方法,在预期时间的一半甚至三分之一内取得突破

只有当一个潜在项目同时满足这三个严苛的条件时,团队才会正式立项。这个框架确保了 DeepMind 能够持续地在最具挑战性的科学前沿取得突破。基于这个框架,他们产出的成果也根据其主要影响被分为三类:

科学影响: AlphaFold 是最杰出的代表。它解决了困扰生物学界数十年的蛋白质结构预测问题,将过去耗时数年、耗资百万美元的过程缩短到几秒钟和几美分。自 2020 年发布以来,AlphaFold 已被全球科研人员广泛应用,成为引用率最高的科学论文之一,其核心贡献者 Demis Hassabis 和 John Jumper 也因此获得了诺贝尔奖,其科学影响力不言而喻

商业影响: AlphaEvolve 是一个很好的例子。它是一个由 Gemini 驱动的代码优化智能体,旨在解决那些顶尖计算机科学家也难以优化的复杂问题。例如,通过优化谷歌数据中心的作业调度算法,AlphaEvolve 成功节省了整个计算集群约 0.7% 的算力,这在谷歌的庞大规模下意味着巨大的成本节约。同时,它还显著提升了 Gemini 模型自身的训练速度。有趣的是,AlphaEvolve 在解决公开的数学难题时也表现出色,对 75% 的问题达到了当前最优水平,并对其中 20% 的问题找到了超越人类数学家的更优解

社会影响: SynthID 是一个致力于解决生成式 AI 风险的典范。随着生成内容的质量越来越高,区分真实内容和 AI 合成内容变得愈发困难。SynthID 是一种先进的数字水印技术,它可以在 AI 生成的文本、图像和视频中嵌入一种人眼无法察觉但机器可以检测的信号,且这种信号对常规的图像编辑和转换具有鲁棒性。谷歌已将该技术应用于所有模态的生成式 AI 内容中,旨在维护信息生态系统的透明度和可信度,让用户能够清晰地了解内容的来源

从专用模型到通用智能:IMO 金牌

国际数学奥林匹克(International Mathematical Olympiad, IMO)是中学生数学竞赛的巅峰,其问题难度极高,考验着深刻的逻辑推理和创造力。DeepMind 将其视为衡量和推动 AI 推理能力的重要标尺。访谈中,Pushmeet Kohli 详细讲述了团队如何从构建专用模型,最终发展到利用通用模型在 IMO 竞赛中取得金牌级水平的历程,这不仅是一个技术上的巨大飞跃,也体现了 DeepMind 科学团队与 Gemini 团队之间紧密的合作模式

去年的成果是基于两个高度专业化的模型:

AlphaGeometry: 顾名思义,这个模型专门用于解决几何问题

AlphaProof: 这个模型更为复杂。它的核心是一个大型语言模型(LLM),但其工作方式并非直接给出答案。它首先会将自然语言描述的数学问题,转换成一种名为 Lean 的领域特定形式化语言。Lean 语言的优势在于,任何通过它生成的证明都是可以被机器验证的,确保了结果的绝对正确性。AlphaProof 实质上是在所有可能的证明路径空间中进行智能搜索,一旦找到一条通往结论的路径,就意味着它生成了一个形式上完全正确的证明。

这种方法虽然强大,但依赖于专门的模型和形式化语言的转换,使得整个系统较为复杂且不易普及。而今年的突破则标志着一个根本性的转变,其核心是 DeepThink,一个基于 Gemini 2.5 Pro 的模型。这一转变的背后,是两个团队之间深度的技术转移和协同创新。

从 AlphaProof 到 DeepThink 的技术转移路径非常关键:

1.利用专用模型生成高质量训练数据: AlphaProof 拥有一个独特的能力——它能生成海量的、经过机器验证的、绝对正确的数学问题及其证明。团队利用这个能力,让 AlphaProof 解决了成千上万甚至数百万个数学问题

2.反哺通用模型: 这些由 AlphaProof 生成的“问题-正确证明”数据对,构成了一个规模庞大且质量极高的训练数据集。这些数据随后被用来训练和微调下一代的 Gemini 模型。这就像是让一个初出茅庐的学生(Gemini)学习一位数学大师(AlphaProof)的所有解题过程和思路,从而极大地提升了 Gemini 在数学和逻辑推理方面的能力

这一策略带来了几个革命性的成果:

从专用走向通用: 最新的 IMO 金牌级成果不再依赖于 AlphaGeometry 和 AlphaProof 这类专用模型。所有的解题能力都被成功地整合进了 DeepThink 这一通用的 Gemini 模型中。这意味着 AI 的顶尖数学能力不再是孤立的,而是成为了一个更广泛智能系统的一部分

实现自然语言交互: 新系统不再需要将问题翻译成 Lean 这样的形式化语言。用户可以直接用自然语言(如英语)输入 IMO 级别的复杂数学题,模型就能理解并直接给出解答过程。这极大地降低了使用门槛,使其更接近人类的自然思考和交流方式

当被问及这种强大的数学能力是否能泛化到其他领域时,Kohli 坦言这本身就是一个前沿的研究问题,目前尚无定论。团队正在通过严谨的消融实验(ablation studies)来系统性地研究,即通过在训练数据中添加或移除这些数学证明数据,来观察模型在其他非数学任务上的表现变化,从而以经验性的方式来探索数学推理能力与其他通用智能之间的关联

从 AlphaFold 数据库到 AI 协同科学家

Pushmeet Kohli 强调,DeepMind 的使命不仅在于实现科学突破,更在于将这些突破性的能力交到全世界的科学家手中,从而加速整个人类科学的进步。AI Co-scientist(AI 协同科学家)则代表了这一理念的未来方向。

其中最成功的案例就是 AlphaFold。团队并没有将这个强大的蛋白质结构预测系统保留为内部工具,而是采取了多种方式使其普惠全球:

开放数据库: 他们利用 AlphaFold 预测了地球上几乎所有已知蛋白质的结构,并将这些超过 2 亿个预测结构全部免费公开在一个名为 AlphaFold Database 的数据库中。

赋能全球研究者: 这一举措彻底改变了结构生物学的研究范式。正如 Kohli 所描述的,一位在巴西或非洲研究被忽视的热带病的研究者,过去可能因为缺乏资金和设备而无法获得其研究靶点蛋白质的结构。现在,他/她只需访问一个网页,输入蛋白质序列,点击按钮,就能在几秒钟内获得高质量的结构预测。这极大地拉平了全球科研资源的差距

提供 API 接口: 除了数据库,他们还通过 API 的形式让开发者和研究机构能将 AlphaFold 的能力集成到自己的研究流程中。

同样的理念也体现在其他项目中,例如 AlphaGenome,团队为其开发了定制的用户界面(UI),让研究者可以方便地探索人类基因组中的变异如何影响基因功能。这些努力的核心思想是,将复杂的 AI 模型封装成易于使用的工具,让非 AI 领域的专家也能从中受益。

展望未来,AI Co-scientist 项目将这种理念推向了一个新的高度。它不再仅仅是一个解决特定问题的工具,而是一个模拟并增强整个科学研究过程的智能系统

多智能体协作系统: AI Co-scientist 的核心是一个多智能体(multi-agent)系统,其中 Gemini 模型扮演了科学研究生态中的多个不同角色。它既是“假设生成者(hypothesis generator)”,负责提出新颖的科学想法;又是“审稿人(reviewer)”和“批判者(critique)”,负责严格地审视和挑战这些想法的逻辑和可行性。系统内部会进行想法的生成、批判、排序和迭代,模拟了一个高效运转的科研团队

惊人的洞察力: 这种内部的思想碰撞机制让系统能够产生出乎意料的深刻见解。Kohli 分享了一个轶事:团队曾邀请伦敦帝国理工学院的一位教授提供一个他所在领域的前沿难题。当团队将 AI Co-scientist 生成的几条核心假设反馈给这位教授时,他惊愕地发现,其中排名第一的假设,正是他自己的团队耗费数年心血研究、并且刚刚投稿到顶级期刊的最新成果。他一度怀疑自己的论文被泄露了。这个故事有力地证明了 AI Co-scientist 已经能够独立地思考,并触及到人类科学研究的最前沿

AI Co-scientist 的终极愿景:在未来,当谷歌宣布一项由 AI 促成的重大科学突破时,实现这一突破的将不再是传统的顶尖科研机构的博士团队,而可能是世界某个角落里的一位普通人,他仅仅因为拥有强大的 AI 工具作为伙伴,便得以释放其创造力,做出了诺贝尔奖级别的贡献

未来展望:迈向“科学 API”的时代

在访谈的最后,话题转向了对未来的展望,即我们是否会最终拥有一个“科学的 API(API for science)”。这个概念的背后,是 AI 正在逐步降低各领域专业技能门槛的大趋势。正如今天编写软件已经比十年前容易得多,未来从事高水平的科学研究是否也能变得更加普及?

Pushmeet Kohli 对此表示了肯定的看法,但他同时指出了实现这一愿景的核心挑战——“归约问题(the specification question)”

无论是编程还是科学研究,最困难的部分之一往往不是执行,而是清晰、准确地定义问题本身。一个程序应该做什么?一个科学实验的目标是什么?这背后需要深刻的洞察力和严谨的逻辑

*因此,通往“科学 API”的道路,关键在于构建能够让用户(无论是开发者还是科学家)与 AGI(通用人工智能)进行高效、自然沟通的交互界面。我们需要让 AI 更好地理解人类模糊、高层次的意图,并将其转化为精确、可执行的步骤。

这不仅是一个技术问题,也是一个产品和设计问题。如何设计接口,如何收集和利用用户反馈,如何建立一个从人类灵感到 AGI 执行的无缝沟通渠道,将是未来几年 AI 社区需要重点解决的问题。这恰恰凸显了像主持人 Logan Kilpatrick 这样的开发者关系专家的重要性,他们是连接 AI 技术与实际使用者之间的桥梁

总而言之,从 AlphaFold 到 AI Co-scientist,再到对未来“科学 API”的构想,DeepMind 正在系统性地利用 AI 解锁科学的边界,并致力于将这些强大的能力赋予每一个人,最终目标是构建一个人类智慧与机器智能协同共进,共同解决人类面临的最重大挑战的新时代

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
连续4个20%的涨停板!股民:撑死胆大的!

连续4个20%的涨停板!股民:撑死胆大的!

数据挖掘分析
2026-01-24 14:45:32
金饰每克便宜200元,抢爆了!凌晨6点开始排队,有人拖着行李箱去买

金饰每克便宜200元,抢爆了!凌晨6点开始排队,有人拖着行李箱去买

台州交通广播
2026-01-24 16:30:36
重庆女子万元手机丢失,硬刚二道贩子,狂飙39公里追回,结局爽了

重庆女子万元手机丢失,硬刚二道贩子,狂飙39公里追回,结局爽了

叶公子
2026-01-23 21:06:30
夫妇网购娃娃菜食用后中毒,检出鼠药成分,警方已受案 平台:下架商家商品,配合调查

夫妇网购娃娃菜食用后中毒,检出鼠药成分,警方已受案 平台:下架商家商品,配合调查

红星新闻
2026-01-24 19:30:49
黄磊没想到19岁黄多多栽在留学生“三通一达”风口,人设彻底碎了

黄磊没想到19岁黄多多栽在留学生“三通一达”风口,人设彻底碎了

乐悠悠娱乐
2026-01-24 09:52:51
冯小刚养女徐朵晒家中日常,别墅宽敞却朴素,夫妻俩宠溺藏不住

冯小刚养女徐朵晒家中日常,别墅宽敞却朴素,夫妻俩宠溺藏不住

骄阳之夏明
2026-01-24 19:37:45
经济不景气,什么行业最赚钱?当年日本经济泡沫给出了答案

经济不景气,什么行业最赚钱?当年日本经济泡沫给出了答案

泠泠说史
2026-01-22 18:46:47
半场0板+全场1板!申京再被火蜜疯狂炮轰:软弱无能 空有2.11米

半场0板+全场1板!申京再被火蜜疯狂炮轰:软弱无能 空有2.11米

颜小白的篮球梦
2026-01-24 10:59:14
纪实:劳荣枝临刑前一天,吃了碗肉丝细面,注射死刑表情极为扭曲

纪实:劳荣枝临刑前一天,吃了碗肉丝细面,注射死刑表情极为扭曲

谈史论天地
2026-01-24 15:25:03
光速翻脸?6万吨菜籽油刚卖给中国,电车就遭针对,卡尼直摇头

光速翻脸?6万吨菜籽油刚卖给中国,电车就遭针对,卡尼直摇头

娱乐八卦木木子
2026-01-23 12:39:27
云南省公安厅情报指挥中心合成作战支队支队长袁满荣接受纪律审查和监察调查

云南省公安厅情报指挥中心合成作战支队支队长袁满荣接受纪律审查和监察调查

昆明信息港
2026-01-24 14:55:58
废铁涨价不算啥!这类家家都有的废品暴涨60倍,翻出来就变现

废铁涨价不算啥!这类家家都有的废品暴涨60倍,翻出来就变现

科学发掘
2026-01-24 15:20:14
科斯塔:孔蒂为人尖酸刻薄,整天摆臭脸怕是因为在家没性生活

科斯塔:孔蒂为人尖酸刻薄,整天摆臭脸怕是因为在家没性生活

懂球帝
2026-01-24 01:03:23
知道这是啥吗?当年通信维护人最怕的…

知道这是啥吗?当年通信维护人最怕的…

通信老柳
2026-01-05 07:57:21
广东省委原常委、广州市委原书记郭永航获增补为省政协委员

广东省委原常委、广州市委原书记郭永航获增补为省政协委员

澎湃新闻
2026-01-24 18:12:15
善恶终有报!47岁“跌落神坛”的李玉刚,终是活成了“跳梁小丑”

善恶终有报!47岁“跌落神坛”的李玉刚,终是活成了“跳梁小丑”

凡知
2026-01-22 09:51:54
新郎晒44张婚纱照,仅有6张新娘正脸,其余大半是母亲,女方回应

新郎晒44张婚纱照,仅有6张新娘正脸,其余大半是母亲,女方回应

奇思妙想草叶君
2026-01-23 18:11:50
欠中国的钱,委内瑞拉不还了?美财长:中国已无法继续获得委石油

欠中国的钱,委内瑞拉不还了?美财长:中国已无法继续获得委石油

我是盲流
2026-01-22 11:37:44
雪豹伤人后续:伤者正脸曝光,伤重说不清楚话,知情人透更多细节

雪豹伤人后续:伤者正脸曝光,伤重说不清楚话,知情人透更多细节

八斗小先生
2026-01-24 15:28:47
挪威求救:每多吃一只帝王蟹都是在拯救地球!泛滥成灾还这么贵?

挪威求救:每多吃一只帝王蟹都是在拯救地球!泛滥成灾还这么贵?

北纬的咖啡豆
2026-01-24 14:14:11
2026-01-24 21:03:00
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1028文章数 395关注度
往期回顾 全部

科技要闻

特斯拉Cybercrab即将落地 每公里不到1块钱

头条要闻

安徽女教师校内宿舍病亡2天后才被发现 学校:建议起诉

头条要闻

安徽女教师校内宿舍病亡2天后才被发现 学校:建议起诉

体育要闻

当家球星打替补,他们在故意摆烂?

娱乐要闻

回归还是顶流 凤凰传奇将现身马年春晚

财经要闻

“百年老字号”张小泉遭60亿债务压顶

汽车要闻

有增程和纯电版可选 日产NX8或于3-4月间上市

态度原创

旅游
健康
艺术
公开课
军事航空

旅游要闻

在积木王国感受中国年味,上海乐高乐园新春主题盛典即将启幕

耳石脱落为何让人天旋地转+恶心?

艺术要闻

梁益君 2025风景油画写生

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄美乌首次三方会谈在阿联酋举行

无障碍浏览 进入关怀版