网易首页 > 网易号 > 正文 申请入驻

纪念AlphaGo第37手十周年:DeepMind创始人揭秘围棋背后的意义

0
分享至

今日,在 AlphaGo 击败前人类冠军李世石 10 周年之际,DeepMind 创始人、AlphaGo之父、诺贝尔奖得主 Demis Hassabis 发布了一篇文章,回顾了 10 年来从棋局到生物学及更广阔领域的影响

Demis 在 X 上写道:十年前,AlphaGo 在首尔的传奇对决宣告了人工智能现代时代的开启。其著名的“第 37 手”昭示着人工智能技术已准备好应对科学等领域的现实世界难题,而这些方法所启发的理念对构建通用人工智能至关重要。


全文如下:

十年前,我们的人工智能(AI)系统 AlphaGo 成为首个在复杂棋类游戏围棋中击败世界冠军的程序,这标志着该领域一个里程碑的达成,比许多专家预想的时间提前了整整十年。

这一成就预示着如今被公认为人工智能现代纪元的开端。凭借其极具创造力的“第37手”,AlphaGo 展示了人工智能的巨大潜力,并向世人表明,我们现在已经掌握了开始着手解决现实世界中科学问题的方法。

时至今日,这项突破仍在指引着我们构建通往通用人工智能(AGI)之路的诸多系统。我们相信,AGI 将有潜力成为人类有史以来最深远的技术发明,并可能成为推动科学、医学和生产力的终极工具。

创造力的火花

2016 年,超过 2 亿观众观看了 AlphaGo 在首尔与世界顶尖围棋选手李世石的巅峰对决。这场系列赛的高光时刻出现在第二局的“第37手”,这是一步极其违反直觉的下法,以至于专业解说员起初都认为这是个失误。但事实证明,这正是决定胜负的关键一招。大约一百多手之后,这枚棋子恰好落在了能够帮助 AlphaGo 赢得比赛的关键位置。这展现了 AlphaGo 惊人的前瞻性,以及人工智能系统超越单纯模仿人类专家、自主发现全新策略的能力。

围棋因其超乎寻常的复杂性,长期以来一直是人工智能研究的试金石。棋盘上的可能局面高达 10^170 种,远超可观测宇宙中的原子总数。

为了攻克这一难题,AlphaGo 运用了深度神经网络,并结合了先进的搜索算法和强化学习,这是 DeepMind 开创的一种人工智能方法。

AlphaGo 首先通过学习人类专家的棋谱来构建一个合理的落子模型,随后通过与自己对弈数百万盘棋来持续学习,并在这一过程中不断强化最有效的获胜策略,从而完成自我进化。最终,系统仅需考虑最具潜力的少数几个走法,并从这组经过精炼的候选落子中,找到最可能导致胜利的那一步棋。

在 AlphaGo 之后,我们开发了 AlphaGo Zero,它从完全随机的对弈开始学习,最终可以说成为了围棋史上最强大的棋手。随后,我们通过 AlphaZero 进一步将这套方法通用化,使其能够从零开始自学,掌握任何双人完美信息游戏,包括围棋、国际象棋和日本将棋。除了游戏规则,AlphaZero 没有借助任何先验知识,就能在数小时内精通国际象棋,不仅击败了顶尖的人类棋手,也战胜了当时最强的专用国际象棋程序(如 Stockfish)。尽管国际象棋在借助这些程序的帮助下已被深入分析多年,但正如在围棋上一样,AlphaZero 依然能够构想出新颖有趣的战略。

这进一步印证了我在首尔获胜那一刻就坚信的想法:这项技术已经可以应用于我们真正的目标,即加速科学发现。

“我相信,AlphaGo 带来的最重要启示是它对人工智能时代的明确预示,它证明了这并非一个遥远而模糊的未来,而是一个正在叩响我们现实世界大门的新事物。它就像一份'来自未来的路线图',向人类清晰地发出了关于世界即将如何变革的信号。” ——围棋大师李世石,韩国蔚山科学技术院(UNIST)兼职教授
催化科学突破

通过证明人工智能可以在围棋棋盘巨大的可能性空间中进行有效探索,AlphaGo 展示了其帮助人类更好地理解物理世界复杂性的巨大潜力。我们首先着手解决的,便是试图攻克蛋白质折叠难题:一个预测蛋白质三维结构的、历时 50 年的重大挑战。而这些结构信息对于理解疾病和开发新药至关重要。

2020 年,我们终于凭借 AlphaFold 2 系统攻克了这一长期存在的科学难题。在此基础上,我们预测了科学界已知的所有约 2 亿种蛋白质的结构,并将其在开源数据库中免费提供给全球科学家使用。如今,世界各地已有超过 300 万研究人员在使用 AlphaFold 数据库,来加速他们从疟疾疫苗到塑料降解酶等重要课题的研究工作。而到了 2024 年,能够代表整个 AlphaFold 团队,与 John Jumper 一同因领导这个项目而荣获诺贝尔化学奖,是我莫大的荣幸。

自 AlphaGo 取得胜利以来,我们已将其开创性的方法应用于众多其他科学和数学领域,其中包括:

  • 数学推理:AlphaProof 是 AlphaGo 架构最直接的传承者之一,它通过结合语言模型和 AlphaZero 的强化学习与搜索算法,学会了证明形式化的数学命题。它与 AlphaGeometry 2 一道,成为首个在国际数学奥林匹克竞赛(IMO)中达到(银牌)奖牌水准的系统,证明了 AlphaGo 的方法能够解锁高级数学推理能力,并为我们打造最强大的通用模型奠定了基础。

  • 算法发现:正如 AlphaGo 在游戏中搜索最佳落子,我们的编码智能体 AlphaEvolve 则在计算机代码的广阔空间中探索,以期发现更高效的算法。它也曾拥有属于自己的“第37手”时刻:发现了一种全新的矩阵乘法运算方法。而矩阵乘法是支撑几乎所有现代神经网络的基础数学运算。目前,AlphaEvolve 正在从数据中心优化到量子计算等诸多问题上接受测试。

  • 科学协作:我们正将 AlphaGo 开创的搜索和推理原则整合到一个“人工智能协同科学家”系统中。通过让多个 Agent “辩论”科学思想和假说,该系统能够充当一个协作者,进行识别数据模式和解决复杂问题所需的严谨思考。在伦敦帝国理工学院进行的验证研究中,它分析了数十年来的文献,并独立得出了关于抗菌素耐药性的相同假设,而这一假设是研究人员耗费多年时间才提出并通过实验验证的。

我们还利用人工智能来更好地理解基因组、推进聚变能源研究、改善天气预报等等。

尽管我们的科学模型已经非常出色,但它们目前仍然高度专业化。为了实现诸如创造无限清洁能源或攻克当今无法理解的疾病这样的根本性突破,我们需要更通用的人工智能系统,它们能够发现不同学科领域间的内在结构和联系,并像最顶尖的科学家那样,帮助我们提出新的假说。

智能的未来

对于一个真正通用的人工智能而言,它需要能够理解物理世界。我们从一开始就将 Gemini 构建为多模态模型,使其不仅能理解语言,还能理解音频、视频、图像和代码,从而构建出对世界的模型。

为了在这些不同模态之间进行思考和推理,最新的 Gemini 模型运用了部分我们在 AlphaGo 和 AlphaZero 中开创的技术。

下一代人工智能系统还需要能够调用专门的工具。例如,如果一个模型需要了解某种蛋白质的结构,它可以直接调用 AlphaFold 来完成这项任务。

我们认为,将 Gemini 的世界模型、AlphaGo 的搜索和规划技术以及专门的人工智能工具使用能力相结合,对于实现 AGI 将至关重要。

真正的创造力是这样一个 AGI 系统需要具备的关键能力。“第37手”让我们得以一窥人工智能跳出固有框架思考的潜力,但真正的原创性发明则需要更多。它不仅要能像 AlphaGo 那样令人印象深刻地想出新颖的围棋策略,更需要能够真正发明出像围棋这样深邃、优雅、值得深入研究的游戏。

在 AlphaGo 取得传奇性胜利十年后的今天,我们的终极目标已近在眼前。最初在“第37手”中闪现的创造力火花,已经催化了众多突破,而这些突破如今正汇聚成通往 AGI 的道路,并有望开启一个科学发现的崭新黄金时代。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
有人预测:明后年,二三十层电梯房,或将面临这3个结局,太真实

有人预测:明后年,二三十层电梯房,或将面临这3个结局,太真实

蜉蝣说
2026-03-12 10:27:27
韩国总统豪言:全球仅4个国家能战胜韩国,日本都不行

韩国总统豪言:全球仅4个国家能战胜韩国,日本都不行

十柱
2026-03-12 20:47:14
郑丽文第三波提名人选名单出炉,赵少康改弦更张,蓝白迈进新阶段

郑丽文第三波提名人选名单出炉,赵少康改弦更张,蓝白迈进新阶段

真的好爱你
2026-03-12 20:43:55
越南当年赶走26万华人,中国大度全盘接收,现在换来一座金山

越南当年赶走26万华人,中国大度全盘接收,现在换来一座金山

全金猫眼
2026-03-12 06:31:36
生育大局已定:不出意外的话,2026年起中国人口将迎来3大变化

生育大局已定:不出意外的话,2026年起中国人口将迎来3大变化

混沌录
2026-03-11 22:28:09
成本暴涨!OPPO 正式官宣大涨价

成本暴涨!OPPO 正式官宣大涨价

XCiOS俱乐部
2026-03-10 18:09:35
中东,大消息!伊朗最高领袖即将发表首份声明,包括7个部分

中东,大消息!伊朗最高领袖即将发表首份声明,包括7个部分

证券时报e公司
2026-03-12 21:19:03
张新成带父母与王玉雯聚餐,两人挨着,歪头看手机家属感十足 ​

张新成带父母与王玉雯聚餐,两人挨着,歪头看手机家属感十足 ​

观鱼听雨
2026-03-12 20:23:26
3-0!挪超黑马欧冠震撼5连胜 首次打进8强在望 5.4万人口小镇沸腾

3-0!挪超黑马欧冠震撼5连胜 首次打进8强在望 5.4万人口小镇沸腾

我爱英超
2026-03-12 07:03:17
又一艘货船在霍尔木兹海峡附近遭袭

又一艘货船在霍尔木兹海峡附近遭袭

界面新闻
2026-03-12 12:57:27
女篮首节被比利时压制!杨舒予+2内低迷,张曼曼惊喜,防守需警惕

女篮首节被比利时压制!杨舒予+2内低迷,张曼曼惊喜,防守需警惕

篮球资讯达人
2026-03-12 19:52:09
生育大局已定:不出意外的话,2026年起中国人口将迎来3大变化

生育大局已定:不出意外的话,2026年起中国人口将迎来3大变化

云景侃记
2026-03-11 22:10:21
商品期货夜盘走势分化 部分化工品走弱

商品期货夜盘走势分化 部分化工品走弱

每日经济新闻
2026-03-12 21:25:08
痒是大病预警!医生提醒:2处发痒,或不是过敏,而是这4病

痒是大病预警!医生提醒:2处发痒,或不是过敏,而是这4病

医学科普汇
2026-03-05 21:20:03
陡降7~10℃!周末重庆各地大幅降温

陡降7~10℃!周末重庆各地大幅降温

上游新闻
2026-03-12 19:05:05
当你有了存款会瞒着身边人吗?网友:存钱就连亲爹妈都别告诉

当你有了存款会瞒着身边人吗?网友:存钱就连亲爹妈都别告诉

带你感受人间冷暖
2026-02-23 00:30:12
战争账单曝光:美国为中东行动已付出巨额代价

战争账单曝光:美国为中东行动已付出巨额代价

极目新闻
2026-03-10 09:03:21
要么投降,要么死在洞里——内塔尼亚胡拒绝放走被困地道的哈马斯

要么投降,要么死在洞里——内塔尼亚胡拒绝放走被困地道的哈马斯

桂系007
2025-11-05 23:52:21
两会建言|全国政协委员施卫东:中老年消费者“有钱有闲”,建议增加优质消费供给

两会建言|全国政协委员施卫东:中老年消费者“有钱有闲”,建议增加优质消费供给

中国经营报
2026-03-12 16:25:07
克林顿披露:当年为了打赢朝鲜战争,美国共投入了将近200万军队

克林顿披露:当年为了打赢朝鲜战争,美国共投入了将近200万军队

墨兰史书
2026-01-31 07:30:07
2026-03-12 22:07:00
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
859文章数 7884关注度
往期回顾 全部

科技要闻

当养虾人开始卸载,大厂的战争才真正开始

头条要闻

伊朗最高领袖:不会放弃复仇 霍尔木兹海峡将继续关闭

头条要闻

伊朗最高领袖:不会放弃复仇 霍尔木兹海峡将继续关闭

体育要闻

建议将“出球型门将”纳入反诈app

娱乐要闻

田亮一家新年全家福!森碟变清纯少女

财经要闻

卢锋:从特朗普团队群演看时代变局

汽车要闻

大众2025财报:转型虽有阵痛 "大象"已然起跑

态度原创

旅游
时尚
游戏
亲子
公开课

旅游要闻

瞰中国|福建屏南:厦地花开春意满

风衣+大包,春季最气质搭配!

新的到了旧的怎么处理?网友求助NS退役方式引热议!

亲子要闻

宝蓝和叔叔爸爸一起比赛打室内高尔夫球,快来看看谁赢了?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版