网易首页 > 网易号 > 正文 申请入驻

弈客签约 | 《AlphaGo to Zero》第三卷问世

0
分享至

原址:Documenting the AI Era: Volume 3 of AlphaGo to Zero Arrives - American Go Association

原题:Documenting the AI Era: Volume 3 of AlphaGo to Zero Arrives

摘自:The news of American Go Association

作者:Chris Garlock

随着备受期待的《AlphaGo to Zero》系列第三卷的发布,迈克尔·雷德蒙德和克里斯·加洛克继续着他们对这场彻底重塑围棋格局的人工智能革命的权威性记录。


图1 《AlphaGo to Zero》第3卷封面

初始版本的AlphaGo系统的核心架构包含四个协同工作的关键模块:

  1. 策略网络:该模块以当前棋盘状态作为输入,通过深度神经网络计算并输出下一步棋在各个合法位置的概率分布,从而提供候选落子方案。

  2. 快速推演:此部分功能与策略网络相似,旨在生成行棋序列,但采用简化的计算模型,以显著降低决策精度为代价,实现相比策略网络数千倍的速度提升,用于快速胜负模拟。

  3. 价值网络:此模块同样基于当前局面,利用神经网络直接评估双方胜率,输出一个介于-1到1之间的评价值,用于判断当前局面的优劣态势。

  4. 蒙特卡洛树搜索:作为系统的决策中枢,MCTS 框架将上述三个模块有机整合。它通过反复模拟对弈过程,综合策略网络的选点建议、价值网络的局面评估以及快速推演的终局胜率,以此进行自我博弈和策略优化,最终形成完整的决策系统。

此时的AlphaGo还不是纯粹的机器深度强化学习,要依靠大量学习人类棋谱。系统通过分析人类历史对弈数据来构建快速走子模型,并以此为基础对策略网络进行初步参数设置。随后,策略网络与估值网络通过持续不断的自我对弈进行协同训练和优化。

需要指出的是,估值网络并未直接采用人类棋谱作为训练样本。这是因为人类对局中时常存在较强的偶然性因素,局部阶段的优势未必能决定最终胜负,单一失误就可能导致全局结果逆转,使得棋谱数据中包含较多波折。


图2 Alphago学习棋谱的过程简图

在模型迭代过程中,每当产生一个新版本,系统会将其与当前保存的最佳版本进行多轮对抗。只有在新版本的胜率稳定超过55%时,才会替换原有版本。这一机制能够有效避免模型在自我博弈过程中陷入局部最优或产生策略退化,从而确保学习路径的稳定与进步。

但是仅仅一年之内,AlphaGO Zero就横空出世,AlphaGO Zero仅用36小时就超过了AlphaGo,并且占用的资源很少,只需要4个TPU。然后以100:0战胜了之前的AlphaGo。


图3 AlphaGo Zero和AlphaGo对比

《AlphaGo to Zero》第三卷,标题定为“杰作”,集中解读了DeepMind正式发布的50盘AlphaGo自我对弈棋谱。这些对局首次向世人展示,在脱离人类棋谱约束后,AlphaGo如何理解围棋。凭借更丰富的经验与更先进的人工智能分析工具,作者对这些棋局进行了重新审视与全新评注,清晰阐释了以往令人费解的内容:包括AlphaGo独特的开局意图、卓越的大局方向感与时机掌握、果断的侵入战术,以及精准的收官计算。
本书无意评判人类与人工智能的高下,而是致力于揭示这些棋步背后的取胜逻辑、其中蕴含的围棋理念,以及它们如何预示了AlphaGo Zero更为颠覆性的策略。借助棋谱图示、关键局部分析与深入浅出的解说,第三卷将这一系列传奇般的自我对局编织成一条连贯的叙事线,既展现了人机围棋对话的真正开端,也展望了这项运动未来的可能方向。

如今的围棋AI仍然在不断迭代,那怕是当今的最强AI距离真正的围棋之神还有相当长的距离。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
宁夏中卫发生4死2伤交通事故,自治区安委会挂牌督办

宁夏中卫发生4死2伤交通事故,自治区安委会挂牌督办

澎湃新闻
2025-12-24 16:30:27
国资委:免去刘化龙保利集团党委书记、董事长等职务

国资委:免去刘化龙保利集团党委书记、董事长等职务

星岛记事
2025-12-23 18:36:55
我外交部突然发出警告,如果外媒消息属实,中日事态将会相当严重

我外交部突然发出警告,如果外媒消息属实,中日事态将会相当严重

议纪史
2025-12-24 13:00:07
徐湖平老院长住的别墅,好气派啊!

徐湖平老院长住的别墅,好气派啊!

李万卿
2025-12-24 12:40:35
接档《老舅》,央视35集大剧来了!丁勇岱甘心作配,有大爆款潜质

接档《老舅》,央视35集大剧来了!丁勇岱甘心作配,有大爆款潜质

草本纪年
2025-12-24 12:32:14
生物博士变身鉴宝 公证书撤销照样算数 南博为何“制造”庞家后人

生物博士变身鉴宝 公证书撤销照样算数 南博为何“制造”庞家后人

金牌舆情官
2025-12-22 22:40:53
黎笋之子黎坚诚坦言:父亲选择同中国开战,是其毕生最大的失策

黎笋之子黎坚诚坦言:父亲选择同中国开战,是其毕生最大的失策

磊子讲史
2025-12-24 11:04:05
我军一直以来存在的问题,那就是——官太多啊

我军一直以来存在的问题,那就是——官太多啊

这才是战争
2025-12-24 10:05:16
阚清子被曝早产女婴,多重畸形抢救无效去世,细节曝光叹真不应该

阚清子被曝早产女婴,多重畸形抢救无效去世,细节曝光叹真不应该

青史楼兰
2025-12-24 14:35:11
确诊了!右肩静脉血栓!火箭扔掉的NBA首轮秀

确诊了!右肩静脉血栓!火箭扔掉的NBA首轮秀

篮球实战宝典
2025-12-24 07:19:33
南博事件再升级!1997年藏品调拨单申请人凌波,2008年已身居要职

南博事件再升级!1997年藏品调拨单申请人凌波,2008年已身居要职

鹤羽说个事
2025-12-22 14:11:12
基辛格生前大胆预测:第三次世界大战爆发,敢打美国的国家就3个

基辛格生前大胆预测:第三次世界大战爆发,敢打美国的国家就3个

云舟史策
2025-12-21 07:11:57
特殊岛:希望加入中国大陆或与台湾省合并,但绝对不会承诺日本!

特殊岛:希望加入中国大陆或与台湾省合并,但绝对不会承诺日本!

小舟谈历史
2025-12-24 15:42:28
疯了!90年代课本身价飙升,价格翻20倍仍供不应求!家长直言是刚需

疯了!90年代课本身价飙升,价格翻20倍仍供不应求!家长直言是刚需

趣笔谈
2025-12-24 11:01:04
吴千语带货卖了1.5亿,施伯雄搂着她庆祝,想亲老婆却被一把推开

吴千语带货卖了1.5亿,施伯雄搂着她庆祝,想亲老婆却被一把推开

手工制作阿歼
2025-12-24 10:42:37
不只是俄罗斯傻眼了,就连我们都傻眼了

不只是俄罗斯傻眼了,就连我们都傻眼了

南权先生
2025-12-24 16:55:53
刘结一,担任新闻发言人

刘结一,担任新闻发言人

上观新闻
2025-12-24 17:42:07
打脸来得太快!徐湖平“装病”不到24小时,却被扒出频繁现身活动

打脸来得太快!徐湖平“装病”不到24小时,却被扒出频繁现身活动

奇思妙想草叶君
2025-12-22 19:56:12
陪睡陪玩不过是皮毛!万达百亿资产蒸发后,王思聪又曝惊天丑闻

陪睡陪玩不过是皮毛!万达百亿资产蒸发后,王思聪又曝惊天丑闻

牛锅巴小钒
2025-12-24 10:39:19
日本宣称:“中方若不承认《旧金山和约》,台湾即为日本领土!”

日本宣称:“中方若不承认《旧金山和约》,台湾即为日本领土!”

百态人间
2025-12-24 16:47:16
2025-12-24 18:32:49
弈客围棋 incentive-icons
弈客围棋
围棋赛场、人物访谈、热点追踪
11851文章数 41797关注度
往期回顾 全部

体育要闻

26岁广西球王,在质疑声中成为本土得分王

头条要闻

韩国财阀千金在柬埔寨被捕 被指涉嫌参与性交易和贩毒

头条要闻

韩国财阀千金在柬埔寨被捕 被指涉嫌参与性交易和贩毒

娱乐要闻

曝阚清子女儿早产但没保住

财经要闻

重磅!北京市优化调整住房限购政策

科技要闻

智谱和MiniMax拿出了“血淋淋”的账本

汽车要闻

“运动版库里南”一月份亮相   或命名极氪9S

态度原创

艺术
家居
健康
游戏
公开课

艺术要闻

2026第一福!孙晓云亲笔“福”字出炉

家居要闻

法式大平层 智能家居添彩

这些新疗法,让化疗不再那么痛苦

《羊蹄山》光盘价格不降反升!难道是卖得太好了?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版