网易首页 > 网易科技 > 网易科技 > 正文

"阿尔法狗之父"答疑 新版解决了哪些遗留问题?

0
分享至

本文系网易智能工作室(公众号smartman 163)出品。聚焦AI,读懂下一个大时代!

【网易智能讯10月20日消息】DeepMind首席研究员、“AlphaGo之父”David Silver和Julian Schrittwieser(AlphaGo Zero作者之一)在Reddit回答网友提问。

资料显示,“AlphaGo之父”David Silver毕业于剑桥大学,获得了艾迪生威斯利奖,随后与人共同创立了视频游戏公司Elixir Studios,2004年,成为伦敦大学学院的讲师,Silver起初是DeepMind的顾问,直到2013年正式加入DeepMind。

以下是我们精选的Q&A,全文请前往Reddit.com

当被问到为什么AlphaGo Zero的训练如此稳定?

David Silver说,AlphaGo Zero所用的算法与策略梯度、Q-learning之类的传统(无模型)算法不同,通过使用AlphaGo search,我们极大地改进了策略和自我对弈的结果,然后我们应用简单的、基于梯度的更新来训练下一个策略+价值网络(policy+value network)。这比渐进的、基于梯度的策略改进(policy improvement)要稳定的多。

为什么这次Zero就训练了40天?训练3个月会怎样?

David Silver认为,这是一个人力和资源优先级的问题,如果训练3个月,我想你会问训练6个月会发生什么。

为什么一开始选择用人类对局数据来训练AlphaGo,而不是通过自我对弈来从0开始?之前的AlphaGo瓶颈在哪里?

David Silver表示,创造一个完全自学的系统,一直是强化学习中的一个开放式问题,之前都非常不稳定,之后我们做了很多实验,发现AlphaGo Zero的算法是最有效率的。

DeepMind和Facebook几乎同时开始研究这一课题,为什么你们能达到这个水平?

David Silver说,Facebook更专注于监督学习,我们关注强化学习,是因为相信它最终会超越人类的知识,研究表明,仅使用监督学习能够获得令人惊讶的表现,但如果要远超人类水平,强化学习才是关键。

AlphaGo Zero是AlphaGo的最终版本吗

David Silver:我们已经不再主动研究如何让AlphaGo变得更强,但我们仍然用它尝试新的想法。

AlphaGo有没有开源计划?

David Silver:我们在过去已经开源了许多代码,但AlphaGo始终是一个复杂的过程,它是一个非常复杂的代码。

背景阅读:

谷歌子公司DeepMind日前发布了一款新版本的AlphaGo程序,它能通过自学玩转多种游戏,这套系统名为“AlphaGo Zero”,它通过一种名为“强化学习”的机器学习技术,可以在与自己游戏中吸取教训。

仅三天时间,AlphaGo Zero自行掌握了围棋的下法,还发明了更好的棋步。这期间,除了被告知围棋的基本规则,它未获得人类的帮助。随着AlphaGo Zero被不断训练时,它开始在围棋游戏中学习先进的概念,并挑选出一些有利的位置和序列。

经过三天的训练,该系统能够击败AlphaGo Lee,后者是去年击败了韩国选手李世石(Lee Sedol)的DeepMind软件,胜率是100比0,经过大约40天的训练(约2900万场自玩游戏),AlphaGo Zero击败了AlphaGo Master(今年早些时候击败了世界冠军柯洁)。

关注网易智能公众号(smartman163),获取人工智能行业最新报告。

相关推荐
热点推荐
何晴生前一直拿李雪健给自己打气

何晴生前一直拿李雪健给自己打气

大象新闻
2025-12-14 17:57:02
一口气看完维吾尔族两千年的演化史。

一口气看完维吾尔族两千年的演化史。

老范谈史
2025-12-12 23:49:26
为什么我们不再为孟晚舟回国而感动

为什么我们不再为孟晚舟回国而感动

亚哥谈古论今
2025-12-14 18:20:50
新华社快讯:悉尼枪击事件一名枪手身份已确认

新华社快讯:悉尼枪击事件一名枪手身份已确认

新华社
2025-12-14 18:45:18
百年大厂,倒下!700人面临失业

百年大厂,倒下!700人面临失业

南方都市报
2025-12-14 10:25:36
上海猎头大佬庄华猝死:白天谈完千万大单,晚上人就没了,值吗?

上海猎头大佬庄华猝死:白天谈完千万大单,晚上人就没了,值吗?

卷史
2025-12-14 11:18:07
大爆发!韩旭28+13+4帽创多项新高 大胜联赛第一加盟3战全胜

大爆发!韩旭28+13+4帽创多项新高 大胜联赛第一加盟3战全胜

醉卧浮生
2025-12-14 17:37:13
中山佳能事件再升级!员工欢送佳能总裁视频流出,评论区炸开锅了

中山佳能事件再升级!员工欢送佳能总裁视频流出,评论区炸开锅了

火山詩话
2025-12-14 17:13:50
ESPN:梅西印度行赞助费1.8亿卢比,印超3750万招标无人问津

ESPN:梅西印度行赞助费1.8亿卢比,印超3750万招标无人问津

懂球帝
2025-12-14 17:25:13
泰国陆军:目前不存在停火安排

泰国陆军:目前不存在停火安排

新华社
2025-12-14 15:57:02
江西省南丰县发生一起交通事故致4人死亡

江西省南丰县发生一起交通事故致4人死亡

澎湃新闻
2025-12-14 18:11:02
重庆“10人聚餐9人开溜”续:最晚走客人已付清餐费

重庆“10人聚餐9人开溜”续:最晚走客人已付清餐费

澎湃新闻
2025-12-14 13:08:28
演员何晴去世,《三国演义》“赵云”扮演者张山透露病情:我们是邻居,她罹患脑瘤还中风了,曾在院子里见到阿姨推着她进出

演员何晴去世,《三国演义》“赵云”扮演者张山透露病情:我们是邻居,她罹患脑瘤还中风了,曾在院子里见到阿姨推着她进出

极目新闻
2025-12-14 13:32:28
佳能走了,为何全网都在给它点赞?这大概就是“体面”最好的样子

佳能走了,为何全网都在给它点赞?这大概就是“体面”最好的样子

魔都姐姐杂谈
2025-12-13 14:00:30
61岁演员何晴去世,好友公开住院照,瘦了很多,变化太大难认出

61岁演员何晴去世,好友公开住院照,瘦了很多,变化太大难认出

180视角
2025-12-14 17:06:13
好友曝何晴生前最大遗憾:没有办理好退休事宜,晚年生活疑很拮据

好友曝何晴生前最大遗憾:没有办理好退休事宜,晚年生活疑很拮据

娱乐圈圈圆
2025-12-14 17:01:10
向太曝马伊琍已再婚:当年文章过不了心理那关

向太曝马伊琍已再婚:当年文章过不了心理那关

娱乐看阿敞
2025-12-12 15:50:00
邻居曝何晴坐轮椅多年,赵云扮演者证实,前夫许亚军在美国拍戏

邻居曝何晴坐轮椅多年,赵云扮演者证实,前夫许亚军在美国拍戏

阿纂看事
2025-12-14 17:09:22
87岁范曾“老来得子”被群嘲,医生一语道破真相,评论区笑疯了

87岁范曾“老来得子”被群嘲,医生一语道破真相,评论区笑疯了

吃瓜局
2025-12-13 14:50:36
美欧乌筹备“决定性”柏林会谈,美国被曝支持乌克兰快速加入欧盟

美欧乌筹备“决定性”柏林会谈,美国被曝支持乌克兰快速加入欧盟

澎湃新闻
2025-12-14 12:56:26
2025-12-14 20:31:00

科技要闻

当人形机器人有了App Store,宇树在赌什么

头条要闻

何晴唯一儿子已从中戏毕业 不久前和父亲合体亮相杂志

头条要闻

何晴唯一儿子已从中戏毕业 不久前和父亲合体亮相杂志

体育要闻

马刺终结雷霆:以勇猛,以文班亚马

娱乐要闻

何晴生前最大谣言!没有再婚嫁廖京生

财经要闻

重大违法强制退市!10人被判刑

汽车要闻

硬核敞篷巴士?掷弹兵Game Viewer 2026年初量产

态度原创

教育
房产
亲子
游戏
手机

教育要闻

必看!华南理工考点(4414)应试须知!

房产要闻

车程5分钟价差300万 海棠湾的这个盘要火!

亲子要闻

胳膊和腿抖一年了什么原因 怎么办

《如龙》系列20周年纪念 已有玩家与桐生一马“结婚”

手机要闻

别急着更新iOS 26.2正式版:升级体验后,不吐不快!

无障碍浏览 进入关怀版
×