网易首页 > 网易数码 > 正文

一剑西来天外飞仙:AlphaGo与围棋变革

0
分享至

(原标题:一剑西来天外飞仙:AlphaGo与围棋变革)


第1页:AlphaGo的计算力与配置

【中关村在线原创】前不久在浙江,围棋目前ELO等级分第一、多次世界冠军柯洁与Deepmind的人工智能围棋程序AlphaGo的三番棋落下了帷幕。第三盘上我们看到了柯洁的泪水。第二次人机大战让全人类见识到了今天的AI在卓越算法和深度神经网络的双重合力之下,如何征服了人类几千年来积累的围棋的理解与经验。最遗憾的是,DeepMind宣布AlphaGo收山了,世间只留下一段传奇。



中国棋院授予AlphaGo第43个正式九段证书

AlphaGo的计算力与配置

这次人机大战,第二天的AI论坛爆料很多,可惜后面记者的提问都没有问Deepmind AlphaGo的首席David Silver更多关于AlphaGo的技术细节。但就已知的来说,李世石版本的需要1300多个处理器加上280个GPU,这个版本改进了,所以只要4个TPU就可以,所以后来公布的棋谱,应该是部署了很多对AlphaGo一起下的,这样可以几天就收集到数以百计的狗的慢棋棋谱。


TPU2代的配置可以看出TPU:CPU大约就是2:1的比例

AlphaGo的硬件架构大幅度的缩减但是棋力却大幅度提升,作为科技领域的记者,我在想的问题是,抛开软件是算法,到底需要多少计算能力就能达到Master的棋力?神经网络拼的是“神经元”节点的数量,并非CPU有多快,一般来说就是TPU:CPU=2:1。也就是说配合一个双处理器的至强E5 2699插满内存,加上4个TPU二代(满打满算,实际用的一代)就可以实现碾压所有人类的棋力。


能买到的最强机器学习加速卡:nVidia的TESLA P100

再换算一下,因为我们买不到TPU,那是谷歌内部使用的。在性能测试上,TPU2的计算能力是45TFLOPS,四个就是180T,而NV刚刚公布的新DGX-1是8个Tesla P100,有170T的能力,大体上二者相当。也就是日本的DeepZenGo的配置,双至强2699V4+4 GTX1080其实也差不多够了,只是“地震狗”的算法比真狗差太多。


TPU在AI领域被寄予了无限的希望

换言之,实际上的AlphaGo是一代TPU4个,因此可能只要4个Tesla P100可能就已经具备了相对应的计算力。Google自己搞TPU除了为自己的TensorFlow优化,还有避免花太多钱买GPU的意思,而定制的TPU还可以让学习的效率更高。


第2页:AlphaGo的棋力极限在哪里

AlphaGo的棋力极限在哪里

很遗憾的是,我们没有看到以后也极可能没有机会看到AlphaGo下对顶尖棋手的让子棋,只有内部测试的对历史上版本的让三个子,鉴于DeepMind一直一来的谦虚传统,真觉得真相未必这样。



DeepMind内部的测试与柯洁对战的版本比对李世石的版本棋力要强3个子



AlphaGo Master版本对战的棋谱第二盘震惊了整个围棋界

其实结合公布的50盘自战谱,可以发现我们认为AlphaGo不行的什么大混战什么打劫,都是井底之蛙。之前对人的60盘快棋里面,基本都是50手左右人已经不行了,人太菜,连见识疯狂对杀的机会也没有。


人机配对赛出现了AlphaGo投降、但是古力觉得还能下的有趣一幕

再结合古力和Master配对的传说,古力两三手棋,就让胜率从75%掉到了45%,AlphaGo就是下让子棋,哪怕让你2-3个子,你下出了立二后拆三之类的棋,它后台胜率就能提升一截,多下几步你觉得“正确的应对”、“必然的一手”“本手”可能就丧失了让三个子的大优势拉回到同一起跑线,再然后进入它的步调,当然让子的存在可以有特殊的应对策略。

柯洁在后来的Blog里面也说,以后如果Master再出来下棋,人应该恭恭敬敬的摆上两个子,以表示对棋力的尊重。


第3页:千年的理论就此打破?

千年的理论就此打破?

我们从小知道3平方+4平方=5平方,这是基本的数学。平方推广到n的时候有没有整数解?这是费马定理,用到的办法叫代数数论,在数学的层次上就高的不知道哪里去了。最近有张流行的图片,数学的海洋,我觉得用来比喻人与Master的差距还是很合适的。



数学的深渊来比喻人和AlphaGo对围棋理解上的差距还是很合适的

所以当我们去欣赏它的着法的时候,有种深深的无力感。当时Master的60盘的时候,很多棋手就是下着下着就不行了,现在大家共同的理解是,在狗看来,它自己每一步都走到了全局看最优的地方,而我们还在拘泥于过去的传统结构当中。


点星位33是围棋初学的定式,但是AlphaGo的处理带给我们的思考是革命性的


人工智能AlphaGo教授告诉我们应该这么下,局面是两分的

比如讨论的非常多的星位点33,我觉得应该这么看,下在星位肯定是不坏的,33点了之后取实地,哪怕只几目,在AlphaGo的评估里面也不算差,以后点三三的定式应该大家都按照AlphaGo的下法飞了之后顶,守角的扳了走别的地方。当然我们觉得总体来说点三三不便宜,因为人家走在外面厚,点的人里面目不是太多。但什么是薄什么是厚?可能你15子的配置不如人家12个子的效率高,那就别聊薄厚了,AlphaGo早就教育我们不是面向某个方向有一些棋子就叫厚。


人机大战第一局AlphaGo下到数字标号5的时候,人普遍认为是后手不好(图:新浪棋牌新闻)

所以过去我们概念里面的俗手、先后手、无理手这些概念真的还成立吗?柯洁的第一盘,AlphaGo的一断是后手,但是人家一个子关系到后面很远的发展,所以来了个“后中先”,但说实话我觉得这就是人不如AlphaGo的地方,AlphaGo眼中那就是急所应该先走的地方。棋力远高于所有人的Master起码不这么认为,步步下在全盘看来价值最大的地方,那么它的每一步就都是先手,都有道理,没有俗手。当然那得是它下出来的,人学个皮毛下出来的应该还是臭棋,因为你这个应对没有算到AlphaGo那么远,效率低。前几天的LG杯上就出现了不少AlphaGo自我对战的新的着法。


第4页:什么叫技术领先?

什么叫技术领先?

围棋AI,可以分为两种。正式比赛过的V18和Master,其它的都是仿品。



Nature的论文告诉了全世界AlphaGo实现的原理

其它的围棋软件研发团队翘首以盼的无疑是新论文。怎么去定义科技领先?第一篇论文发表之后,棋界表示樊麾太臭,根本不是我的对手……事实教育了李世石,也让人感受到了它的强大之后,Master的60盘应该是让棋界彻底服了。


DeepMind的哈萨比斯表示6月将发布新论文来解释Master为何比李世石的版本更强

但是这期间受到公开的论文启发,诞生的模仿AlphaGo的软件不少,投入的资源也颇多,但是都达不到正品的棋力,并且找不到改进的办法,这就是技术落后,单无论如何,论文已经把围棋软件的能力带上了一个前所未有的高度不是吗?前年我们还都一致的认为计算机围棋战胜人类还得几年呢。


AlphaGo只是验证AI有效性的工具,其目标远大

新论文很可能会告诉我们从12层深度神经网络到40层,这28层的差异是什么,层与层之间如何去相互影响,用什么办法可以提升整个软件的效率,DeepMind说提升10倍,笔者个人觉得觉得少了,因为它的硬件配置上少了太多但是棋力更强,效率应该不止10倍。当然DeepMind那个层面考虑的是这么做对于机器学习来说意义在于哪里,更高效率的深度神经网络对于整个科技界甚至谋求人类福祉的意义在哪里,如何更好的利用而不仅仅是下围棋。

对于其它的围棋AI这些来说,新论文及模仿实现一定会让这些软件有了大幅度的棋力,Deepmind的意思也在这里,这些软件提升了(而且我的论文展示的技术和理论保证你也能学用),就足够指导现在的人类顶尖高手去提升围棋水平了。Master收山以及不玩机器对机器的对抗也就意义在于此。

本文属于原创文章,如若转载,请注明来源:一剑西来天外飞仙:AlphaGo与围棋变革http://oa.zol.com.cn/642/6422051.html

相关推荐
热点推荐
16岁“烤鸡少年”爆火之后:每天工作超17小时暴瘦20斤,会因为黑评抹眼泪;为使用添加剂道歉,已配合相关部门开展检验

16岁“烤鸡少年”爆火之后:每天工作超17小时暴瘦20斤,会因为黑评抹眼泪;为使用添加剂道歉,已配合相关部门开展检验

极目新闻
2026-01-01 16:19:25
陈赓同林帅三次爆发争执,陈赓怒斥:再顶嘴我就毙了你!林彪为何敢于坚持己见?

陈赓同林帅三次爆发争执,陈赓怒斥:再顶嘴我就毙了你!林彪为何敢于坚持己见?

文史明鉴
2025-12-28 20:26:09
贺子珍回国后想再婚,询问女儿意见,李敏喊出2个字,她大哭放弃

贺子珍回国后想再婚,询问女儿意见,李敏喊出2个字,她大哭放弃

阿器谈史
2025-12-18 10:41:18
她是毕福剑得意门生,师父落难时不离不弃,如今活成梦想中的样子

她是毕福剑得意门生,师父落难时不离不弃,如今活成梦想中的样子

卷史
2026-01-01 09:54:30
董璇自爆全年都穿一次性内裤,一条100多块,网友集体破防

董璇自爆全年都穿一次性内裤,一条100多块,网友集体破防

星创文化
2025-12-01 22:54:08
开打了!美国和委内瑞拉,同时动手了!

开打了!美国和委内瑞拉,同时动手了!

大嘴说天下
2025-12-31 21:29:44
仅3+3!正负值却+20,乌度卡赛后谈电风扇明牌,火箭5300万真划算

仅3+3!正负值却+20,乌度卡赛后谈电风扇明牌,火箭5300万真划算

巴叔GO聊体育
2026-01-01 16:44:16
“最快女护士”张水华问鼎东极抚远新年马拉松,新年第一跑将获1.5万元奖金

“最快女护士”张水华问鼎东极抚远新年马拉松,新年第一跑将获1.5万元奖金

扬子晚报
2026-01-01 10:55:29
打脸了!《疯狂动物城2》破100亿,《阿凡达3》破45亿!

打脸了!《疯狂动物城2》破100亿,《阿凡达3》破45亿!

阿废冷眼观察所
2025-12-30 07:45:34
多多的状态有点不对劲了,谁能想到19岁的星二代这样跨年

多多的状态有点不对劲了,谁能想到19岁的星二代这样跨年

并不擅长圈粉的铁任
2025-12-31 23:20:56
47天新增100万用户 星链的增长“飞轮”为何越转越快?

47天新增100万用户 星链的增长“飞轮”为何越转越快?

C114
2025-12-30 09:16:05
不打垮中国不罢休?“大鱼”终 于现身,不是美国,中俄都没料到

不打垮中国不罢休?“大鱼”终 于现身,不是美国,中俄都没料到

爱吃醋的猫咪
2025-12-31 20:45:12
假如蒋介石带领台湾回归,会得到什么职位?1956年周总理给出答案

假如蒋介石带领台湾回归,会得到什么职位?1956年周总理给出答案

触摸史迹
2026-01-01 16:56:08
60岁以上注意:2026年拿身份证去办这5件事,好处别错过!

60岁以上注意:2026年拿身份证去办这5件事,好处别错过!

前沿天地
2025-12-21 16:14:39
日本知名女星长泽雅美元旦宣布已与电影导演结婚

日本知名女星长泽雅美元旦宣布已与电影导演结婚

随波荡漾的漂流瓶
2026-01-01 12:03:45
日方访华果然黄了,王毅警告高市不到24小时,东京付出多重代价

日方访华果然黄了,王毅警告高市不到24小时,东京付出多重代价

谛听骨语本尊
2026-01-01 20:03:58
优质“蛋白质”排行榜!大豆排倒数第1,虾肉才排第4,第一名很多人都不知道

优质“蛋白质”排行榜!大豆排倒数第1,虾肉才排第4,第一名很多人都不知道

美食格物
2025-12-29 16:58:15
蔡磊致渐冻症病友新年公开信:历史已经被改写,将抗争到最后一刻

蔡磊致渐冻症病友新年公开信:历史已经被改写,将抗争到最后一刻

澎湃新闻
2026-01-01 15:36:32
金融大家评 | 收入分配制度或迎重大改革!

金融大家评 | 收入分配制度或迎重大改革!

清华金融评论
2026-01-01 18:17:42
"灯神"长泽梓:14岁出道却成时代遗憾,她到底输在哪?

"灯神"长泽梓:14岁出道却成时代遗憾,她到底输在哪?

素然追光
2026-01-01 03:20:03
2026-01-01 21:27:01

头条要闻

女子称奶奶去世公司不批假被逼离职 公司法人:害群之马

头条要闻

女子称奶奶去世公司不批假被逼离职 公司法人:害群之马

体育要闻

2026,这些英超纪录可能会被打破

娱乐要闻

跨年零点时刻好精彩!何炅飞奔拥抱

财经要闻

巴菲特「身退,权还在」

科技要闻

特斯拉Model 3车主首度全程自驾横穿美国

汽车要闻

一汽-大众2025年整车销量超158万辆 燃油车市占率创新高

态度原创

房产
手机
家居
健康
教育

房产要闻

实景暴击!海口这个顶流红盘,抛出准现房+顶级书包双王炸!

手机要闻

疑似麒麟9050爆料:1+7+2十核架构加持,多核跑分突破9200!

家居要闻

无形有行 自然与灵感诗意

元旦举家出行,注意防流感

教育要闻

辞旧迎新 欢乐满园 ——青岛敦化路小学2026元旦庆祝活动精彩回顾

无障碍浏览 进入关怀版
×