网易首页 > 网易财经 > 正文

王小川谈人机大战:重演了一部进化史,重新认识智慧的边界

0
分享至

(原标题:王小川谈人机大战:重演了一部进化史,重新认识智慧的边界)

摘要: 如果有合适的条件,完全可能有其他的生命进化路径,以及更不一样的进化结果。

AlphaGo三番棋对决中的第二盘昨日打响,最终柯洁不敌阿尔法围棋,第二盘告负,目前双方比分0:2。

随后搜狗公司CEO王小川在知乎上发布评论文章称,2017人机大战的意义在于它重演一部进化史,重新认识智慧的边界。王小川表示,“AlphaGo2.0 告诉我们:如果有合适的条件,完全可能有其他的生命进化路径,以及更不一样的进化结果。”

王小川认为,AlphaGo 2.0与1.0已大不相同,新的算法对计算资源开销极小,把当前棋局输入神经网络,电流流过,输出就是最佳的走棋方案。王小川猜测,有可能仅仅依靠一个 GPU 工作,每一步棋消耗的能源接近人的大脑。

在王小川看来, AlphaGo2.0已经 完全抛弃掉人类这两千年来进化的围棋经验,另寻他径,仅凭两台机器自我对弈中学习和进化,最终不仅赶超了人类进化的速度,还发展出一套截然不同的下棋方法,并且更加接近完美的状态,实现了对人类的碾压,重演了一部围棋的进化史,而且得出了与这两千年来不同的进化结果。

附王小川评论全文:

该来的终于来了。

一年前 AlphaGo 发布,看完论文后我就在知乎上发文预测机器会完胜人类。好些行业朋友不相信,为此我收了很多“智商税”,之后微信发红包一直发到春节才发完。此外我还立了两个断言:一个是 Google 很有可能再研发出 AlphaGo 2.0,摆脱“监督学习”,不再需要人类下围棋的历史数据,而是只通过“增强学习”,两台 AlphaGo 自我对战学习如何下棋,并达到登峰造极的地步。从公开的资料判断,此言中了。这意味着什么呢,又有什么看点呢?

技术重大提升:和 1.0 原理大不同,更接近于人

AlphaGo 1.0 是巧妙地混合了三种算法:蒙特卡洛树搜索 + 监督学习 + 增强学习。其中蒙特卡洛树搜索是一种优化过的暴力计算,比 1997 年深蓝的暴力计算更聪明。而这里的监督学习,是通过学习 3000 万步人类棋谱,对六段以上职业棋手走棋规律进行模仿,也是 AlphaGo 获得突破性进展的关键算法。而增强学习作为辅助,是两台 AlphaGo 从自我对战众中学习如何下棋,据悉对棋力提升有限。

根据公开资料推测,此次 AlphaGo2.0 的技术原理与之前有着巨大不同:

1. 放弃了监督学习,没有再用人的 3000 万局棋谱进行训练。这本是 AlphaGo 最亮眼的算法,也是今天主流机器学习不可避免的核心条件:依赖于优质的数据,在这个特定问题下就这么被再次突破了。

2. 放弃了蒙特卡洛树搜索,不再进行暴力计算。理论上,算法越笨,就越需要暴力计算做补充。算法越聪明,就可以大大减少暴力计算。从 AlphaGo 2.0 的“马甲”Master 的历史行为看,走棋非常迅速,约在每 10 秒钟就走棋一步,如此速度很可能是放弃了暴力的计算。

3. 极大地强化了增强学习的作用,之前敲边鼓的算法,正式成为扛把子主力。想想看有多励志:两台白痴机器,遵守走棋和获胜规则,从随机走棋开始日夜切磋,总结经验,不断批评和自我批评,一周后终成大器。

在这样的算法下,AlphaGo 2.0 对计算资源开销极小,把当前棋局输入神经网络,电流流过,输出就是最佳的走棋方案。我猜测如此算法下,有可能仅仅依靠一个 GPU 工作,每一步棋消耗的能源接近人的大脑。

最大看点: AlphaGo2.0 棋风完全脱离人类经验

今年年初,AlphaGo 化身 Master 连胜人类顶尖棋手 60 局。在围棋领域,机器完胜已经变成公认的定论。这导致很多人开始问:这次人机大战还有意义吗?我们的关注点不再是机器是否会赢——而是机器将用什么姿势战胜人类。

AlphaGo 学习了 3000 万步人类棋谱,走棋风格也近似于人。在比赛现场,偶有 AlphaGo 走棋和人的经验不符合,就被评为“愚蠢”,只是在中盘之后发现机器渐渐局面占优最终获胜,为了自圆其说解读为“AlphaGo 中盘逆转”,前两局莫过如此。第三局开始评论者长了教训,开始尊称 AlphaGo 为“阿老师”,有了欣赏和敬畏的心态。这带给围棋界很大的冲击,以前大家认为正确的东西,其实是不正确的。

柯洁曾经评价说:“AlphaGo 出现,很多理论都被推翻,再看以前定式变得好笑,亏那么多目就不再是两分。”人类通过数千年实战,总结了围棋理论,然后计算机告诉人类:这些全都是错的。现在在很多比赛上,人类棋手已经开始向机器学习,模仿 AlphaGo 的下法,棋圣聂卫平也曾表示“理论被颠覆了”。

而 AlphaGo2.0 脱离了机器对人模仿,走棋风格也将完全脱离人的定式。在与柯洁的比赛中,会不断出现我们意想不到的走棋,而且这些走棋在教科书中会被认为是低级错误或者完全不可理喻,但凡一个正常的棋手都不会这么玩,但凡一个新手这么玩都会被点拨这样不对。

而 AlphaGo2.0 会不断制造这样的局面,关键他还是对的。可想对专业棋手的心理会有多大的震撼:不仅自己这一辈子都没这么想过这么下棋,整个围棋界都没有想过。会不会怀疑自己白活了?会不会反思两千年围棋的发展为什么有这样的瓶颈?还有多少海阔天空等着我们去探索?可等不及我们去探索,计算机就给出了终局的答案,多么惆怅。

我们会津津乐道,AlphaGo 是什么棋风。但可以这样推理:但凡有流派和风格,就还有局限性。只有当所有流派合一看不出流派的时候,才到达致高境界。AlphaGo 2.0 便会是这么一台机器,没有风格,稳如磐石。

可以想见这次与柯洁的对弈,能频现“怪招”,完全颠覆人类对围棋的理解——这会是比赛最大的看点。英勇的柯洁,要解锁 108 种姿势来抵挡了。

2017 人机大战的意义:重演一部进化史,重新认识智慧的边界

2016 年在 AlphaGo 和李世石的对战后,人工智能进入大众的视野,我们开始重新思考机器和人的关系。

围棋已经有两千多年的历史,在漫长岁月的琢磨中,围棋理论不断进化,到达了很高的水准,AlphaGo 的获胜,我们大可以解读于“青出于蓝”,毕竟是在人类围棋进化的主路径上又攀高峰。

而 AlphaGo2.0 完全抛弃掉人类这两千年来进化的围棋经验,另寻他径,仅凭两台机器自我对弈中学习和进化,最终不仅赶超了人类进化的速度,还发展出一套截然不同的下棋方法,并且更加接近完美的状态,实现了对人类的碾压,重演了一部围棋的进化史,而且得出了与这两千年来不同的进化结果。

这会给我们什么启示?如果跳出围棋的规则,类比看地球生命的进化:人类是从原始的有机物,到单细胞开始逐步变成灵长类动物,并且发展出超越其他一切生物的智慧。这条路径是唯一的么?人类的生命形态和最顶级的生命形态还有多大距离?AlphaGo 告诉我们:我们还有极大的发展空间,AlphaGo2.0 告诉我们:如果有合适的条件,完全可能有其他的生命进化路径,以及更不一样的进化结果。

让我们欢呼人的智慧造就了 AlphaGo,这也帮我们开了眼界,看到我们离最终的生命形态和智慧依然有遥远的距离。

保持敬畏,坚定前行,终得圆满。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

相关推荐
热点推荐
2-1,33岁韩国球星闪耀欧洲:妙传+绝杀,助德甲第17取欧协3连胜

2-1,33岁韩国球星闪耀欧洲:妙传+绝杀,助德甲第17取欧协3连胜

侧身凌空斩
2025-11-07 05:13:34
去了一次上海和平饭店,我才明白什么叫“贫穷限制了想象”!

去了一次上海和平饭店,我才明白什么叫“贫穷限制了想象”!

诗意世界
2025-11-05 22:33:13
俄罗斯追求了一辈子不冻港,到头来却只有四个能用!

俄罗斯追求了一辈子不冻港,到头来却只有四个能用!

小雪的运动之心
2025-11-06 14:10:32
状元秀弗拉格18中8得20分8板2助3断2帽,首节献暴力空接隔扣

状元秀弗拉格18中8得20分8板2助3断2帽,首节献暴力空接隔扣

懂球帝
2025-11-06 12:20:13
胡适评价毛主席写的词,“没有一句通的”,那么胡适的水平如何?

胡适评价毛主席写的词,“没有一句通的”,那么胡适的水平如何?

芊芊之言
2025-11-04 00:10:09
用轨道武器干扰中国卫星,中方知道美军没下限,留的后手就为这天

用轨道武器干扰中国卫星,中方知道美军没下限,留的后手就为这天

阿筀田间生活
2025-11-06 11:38:06
200名哈马斯被围,内塔尼亚胡“以牙还牙”

200名哈马斯被围,内塔尼亚胡“以牙还牙”

山河路口
2025-11-04 14:02:42
中国颜值巅峰的6个AAAAA景区,去过3个很幸福,去过6个此生无悔!

中国颜值巅峰的6个AAAAA景区,去过3个很幸福,去过6个此生无悔!

户外钓鱼哥阿勇
2025-10-21 08:15:56
梅德韦杰夫心里清楚,无论俄罗斯打输打赢,都将是他的上位机会

梅德韦杰夫心里清楚,无论俄罗斯打输打赢,都将是他的上位机会

男女那点事儿儿
2025-11-07 06:34:27
“不给50条烟不让走”?知情者称一婚车被拦,新人弃车离开,律师:已达刑事立案标准

“不给50条烟不让走”?知情者称一婚车被拦,新人弃车离开,律师:已达刑事立案标准

封面新闻
2025-11-06 15:37:07
老年人补办的结婚证,算不算进结婚登记数据里?

老年人补办的结婚证,算不算进结婚登记数据里?

何亚福
2025-11-07 11:31:09
10岁男孩被生母继父虐打致死埋尸坟墓,生父称案件再次开庭:“他俩是共同作案,公检法有证据链”

10岁男孩被生母继父虐打致死埋尸坟墓,生父称案件再次开庭:“他俩是共同作案,公检法有证据链”

大风新闻
2025-11-06 21:19:03
中央5台直播乒乓球时间表∶CCTV5直播全运会乒乓球!附赛程

中央5台直播乒乓球时间表∶CCTV5直播全运会乒乓球!附赛程

皮皮观天下
2025-11-07 10:41:24
印度药在中国集采大获全胜

印度药在中国集采大获全胜

凯利经济观察
2025-11-05 09:32:14
LV总裁吴越现身上海!马上70岁,戴着钻戒名表身材苗条像四五十岁

LV总裁吴越现身上海!马上70岁,戴着钻戒名表身材苗条像四五十岁

乐悠悠娱乐
2025-11-07 11:00:50
高市早苗彻底不装了,给“台独”分子授勋,解放军代表团取消访日

高市早苗彻底不装了,给“台独”分子授勋,解放军代表团取消访日

Ck的蜜糖
2025-11-07 11:10:25
湖南副院长和医生事件:完整视频曝光,曝光者完美隐身,更多内幕

湖南副院长和医生事件:完整视频曝光,曝光者完美隐身,更多内幕

来条娱吃
2025-11-06 21:34:47
小学老师开车进校、学生两侧敬礼高喊“老师早”引争议,官方通报

小学老师开车进校、学生两侧敬礼高喊“老师早”引争议,官方通报

观察者网
2025-11-06 23:05:22
A股午评:沪指半日微跌0.16%,创业板指跌0.37%,减速器、证券、计算机等概念走弱

A股午评:沪指半日微跌0.16%,创业板指跌0.37%,减速器、证券、计算机等概念走弱

界面新闻
2025-11-07 11:33:45
价格翻倍!华强北集体暴涨,深圳卖家:不敢囤货,但可能更贵

价格翻倍!华强北集体暴涨,深圳卖家:不敢囤货,但可能更贵

都市快报橙柿互动
2025-11-07 00:13:42
2025-11-07 12:23:00

财经要闻

老登们的社交货币全崩了

头条要闻

美国试射洲际弹道导弹后 俄方几乎整个领导层齐聚克宫

头条要闻

美国试射洲际弹道导弹后 俄方几乎整个领导层齐聚克宫

体育要闻

是天才更是强者,18岁的全红婵迈过三道坎

娱乐要闻

白百何回应东京电影节争议

科技要闻

75%赞成!特斯拉股东同意马斯克天价薪酬

汽车要闻

小鹏X9增程版综合续航1606公里 有底气挑战赛那?

态度原创

教育
旅游
本地
房产
数码

教育要闻

学生有错题本,原来老师也有错题表。你孩子的老师也这么做吗

旅游要闻

邀你体验多彩贵州冬季新玩法!贵旅集团赴大湾区推介肇侗寨、加榜梯田、岜沙苗寨

本地新闻

这届干饭人,已经把博物馆吃成了食堂

房产要闻

锚定居住新趋势!广佛新世界重构湾区“理想生活投资学”

数码要闻

注意!超值又靠谱的千元级板U套装就看这些

无障碍浏览 进入关怀版
×