网易首页 > 网易号 > 正文 申请入驻

DeepMind发69页长文掀开AlphaZero的黑盒:神经网络学到的知识和人类基本相似!

0
分享至

新智元报道

编辑:LRS

【新智元导读】AlphaZero下棋和人类下棋究竟有什么区别?是否掌握了一些人类未曾了解过的知识?DeepMind最近携手国际象棋世界冠军发69页论文,深度解剖AlphaZero后发现,神经网络学到的知识和人类基本相似!

机器学习系统通常被认为是不透明的、不可预测的,和人类所接受的训练几乎没有任何共通之处。

难道,黑盒模型和可解释性的学习注定是两条路?

但最近有研究表明,至少在某些情况下,神经网络能够学习到一些人类可理解的表征!

例如分类器中的单个神经元可以表示一些语义信息,语言模型中也包含语法信息,在视觉和文本数据的对齐数据中也能发现一些复杂的概念表示,这些神经网络学到的概念都和人类接受的概念训练相关。

但还有一个问题,这些学习到的概念是通用的吗?我们是否也希望其他深度学习的系统具有类似的有意义的表示?

如果这些问题的答案都是没有的话,那么一些关于反映模型计算过程可解释性的研究将受到种种限制,并且很难找到其他合理的方法来解释。

虽然上面提到的几个例子能一定程度上能展现机器学习模型能够理解人类的语义,但本质上是因为它们只能接触到人类生成的数据,并且在分类任务中是将人类的类别概念强加给模型才导致它们能捕捉到类别语义。

或者说,这些任务也相对简单,解释起来也更加容易。

为了进一步测试机器学习模型是否真正获取到了人类可理解概念(human-understandable concepts),需要找到一个在没有使用人类标签数据的情况下,表现出超越人类表现的模型。

这不巧了吗?AlphaZero就同时满足这两个要求。

首先,AlphaZero是通过self-play的方式训练的,所以从未接触过人类数据,并且它在国际象棋,围棋和将棋(Shogi)这三项竞技游戏上借助蒙特卡洛树搜索成功战胜人类。

所以AlphaZero就成了研究机器学习模型和人类理解之间关系的一座重要桥梁,如果AlphaZero中能找到人类可理解的概念,那其他模型应该也会有!

说干就干!

DeepMind、Google Brain的研究人员携手国际象棋世界冠军共同打造了一篇长达69页的论文,主要研究了像AlphaZero这样的超越人类的神经网络模型正在学习什么,这是一个既科学又实用的问题。

在论文中研究人员证明了人类获取知识和AlphaZero在国际象棋中获得的知识都是相似的。并通过对大量人类关于国际象棋的概念的探索,还可以观察到其中一些概念在AlphaZero网络是如何表示的。

https://arxiv.org/abs/2111.09259

论文中邀请到的国际象棋大师是弗拉基米尔·克拉姆尼克(Vladimir Kramnik),俄罗斯著名国际象棋手,1992年获特级大师头衔。2000年至2007年,是国际象棋世界冠军。他的等级积分为2801分,世界排名第四(活跃选手排名第三)。

研究方法主要分为三个方面:

1、概念的探测(Probe of Concepts)

研究人员的首要任务是研究AlphaZero的内部表征,即其神经网络内神经元的激活(activation)情况是否与人类关于国际象棋的概念相关。

如果从网络的内部表示可以很容易地预测人类概念,那么通过深入研究来揭示更多的信息也是有可能的。如果学习到的表征与人类概念没有关系,那么AlphaZero的内部计算在进一步研究后可能仍然不透明。

基于概念的方法就是在一个大的输入数据集上从网络激活中检测人类概念。因为国际象棋经过多年的发展,已经是高度理论化了,所以已经有大量现成的人类定义过的概念可以使用,并且这些概念也足够复杂。 而 所有这些概念结合在一起就能够得到一次完整的位置评估(position evaluation)。

此外,整个探索过程是自动化的,因此研究人员可以在self-play训练中探索每个概念、每个区块和多个检查点,从而能够建立一个学习内容的蓝图。

当然,基于概念的方法远远不是理解神经网络计算的唯一方法,

2、研究行为变化(Study behavioural changes)

在研究了内部表征如何随着时间的推移而变化之后,自然要研究这些变化的表征是如何导致行为变化的。

在训练过程中,有些动作(move)优先于处于相同位置的其他动作,这种偏好会随着训练进程而发展。

当AlphaZero在没有蒙特卡罗树搜索(MCTS)的情况下运行时,行为变化仅限于其先前动作选择概率的变化。通过测量一组棋局某一手的动作概率变化能够发现模型行为的变化,并将self-play训练中的游戏演变与高级人类游戏中运动选择的演变进行比较。

3、直接研究激活(Investigate activations directly)

在确定了许多人类概念可以从Alphazero的训练后激活中预测出来后,就可以开始研究这些网络神经元的激活究竟是什么情况了。

研究人员使用非负矩阵因子分解(NMF)技术将AlphZero的表征分解为多个因子。这种方法提供了与现有人类概念无关的信息,也提供了AlphaZero网络计算内容的补充视图。

直接测量单神经元激活和输入之间的协方差也是一种方法,这种方法能够提供输入特征的组合,找到哪些特征的存在与给定神经元的激活最相关。

最后研究结果发现:

许多人类的概念都可以在AlphaZero网络中找到。

研究人员证明了AlphaZero网络的国际象棋内部学习表征可以用来可靠地重建许多人的象棋概念。采用概念激活向量(CAV)的方法,通过训练稀疏线性探针来处理更广泛的概念。这也表明相关信息是由AlphaZero网络计算的。

结果还表明,虽然AlphaZero的象棋知识似乎与人类的概念探针密切相关,但它们之间确实存在差异,因为重建往往是不完整的。

通过使用概念探针方法论(concept probing methodology),可以衡量训练过程中以及网络中每个层相关信息的出现情况,这也能够绘制出一副模型何时何地发现什么概念的一副画面。

研究人员还发现,许多概念在训练的早期就出现惊人的一致性,AlphaZero的动作选择也会迅速发生变化。

概念的使用和相对概念值(Use of Concept and Relative concept value)侧重于描述 AlphaZero值函数随时间的演变。

研究人员再次使用了一种基于概念的方法试图预测一组人类概念的价值函数的输出。通过研究训练过程中概念权重的演变,可以看到AlphaZero的行为如何与高水平的人体象棋概念相关,这也是其下棋风格(style)的一种展现。

可以发现,早期的AlphaZero训练主要集中在材料(material)中更复杂和微妙的概念。如King Safety和Mobility,作为价值函数的重要预测因素,在训练过程较晚中才会出现。

分析表明,人类下棋的发展过程和AlphaZero既有相似之处,也有差异。AlphaZero并没有回顾人类下棋的发展历程,而是从一些招式直接开始训练。但在self-play策略上,人类和AlphaZero基本是相似的。

也许,神经网络的发展终于到了要揭开黑盒的时候了,看一看到底是不是和生物学神经相同!

参考资料:

https://arxiv.org/abs/2111.09259

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国男篮73-92日本,赛后球员表现评分:2满分3优秀 2及格

中国男篮73-92日本,赛后球员表现评分:2满分3优秀 2及格

画夕
2026-07-04 01:07:48
终止重大投资项目!千亿龙头,002709宣布

终止重大投资项目!千亿龙头,002709宣布

中国基金报
2026-07-04 15:15:42
“天才少女”姜萍近况曝光:69岁父亲穿衣寒酸,当地大佬送钱送酒

“天才少女”姜萍近况曝光:69岁父亲穿衣寒酸,当地大佬送钱送酒

凡知
2026-07-04 14:58:18
“鸡排哥”来外滩了!现场排起几十米长队!鸡排还是6元一份,更有限定款造型

“鸡排哥”来外滩了!现场排起几十米长队!鸡排还是6元一份,更有限定款造型

上海黄浦
2026-07-04 17:13:47
中国女排好消息!李盈莹归队,大巴车上晒合照,有望第三站亮相

中国女排好消息!李盈莹归队,大巴车上晒合照,有望第三站亮相

跑者排球视角
2026-07-04 15:30:19
“这也配叫中产?”女孩晒旅行照引热议,原来大家的差距这么大!

“这也配叫中产?”女孩晒旅行照引热议,原来大家的差距这么大!

林林先生
2026-07-04 09:35:05
1980年,北京没收毛主席徽章,一律上交,遇到硬茬:我一枚也不交

1980年,北京没收毛主席徽章,一律上交,遇到硬茬:我一枚也不交

浩渺青史
2026-07-04 01:53:34
加勒万河谷冲突后续,我方秘密武器使印军“雪豹计划”瞬间熄火

加勒万河谷冲突后续,我方秘密武器使印军“雪豹计划”瞬间熄火

南冥那只猫
2025-06-20 20:28:28
连续5个涨停板!股民:卖飞的苦谁懂!

连续5个涨停板!股民:卖飞的苦谁懂!

数据挖掘分析
2026-07-04 15:41:29
唏嘘!亚足联9队皆无缘16强 5队小组垫底 创近12年世界杯最差战绩

唏嘘!亚足联9队皆无缘16强 5队小组垫底 创近12年世界杯最差战绩

我爱英超
2026-07-04 05:02:33
日媒曾通告全球:如果中日开战,中国人会抢着当先锋,引高度关注

日媒曾通告全球:如果中日开战,中国人会抢着当先锋,引高度关注

时光流转追梦人
2026-07-03 10:28:31
首秀6中6!勇士新援爆发!大胜湖人32分

首秀6中6!勇士新援爆发!大胜湖人32分

篮球教学论坛
2026-07-04 14:19:43
四大Ai打PK|预测明天7.5美加墨世界杯1/8决赛两场比赛比分结果

四大Ai打PK|预测明天7.5美加墨世界杯1/8决赛两场比赛比分结果

生活新鲜市
2026-07-04 15:23:03
佛得角门将在本届世界杯已有一次过人,这个数据超过了C罗

佛得角门将在本届世界杯已有一次过人,这个数据超过了C罗

红星新闻
2026-07-04 10:03:30
肝癌为什么越来越多?建议:天热宁可打牌,也别做这5件事

肝癌为什么越来越多?建议:天热宁可打牌,也别做这5件事

芹姐说生活
2026-07-03 23:53:19
尴尬!C罗世界杯0过人 不如40岁佛得角门将 罗蜜:阿根廷赢靠抢劫

尴尬!C罗世界杯0过人 不如40岁佛得角门将 罗蜜:阿根廷赢靠抢劫

念洲
2026-07-04 11:00:02
豆包、千问:7月15日,下线智能体功能

豆包、千问:7月15日,下线智能体功能

都市快报橙柿互动
2026-07-04 11:09:15
HR小姐姐力排众议招仨美女, 结果三人都怀孕, HR被光速开除!

HR小姐姐力排众议招仨美女, 结果三人都怀孕, HR被光速开除!

扮猫骑老虎
2026-07-04 07:06:33
凌晨3点!世界杯重头戏,9.4万球迷见证 C罗大战亚马尔 CCTV5直播

凌晨3点!世界杯重头戏,9.4万球迷见证 C罗大战亚马尔 CCTV5直播

麦子的篮球故事
2026-07-04 13:36:23
很震撼,夏天有一种臭,叫——裆臭。

很震撼,夏天有一种臭,叫——裆臭。

丁香生活研究所
2026-07-04 12:04:11
2026-07-04 18:11:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15605文章数 66945关注度
往期回顾 全部

科技要闻

韬定律论文V2版,充工程细节和实测数据

头条要闻

男子开餐吧被LV起诉索赔200万:当时很懵 正专心还债

头条要闻

男子开餐吧被LV起诉索赔200万:当时很懵 正专心还债

体育要闻

揭法国锋线最大优势 有人比姆巴佩还快?

娱乐要闻

最富女歌手霉霉完婚 在纽约设宴庆贺

财经要闻

韩国股市杠杆失控:450亿美元资金狂飙

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

手机
游戏
亲子
艺术
军事航空

手机要闻

iPhone 18 Pro/Pro Max国行电池揭晓:5391mAh史上最大

官方确认:《黑旗RE》或增全新"问号" 探索系统大升级

亲子要闻

特朗普念儿童绘本,一开口就“跑偏”了

艺术要闻

16位当代画家,23幅风景与人物作品

军事要闻

普京宣布俄军“完全解放”卢甘斯克

无障碍浏览 进入关怀版