网易首页 > 网易科技 > 网易科技 > 正文

伯克利AI实验室首篇博文:让神经网络实现动态推理

0
分享至

(原标题:伯克利 AI 实验室博客发布首篇文章:让神经网络自行选择模块,实现动态推理 )

深度神经网络虽然在图像,语音,机器人等方面取得了巨大的成功,但是这些成功通常局限在识别任务或者生成任务中,对于推理任务,常规的神经网络通常是无能为力的。伯克利AI实验室近期开通了博客,该博客的第一篇文章针对推理任务,提出了神经模块网络,通过训练多个神经网络模块完成推理任务,每个神经网络模块负责一个推理步骤,对于不同的推理任务,动态的组合这些模块,以生成针对不同问题的新网络结构。

该文章的作者为 Jacob Andreas , 雷锋网了解到,他是伯克利 NLP 四年级博士生,也是 BAIR 实验室成员。他的个人主页上的介绍写着,“我希望能教计算机阅读”,研究方向包括机器学习模型与结构化神经网络方法。同时,他也是一个论文高产者,仅在今年就有多篇论文入选 ICML、ACL、CVPR 等主流国际顶级学术会议。雷锋网对他发表的第一篇论文做了翻译,全文如下:

问题的引入

假设我们正在构建一个家用机器人,并且希望它能够回答有关周围环境的问题。我们可能会问他这些问题:

如何确保机器人可以正确地回答这些问题?深度学习的标准方法是收集大量的问题,图像和答案作为数据集,训练一个单一的神经网络,直接从问题和图像映射到答案。如果大多数问题看起来像左边的问题,目前我们已经有相似的图像识别问题的解决方案,这些单一的方法是非常有效的:

但是对于右面的问题,这种单一的神经网络就很难工作了:

在这里训练好的单一网络已经放弃了,猜测给出了该图像中最普遍的颜色。是什么使得这个问题相比于上一个问题更难?即使图像更清晰简洁,该问题仍需要许多推理步骤:模型必须要首先找到蓝色的圆柱体,找到具有相同大小的另一对象,然后确定其颜色,而不是简单的识别图像中的主要对象。这是一个复杂的计算,同时计算的复杂性与所提出的问题密切相关。不同的问题需要不同的步骤来解决。

深度学习中的主流范式是“一刀切”的方法:对于任何需要解决的问题,设计一个固定的模型架构,希望能够捕获关于输入和输出之间的一切关系,并通过标定好的训练数据学习该模型的各种参数。

但现实世界的推理并不能以这种方式发挥作用:它涉及到各种不同的能力,不同的能力以新的方式结合以解决我们在现实世界中遇到的每一个新挑战。我们需要的是一个模型,它可以动态地确定如何对摆在它面前的问题进行推理——一个可以选择自己的结构的网络。伯克利AI实验室的研究者针对这一问题,提出了一类称为神经模块网络(Neural Module Network, NMN)的模型,它将这种更加灵活的解决方案融入到问题解决过程中,同时也保留了深度学习有效的特性。

如何解决

上面提到的推理问题涉及到三个不同的步骤:找到一个蓝色圆柱找到其他与之相同尺寸的物体,确定其颜色。根据推理过程可以绘制下图:

一个不同的问题可能涉及到不同的步骤,如果问题是“有多少东西与球有相同的大小?”可以会得到下面的推理步骤:

一些基础的操作,例如“比较大小”,在不同的问题中是共享的,但是它们可能会通过不同的方式使用。MNM的关键思路是明确这种共享:使用两个不同的网络结构来回答上面的两个问题,但是在涉及到相同基本操作的网络之间实现共享权重。

对于这样的新型网络结构,如何进行学习?实际上研究者同时训练了大量的不同的网络,在适当的时候将参数绑在一起,而不是通过许多输入/输出对训练单一的大型网络。

上图为几种常见的深度学习网络结构,包括DyNet 和TensorFlow Fold,通过动态地将它们结合在一起,即可以完成不同的推理任务。

在训练过程结束时所获得的并不是一个单一的深度网络,而是一个神经“模块”的集合,每个模块都实现了一个推理的步骤。当希望在一个新的问题实例上使用训练好的模型时,研究人员可以动态的组合这些模块,以生成针对该问题的新网络结构。

关于这个过程一个值得注意的事情是,训练过程中不需要为单个模块提供任何低级别的监督:模型从来没有看到蓝色对象或者“左侧”关系的孤立示例,模块只能在较大的组合结构中学习,只有(问题,答案)对作为监督,但训练程序能够自动推断结构部件与其负责的计算之间的正确关系:

同样的过程也能回答关于现实图片的问题,甚至能够回答其他知识源的问题,例如数据库:

如何从问题得到推理蓝图

这整个过程的关键因素是收集如上所属的高级“推理蓝图”。这些蓝图告诉我们,每个问题的网络应如何布局,以及不同的问题如何互相关联。但是这些蓝图是从哪里来的?

在对参考文献1,2中的模型的初步研究中,研究者在设计特定问题的神经网络和分析语法结构之间找到了惊人的联系。语言学家长期以来一直认为,问题的语法与回答所需要的计算步骤的顺序密切相关。由于自然语言处理方面的最新进展,可以使用现成的语法分析工具来自动提供这些蓝图的近似版本。

但从语言结构到网络结构的准确映射仍然是一个具有挑战性的问题,转换过程中容易出错。在后来的工作中,研究者转向使用由人类专家制作的数据,它们用理想化的推理蓝图直接标注了一系列问题,而没有依靠语言分析。通过学习模仿这些人类专家,该模型能够大大提高预测的质量。最令人惊讶的是,当采用训练好的模型去模仿专家,但允许它自己修改这些专家的预测,它能够在不同的问题中找到比专家更好的解决方案。

总结

尽管近些年来深度学习方法取得了显著的成功,但许多问题仍然是一个挑战,例如few-shot learning和复杂推理。这些问题正是结构化经典方法所闪耀的地方,例如语义解析和程序归纳。神经模块网络结合了经典人工智能方法和深度学习方法两者的优点:离散组合的灵活性和数据高效性,同时结合了深度网络的表征力量。NMN已经在许多视觉和文本推理任务得到了成功。同时,研究者也在尽力将该方法应用到更多的AI任务中。

相关推荐
热点推荐
5000亿换 “废铁”?中国下达逐客令,对荷兰一分不让

5000亿换 “废铁”?中国下达逐客令,对荷兰一分不让

普陀动物世界
2025-12-18 15:30:30
越来越多孩子得白血病?医生坦言:家里4样东西是祸根,趁早扔了

越来越多孩子得白血病?医生坦言:家里4样东西是祸根,趁早扔了

DrX说
2025-11-19 14:42:09
我同学在南宁见了王鸥,说出来的话我都惊了!

我同学在南宁见了王鸥,说出来的话我都惊了!

小光侃娱乐
2025-12-17 17:10:04
湖南“75后”县委书记佘芝云任上被查 曾出镜宣传当地文旅

湖南“75后”县委书记佘芝云任上被查 曾出镜宣传当地文旅

红星新闻
2025-12-18 10:59:55
实至名归!孙兴慜当选德转美职联2025年MVP 半赛季13场12球4助

实至名归!孙兴慜当选德转美职联2025年MVP 半赛季13场12球4助

智道足球
2025-12-18 12:11:36
这几个指标正常,证明你的心脏基本没啥大问题,不要再乱检查了

这几个指标正常,证明你的心脏基本没啥大问题,不要再乱检查了

健康之光
2025-12-17 07:35:04
石榴又火了?《Nature》:21周或恢复45%生理年龄,但60%人没吃对

石榴又火了?《Nature》:21周或恢复45%生理年龄,但60%人没吃对

果壳
2025-12-18 10:37:23
美国一父亲去殡仪馆领亡子衣物,竟领到逝者的脑组织,倒入洗衣机清洗后又将其舀起,家属已提起诉讼

美国一父亲去殡仪馆领亡子衣物,竟领到逝者的脑组织,倒入洗衣机清洗后又将其舀起,家属已提起诉讼

观威海
2025-12-18 09:06:04
医生发现:天冷坚持戴口罩的人,用不了多久,身体或会有5大变化

医生发现:天冷坚持戴口罩的人,用不了多久,身体或会有5大变化

霹雳炮
2025-12-04 22:54:47
刚刚,直线拉升!美国,传来大消息!

刚刚,直线拉升!美国,传来大消息!

数据宝
2025-12-18 12:25:42
太残酷!两局都让日本小花拿个位数,世界第一安洗莹强势闯4强

太残酷!两局都让日本小花拿个位数,世界第一安洗莹强势闯4强

体育妞世界
2025-12-18 14:31:45
聪明反被聪明误!本想为女儿铺路的李湘,却栽在了何超琼手里

聪明反被聪明误!本想为女儿铺路的李湘,却栽在了何超琼手里

观察鉴娱
2025-12-18 09:43:05
成都蓉城官宣!不再与徐正源续约,授予功勋主教练称号

成都蓉城官宣!不再与徐正源续约,授予功勋主教练称号

奥拜尔
2025-12-18 16:12:20
税务局“阴间凳子”设计太刑了,网友看完汗流浃背!

税务局“阴间凳子”设计太刑了,网友看完汗流浃背!

广告创意
2025-12-18 08:35:20
杨鸣凌晨两点发视频怒怼裁判:沉默只能换来得寸进尺 或被CBA追罚

杨鸣凌晨两点发视频怒怼裁判:沉默只能换来得寸进尺 或被CBA追罚

醉卧浮生
2025-12-18 10:45:57
收到工资1002415.13元,爱你华为。

收到工资1002415.13元,爱你华为。

纯洁的微笑
2025-12-12 21:29:39
因酷似拉莫斯走红!35岁无名球员一夜成焦点

因酷似拉莫斯走红!35岁无名球员一夜成焦点

星耀国际足坛
2025-12-18 12:46:02
澳大利亚女演员瑞秋疾病去世!

澳大利亚女演员瑞秋疾病去世!

下水道男孩
2025-12-15 23:40:32
孙颖莎不是因伤退赛,WTT给出答案,和其他选手退赛不同

孙颖莎不是因伤退赛,WTT给出答案,和其他选手退赛不同

子水体娱
2025-12-18 16:30:27
献血年龄拟延长至65周岁 献血法修订草案公开征求意见

献血年龄拟延长至65周岁 献血法修订草案公开征求意见

每日经济新闻
2025-12-17 16:09:07
2025-12-18 17:19:00

科技要闻

新一代AI创业大赛颁奖典礼暨AI投资论坛

头条要闻

普京:“欧洲小猪”想从俄罗斯解体中捞好处

头条要闻

普京:“欧洲小猪”想从俄罗斯解体中捞好处

体育要闻

巴黎首夺世界级冠军 加冕6冠王比肩巴萨拜仁

娱乐要闻

丝芭放大招了!实名举报鞠婧祎经济犯罪

财经要闻

重大改革,身关14亿人的政策彻底变了!

汽车要闻

开箱日产大沙发 精致办公or躺平追剧 哪个更适配?

态度原创

数码
亲子
旅游
公开课
军事航空

数码要闻

XREAL 1S正式发布:一副眼镜,开启500 英寸随身空间巨幕时代

亲子要闻

智商较低的儿童是否面临更大的心理健康问题风险?研究发现

旅游要闻

文明蕴化看陶寺:陶寺遗址博物馆将举行冬至观日出活动

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

福建舰入列后首过台海 台方谈为何"甲板上没有舰载机"

无障碍浏览 进入关怀版
×