网易首页 > 网易号 > 正文 申请入驻

具身智能:学习型智能决策代理认知架构中的流畅应对

0
分享至

Embodied Intelligence: Smooth Coping in the Learning Intelligent Decision Agent Cognitive Architecture

具身智能:学习智能决策主体认知结构中的平稳应对

https://www.frontiersin.org/research-topics/20474/bio-ai---from-embodied-cognition-to-enactive-robotics/magazine?page=2


我们大部分的日常具身行动都以流畅应对(smooth coping)的形式出现。流畅应对是指已经变得习惯化且根深蒂固的熟练行动,与深思熟虑的思想和行动相比,它通常对认知负荷施加的压力较小。当凭借技能和专业知识执行时,行走、驾驶、滑雪、音乐表演和快餐烹饪都是这种现象的例子。流畅应对的特征在于其迅速性和相对缺乏反思,这两者都是自动化的标志。深思熟虑和反思性的行动提供了对照案例。在德雷福斯(Dreyfus)的经典观点中,流畅应对是对行动的“无心”沉浸,处于流畅状态(in the flow),任何反思性思维只会打断这种流畅。基于杜威(Dewey)的实用主义论述,其他人,如萨顿(Sutton)、蒙特罗(Montero)和加拉格尔(Gallagher),坚持认为流畅应对中内置了智能灵活性,表明它不等同于自动化。我们在本文中寻求回答两个互补的挑战。首先,我们如何在细粒度上对自主体(自然的或人工的)中的流畅应对进行建模?其次,我们使用这个流畅应对模型来展示我们如何在人工智能体中实现流畅应对。我们在 LIDA(学习智能决策代理,Learning Intelligent Decision Agent)中开发了一个流畅应对的概念模型。LIDA 是一个具身认知架构,实现了意识的全局工作空间理论(global workspace theory of consciousness)以及其他心理学理论。LIDA 对意识的实现使我们能够解释流畅应对的现象学,这是少数认知架构能够做到的。通过对 LIDA 的细粒度分析,我们认为流畅应对是一系列自动化行动,间歇性地穿插着意识介导的行动选择,并由背侧流(dorsal stream)过程补充。换句话说,非意识的、自动化的行动(无论是习得的还是先天的)通常需要偶尔爆发的意识认知,以实现流畅应对的熟练和灵活调整。此外,从未进入意识的背侧流信息和相关的感觉运动过程在流畅应对期间提供进一步的在线调整。为了在 LIDA 中实现流畅应对,我们向 LIDA 认知架构引入了一个新模块,即自动化行动选择子模块(Automatized Action Selection sub-module)。我们复杂的流畅应对模型从生成主义(enactivism)借用了“具身智能”的概念,并通过允许表征和更详细的意识控制机制来增强这些概念。我们探讨了流畅应对的几个扩展例子,从像行走这样的基本活动开始,扩展到像驾驶和快餐烹饪这样更复杂的任务。

关键词:流畅应对,自动化,行动选择,认知架构,具身认知,全局工作空间理论,LIDA

引言

在本文中,我们使用 LIDA(学习智能决策代理)开发了一个流畅应对的概念模型,LIDA 是一个混合的、具身的认知架构,实现了意识的全球工作空间理论(GWT)(Baars, 1988)、感知 - 行动循环(Neisser, 1976; Freeman, 2002; Fuster, 2004; Cutsuridis et al., 2011)、grounded 认知(Harnad, 1990; Barsalou, 1999)、评估理论(Lazarus, 1991; Roseman and Smith, 2001)、长期工作记忆(Ericsson and Kintsch, 1995)以及其他认知理论。它旨在成为一个“认知的统一理论”(Newell, 1994),采纳这些以及其他不同的理论,并将它们统一在一个单一的、综合的架构之下。LIDA 是一个概念性和计算性的架构,已被用作软件和机器人代理的基础。当前的论文是关于如何在 LIDA 中实现流畅应对的理论概述。后续研究将实现形式体系、编写代理代码,并在各种环境中测试代理。我们将这项工作视为迈向流畅应对机器人实现的第一步,这将符合机器人学的当前趋势,例如通过模仿学习(Bullard et al., 2019)。

流畅应对是熟练且适应性地行动的过程,通常朝向任务的完成。流畅应对涵盖了广泛的熟练行为,从相对基本的行为如呼吸或吸吮,到那些通过艰苦训练习得的行为,如成为飞行员(Dreyfus and Dreyfus, 1980)。熟练地驾车穿过交通、滑雪坡或跑障碍课程都是流畅应对的经典例子。然而,这个概念也可以包括烹饪、放羊、跳舞、整理以及许多其他可能达到优化性能状态的活动。这个概念起源于现象学哲学,特别是海德格尔(Heidegger, 1928/2010)和梅洛 - 庞蒂(Merleau-Ponty, 1945/2012)的具身现象学。这两位思想家都在反对哲学和心理学中将人类存在智力化的愿景,这种愿景将我们视为本质上旨在认识世界的认识论主体。作为替代,他们提出了一种人类存在的愿景,这种愿景在其根本上是实用性地面向行动和运动的,并且(对于梅洛 - 庞蒂而言)是基于代理的具身性的。

在流畅应对中,代理不仅仅是在做脱节的多任务处理,也不仅仅是在做自动化行动。相反,代理的大部分认知过程连贯地朝向实现一个远端意图。我们概述了 LIDA 代理如何实现流畅应对,并提供三个案例研究:行走、驾驶和快餐烹饪(见“结论”部分)。重要的是,LIDA 中的流畅应对通常需要一个“混合的”组合,包含意识的、意识介导的和从未意识的过程,这些过程交织在使用意识的全球工作空间理论实现的一系列持续的认知周期中(Franklin and Baars, 2010)。历史上,在 LIDA 概念模型中,行动选择一次只能选择一个,且仅能选择一个行动。在本文中,我们通过向行动选择引入一个新子模块:自动化行动选择(AAS),对 LIDA 模型做出了重大贡献。这个子模块允许行动的并发选择——AAS 能够并行选择自动化行动。此外,AAS 与原始行动选择算法并行运行,后者继续一次选择一个行动。

我们首先详细阐述最近关于流畅应对的辩论,并强调支持它的认知的混合性质(Christensen et al., 2016; Gallagher and Varga, 2020)。然后我们介绍 LIDA 模型以及与该项目相关的 LIDA 方面。为了更全面地概述 LIDA,我们建议阅读教程和我们最近的两篇论文(Franklin et al., 2016; Kronsted et al., 2021; Neemeh et al., 2021)。我们通过三个复杂度递增的案例研究来说明流畅应对如何在 LIDA 代理中发生:独自行走、交通中驾驶和快餐烹饪(见“结论”部分)。

流畅应对

尽管最近关于流畅应对的辩论有所增加,但这一主题至少可以追溯到亚里士多德以及实践智慧(phronesis,通常译为"实践智慧")的概念。自其最早提出以来,流畅应对的辩论通常与文化和社会性紧密相连——流畅地应对世界往往是在丰富的社会文化语境中进行的(Rietveld and Kiverstein, 2014)。因此,关于流畅应对的辩论跨越了社会认知、人类学、表演研究以及"专家表现"讨论中的诸多议题(Cappuccio, 2019)。

在处理流畅应对时,运动性讨论与文化讨论的交叉在现象学传统中尤为明显。在二十世纪,马丁·海德格尔在其巨著《存在与时间》(1927)中引入了"上手状态"(Zuhandenheit)一词。该词常被译为"就绪在手",指的是一种前反思、前理论的行为模式。当我将某物(比如说锤子这样的工具)视为就绪在手时,我是在使用它,而非反思它。这种使用是一种具身的"知道如何"(know-how),而非理论性的沉思。海德格尔认为,西方哲学传统完全聚焦于"现成在手"(Vorhandenheit),即理论性的行为模式。例如,康德的体验理论明确旨在支持科学的事业。这种对理论理性而非具身行动的关注,是我们可以在人工智能和机器人学历史中看到被重复的现象。相比之下,梅洛 - 庞蒂(Merleau-Ponty, 1945/2012)考察了具身性与行动如何与空间、时间、性、其他主体以及其他领域动态地相互作用。根据梅洛 - 庞蒂的观点,流畅应对是我们日常生活最基本的模式。多年后,汉斯·约纳斯(Hans Jonas, 2001)发展了一种主体性的发生现象学,根据该理论,流畅应对的这些基础层次使得更高阶的认知过程得以涌现,类似于当代关于支架作用(scaffolding)的主张。纵观现象学传统的思想家们,我们看到一种对具身性的强调,其中流畅应对是认知主体在世界中移动时的基本能力。总之,许多现象学家持这样的观点:流畅应对构成了具身人类能动性的基本背景,而更具认识论导向的、逻辑的或更高阶的过程则较为少见,并且是在这一背景之上建立的。

在现象学传统的基础上,德雷福斯和德雷福斯(Dreyfus and Dreyfus, 1980)基于技能习得的五个阶段发展了一种流畅应对的认知理论。根据他们的理论,某项技能的专长特征是自动化以及缺乏高阶思维。在这个流畅应对模型中,专家们已将其领域内的技能习惯化到其动作完全自动化的程度。这反过来旨在解释为何关注自身或部署高阶认知过程(如"策略制定")有时会对表现产生不利影响(Fitts and Posner, 1967; Cappuccio et al., 2019)。

在关于流畅应对和专家表现的文献中,其他人追随德雷福斯和德雷福斯,同样认为熟练行动中的流畅应对是完全自动化的问题(Papineau, 2013, 2015)。

然而,德雷福斯模型近年来受到了来自各种理论家、运动员和艺术家的批评,且来自多种视角。例如,芭芭拉·盖尔·蒙特罗(Barbara Gail Montero, 2010, 2016)表明,要在许多运动中取得成效,运动员必须同时部署自动化和高阶认知过程。此外,蒙特罗等人(Montero et al., 2019)表明,声称自我关注对表现有害的实证研究计划是基于有缺陷的实验设计。自我关注、监控、策略制定等往往被整合到表现的流动中,而非打断它。

这里的要点是,高阶过程,如规划、策略制定、监控等,并非总是对专家表现有害,相反,它们通常是专家表现和成功流畅应对所必需的。鉴于这一洞见,流畅应对往往是将一些人所谓的"在线"(需要即时感官刺激)和"离线"(脱离即时感官刺激)认知流畅整合的问题(Wilson, 2002)。现在有几个理论提出了低阶和高阶过程在专家表现及更广泛的流畅应对中之间相互作用的因果整合网络。此类模型包括"拱形"模型(Høffding and Satne, 2019)、混合架构(Christensen et al., 2016, 2019)、双过程模型(Neemeh, 2021)、激进混合架构(Gallagher and Varga, 2020)以及各种类似方法(Bermúdez, 2017; Pacherie and Mylopoulos, 2021)。

虽然这些模型在其理论承诺方面各不相同,但总体主旨是一致的:在专家表现过程中,低阶和高阶认知过程都被利用并相互影响。例如,自动化的非意识过程,如姿势的持续调整或篮球运球,可能受到高阶意识过程的影响,如思考并意识到对手的策略。一位面对臂展更长对手的混合武术格斗手可能会战略性地试图通过擒抱而非踢打和拳击来智胜对手。这种高阶战略决策反过来影响格斗手如何调整姿势并重新配置其感觉运动准备状态以适应某些行动类型。

在舞蹈表演的文献中,一些现象学家同样指出,即使在高度编排的表演中(一个动作引发下一个动作),专业舞者也必须根据舞台的特殊性、当晚的观众、灯光、空气密度和湿度、服装故障以及其他因素调整其表演(Bresnahan, 2014)。同样重要的是,或许甚至更重要的是,专业舞者(以及一般的专业表演者)必须始终在对身体本身的意识监控中进出,以根据身体当天的感觉进行调整(Ravn, 2020)。

从这些简要的例子中,我们可以看到,具身的专业知识,无论是在行走或驾驶等平凡案例中,还是在体育和表演等高度专业化的领域中,都涉及各种认知过程和不同意识层次(意识的、从未意识的、前意识的、前反思的)的流畅混合。虽然混合架构方法在诸如"心理表征"等概念的承诺上,或如何概念化不同认知机制之间的因果关系上存在分歧,但普遍共识是,流畅应对不仅仅是自动化的问题。相反,我们经常利用并在各种认知过程之间切换。例如,音乐家有时会报告自己处于完全自动化的状态,同时监控自己的行动和同伴音乐家的行动。在这种状态下,演奏的音乐家通过自动化行动,但他们随时准备以自上而下的控制进行干预(Høffding, 2019)。

在流畅应对和专家表现的讨论中同样重要的是倾向性技能或习惯的概念。在此,思想家们倾向于发展强烈受约翰·杜威(John Dewey, 1922)习惯概念启发的习惯理论,即将习惯视为一种对情境敏感、灵活的行动倾向。无论是在明确反表征主义的生成式认知科学中(Gallagher, 2020; Segundo-Ortin and Heras-Escribano, 2021),还是在表征主义的认知科学中(Schack, 2004; Sutton et al., 2011; Bermúdez, 2017; Pacherie and Mylopoulos, 2021),普遍认为习惯是专家表现和流畅应对中的一个重要概念。在这种观点下,习惯通过练习而根深蒂固,但能灵活地适应各种情境。与情境上僵化的运动程序不同(Ghez, 1985; Neilson and Neilson, 2005),习惯总是由当前情境调节并精细调整的——习惯是适应性地在环境中存在的方式(Dewey, 1922)。

学习智能决策代理认知架构

学习智能决策代理(Learning Intelligent Decision Agent,LIDA)是一个系统层面的认知架构,旨在提供对认知的完整且整合的解释(Franklin et al., 2016)。因此,LIDA 模型并非仅建模心智的某一方面,而是旨在成为一个"认知的统一理论"(Newell, 1994),能够建模人类、动物和人工心智。此处所使用的"认知"广泛涵盖了心智的每一种机制,包括但不限于感知、注意、动机、规划、深思、元认知、行动选择和运动控制,以及所有这些活动的具身性。因此,"认知"意在涵盖代理心智生活的全部,包括其具身性和具身行动。在 LIDA 框架内,"心智"被广泛理解为自主代理的控制结构(Franklin, 1995; Franklin and Graesser, 1997)。此处"控制结构"(参见 Newell, 1973)被广泛理解为那些使代理能够追求其议程的机制。成为自主代理的部分含义在于拥有一个议程,而拥有心智则意味着拥有使个体能够追求该议程的结构(无论其议程多么简单或复杂)。因此,自主代理始终在处理"我接下来应该做什么?"这一问题。

学习智能决策代理由许多短期和长期记忆模块,以及被称为代码元(codelets)的专用处理器组成。虽然模块化有时在当代心智哲学中被视为"贬义词",但 LIDA 模型在以下意义上是模块化的:它由一组独立模块组成,这些模块持续执行其指定任务。然而,重要的是要注意,LIDA 模型并不承诺大脑的模块化(Franklin et al., 2013)。事实上,LIDA 模型对大脑不做任何主张。因此,即使由动态且充满神经复用(neural reuse)的大脑(Kelso, 1995; Anderson, 2014)也可以实现 LIDA 模型。

重要的是,LIDA 模型实现了意识的全球工作空间理论(Baars, 1988, 2019)。代理通常无法意识到其环境(外部或内部)中的一切,因此需要"过滤掉"最相关的信息。因此,LIDA 代理拥有关于世界的信息,这些信息在称为全局工作空间(Global Workspace)的模块中"竞争"其注意力。任何胜出的结构(最典型的是一组结构的联盟)会被全局广播到整个模型中的每个模块——因此称为"全局广播"。通过这种方式,全局工作空间充当一个过滤器,决定哪些信息可供代理的其余模块使用。

在 LIDA 中,感官刺激被用于在称为当前情境模型(Current Situational Model, CSM)的模块内构建外部环境和内部环境的丰富模型。概括而言,CSM 创建世界的模型,然后模型的不同部分被发送到全局工作空间中竞争。

LIDA 模型利用两种类型的专用处理器:结构构建代码元和注意代码元。结构构建代码元在 LIDA 的 CSM 中构建(可能复杂的)表征结构。这些结构可以包括(除其他外)来自代理环境的感官内容和被提示的长期记忆(例如,来自感知联想记忆、空间记忆、瞬态情景记忆和陈述性记忆)。另一方面,注意代码元持续监控 CSM,寻找与其关注点匹配的结构。如果找到,前意识内容及其对应的注意代码元会形成联盟,在 LIDA 的全局工作空间中竞争意识。

联盟由注意代码元及其倡导的内容组成。这些联盟随后被发送到全局工作空间内竞争意识的"注意"。在全局工作空间模块内发生的竞争决定系统将意识性地注意什么。无论哪个联盟具有最高的激活值,其内容就会被广播到整个模型中的每个 LIDA 模块(即,其内容被全局广播)。意识包括(除其他外)离散的认知时刻在重叠周期中展开的频繁序列化广播,然后通常由每个模块处理。换句话说,意识是离散的,一件事接一件事以快速节奏发生(Baars, 1988)。虽然 LIDA 的所有模块都异步接收输入,但全局广播的序列化性质促进了意识以及(如我们将看到的)具身行动的平滑序列化展开。关于 LIDA 模型、其模块和过程的一般概述,见图 1。


为了能够处理代理在不同文化、个人历史和当前情境下具有不同需求的事实,多个变量被附加到 CSM 中的结构上。例如,每个结构都有一个激活值,该值部分用于衡量其显著性。这些结构的显著性用于确定包含这些结构的联盟的激活,从而调节它们在全局工作空间中赢得全局广播竞争的机会。关于 LIDA 中显著性和动机的深入说明(参见 McCall et al., 2020)。

LIDA 研究计划的核心承诺之一是 LIDA 模型是一个具身架构(Franklin et al., 2013)。这意味着 LIDA 代理在设计上是受生物启发的,并且始终与其环境处于活跃的交互之中。符合认知的 4E 方法,LIDA 代理始终处于回答“我接下来做什么?”这一问题的过程中。此外,不断回答这个问题意味着所有 LIDA 代理都有一个“议程”,并且在许多具身 LIDA 代理中,该议程源于代理身体的需求。

具身认知领域的辩论经常区分弱具身和强具身(Gallagher, 2011)。粗略地说,如果身体倾向于仅仅在系统的中央处理中被“表征”,那么一种认知方法就是弱具身的。如果系统物理身体的构造有助于其认知的构成,那么该系统就是强具身的。然而,LIDA 模型并不完全符合这一分类。LIDA 模型使用包容架构(Brooks, 1991),并通过其背侧流与环境处于持续敏感的交互之中。LIDA 背侧流除其他外,直接影响代理与其世界的物理介入。LIDA 代理还拥有一个身体图式,持续影响感觉运动行动的展开。同时,确实 LIDA 模型也在当前情境模型中表征其自身的身体。此外,LIDA 认知架构的设计使其既可以在物理代理中实现,也可以在非物理代理中实现,例如分别是机器人或软件代理。因此,LIDA 模型包含强具身和弱具身两者的元素,并且在物理代理中,这两种方法往往都起作用。

有了这个概述,我们准备好深入探讨关于 LIDA 认知周期和行动选择的更多细节。行动选择在流畅应对期间尤为重要,因为成功的流畅应对需要在正确的时间熟练地选择和执行正确的行动。

认知周期

学习智能决策代理(LIDA)的认知周期分为理解阶段、注意阶段以及行动与学习阶段(见图 2)。LIDA 的认知周期始于外部和内部的感官输入,以及在当前情境模型(Current Situational Model, CSM)中结构(即表征)的构建与更新。吸引注意代码元关注的结构随后被带到全局工作空间,在此它们竞争意识。胜出的结构在整个模型中被广播,系统可能通过行动选择机制做出行动(内部或外部)的决策。学习也可能作为每次意识广播的结果而发生。虽然关于 LIDA 中学习的详细讨论超出了本文的范围,但足以说明的是,LIDA 代理通常在每个认知周期中学习(作为其意识广播的直接结果)。


对于不熟悉 LIDA 的读者而言,记住以下几点是有帮助的:每个认知周期都非常迅速,在人类中仅持续 200–500 毫秒(Madl et al., 2011),并且 LIDA 的模块在很大程度上是异步且独立于彼此工作的。因此,认知周期可以"重叠"。例如,一个认知周期的"行动与学习阶段"可以与下一个认知周期的"感知与理解阶段"同时发生。因此,虽然每个认知周期在概念上被划分为离散的、串行的阶段,但代理的模块和过程完全处于非活动状态的情况很少见。

行动选择

在每个认知周期的行动与学习阶段,LIDA 的行动选择模块通常会选择指定可执行(内部或外部)行动的行为。出于多种原因,这个行动选择过程是必要的。例如,可能存在许多行为可以完成一项任务,尽管并非所有行为都能同样出色地完成。例如,移动一个盒子可以通过携带它、用手推它、用脚蹬它,甚至四肢着地爬行时用头推它来实现。在这些情况下,行动选择有助于选择这些行为中最具情境相关性和最可靠的行为。此外,在任何给定时刻,代理可能拥有多个相互竞争的欲望和目标。行动选择有助于选择更有可能导致最期望结果的行为。最后,行动选择协调非冲突行为的并行选择。

历史上,行动选择一次只选择一个行为。在本文中,我们增强了行动选择模块,包含了一个自动化行动选择子模块(见"LIDA 中的流畅应对”部分),允许在每个行动选择事件中选择多个非冲突的行为。行动选择依赖于 LIDA 的程序性记忆,这是一个长期记忆模块,用于确定情境相关的行动及其预期的环境后果。换句话说,程序性记忆指定了可采取的行动以及如果采取这些行动会发生什么,而行动选择则根据该知识决定代理将做什么(见图 3)。


当意识内容被全局广播到所有 LIDA 模块时,它被程序性记忆接收,程序性记忆利用意识广播的内容来实例化与该意识内容相关的图式。实例化的图式被称为行为,它们是 LIDA 行动选择模块选择的候选者。每个图式由一个上下文(即环境情境)、一个行动和一个结果(即该行动的预期环境后果)组成。这些可以在许多不同的抽象和普遍性级别上指定。每个图式还包含一个基线激活值,用于估计在给定上下文中采取该行动时,图式结果随之发生的可能性。例如,一个通用的“转钥匙图式”可能指定一个行动,对应于转动钥匙所需的身体运动,上下文是靠近锁,预期结果是锁被打开。每次成功选择并执行该图式的行动(在给定上下文中)通常会导致其基线激活值增加。同样,每次失败会导致其基线激活值减少。如果,正如我们可能预期的,这个“转钥匙图式”通常成功,那么它最终将拥有较高的基线激活值。然而,如果其上下文指定不足,例如如果它没有限制“转钥匙”仅在代理“靠近锁”时进行,那么其行动可能会在不适当的情境中被采取,导致一个不可靠的图式,经常莫名其妙地失败。这种不可靠性将表现为该图式具有较低的基线激活值。

此时,自然会有人问:“等等,每件事都有一个图式吗?有煮咖啡图式吗?有看电视图示吗?有 CrossFit 图式吗?”首先,我们必须理解许多图式是特定于文化的。一个部署在汽车工厂流水线机器人上的 LIDA 代理不需要一个“酷握手”图式。然而,一个存在于不同握手是文化流畅性不可或缺组成部分的文化中的代理,可能拥有针对不同文化相关问候的图式。其次,我们必须理解复杂行动是通过执行多个更简单的行动来实现的。例如,骑自行车包括双腿蹬踏、转向、刹车、扫描环境等等。在 LIDA 的历史上,将多个行动协调为复杂行动是通过图式流来实现的(见“行为流和技能”部分)。由于这些流的存在,LIDA 代理不需要为每个复杂行动学习独特的图式。相反,看似新颖的复杂行动可以通过多个预先存在的图式表现出来。通过这种方式,LIDA 实现了一种形式的“迁移学习”(Pan and Yang, 2009)。为了进一步促进复杂行动的学习,在本文中,我们引入了图式的层级组织(见"LIDA 中的流畅应对”部分),它与行动的自动化行动选择相结合,允许流畅的代理行为。

当行动选择选择一个指定外部行动的行为时(即,旨在修改代理外部环境的行动),它将其传递给 LIDA 的感觉运动记忆以执行。另一方面,如果选择的行为指定了一个内部行动(例如,用于支持心理模拟的行动),它会被发送到(或用于生成)一个结构构建代码元,从而相应地更新当前情境模型。行为的选择也可能导致期望代码元的创建。期望代码元是一种注意代码元, tasked with 监控当前情境模型,寻找与代理最近选择行为的预期结果相匹配的内容。这会暂时使代理的注意力偏向于其最近行动的环境后果,有助于在代理的行动及其结果之间产生反馈循环。因此,符合生成式和预测性的认知方法,行动、感知和预测在一个反馈循环中紧密联系在一起。

关于流畅应对的研究普遍认同,流畅应对由一系列自动的和有意识控制的行动组成,同时也包括低层感觉运动活动和高层思维,如策略制定或监控(Christensen et al., 2016; Montero, 2016; Høffding, 2019; Gallagher and Varga, 2020)。换句话说,流畅应对是根深蒂固的自动过程与有意识的深思熟虑过程的结合,从而产生流畅且熟练的行动。在 LIDA 中,这是通过结合四种不同的行动选择模式来建模的:意识介导的行动选择、意志决策、警报和自动化行动选择(Franklin et al., 2016, pp. 29–32)。意识介导的行动选择指的是代理执行的许多行动,其中涉及意识广播,但同时代理并未意识到那些用于选择这些行动的选择过程。例如,在帆船运动中,运动帆船手可能有意识地意识到桅杆上的不同绳索,但并未意识到行动选择中的竞争过程,正是该过程使她选择了最终部署的特定绳索握法。同样,网球运动员可能有意识地意识到接近的球,但并未意识到使他选择扣杀而非截击的行动选择过程。

意志行动选择指的是这样一种行动选择类型,其中代理有意识地且主动地意识到某些选择过程。例如,当一个代理在深思熟虑棋盘游戏中最好的一步棋是什么,并反复斟酌不同的选择、结果和陷阱时,他们就是在进行意志行动选择。通过反复斟酌不同的可能行动及其结果,“选项”在当前情境模型中被创建出来(Franklin et al., 2016)。这些选项可以变得有意识并进入程序性记忆,程序性记忆随后可能基于这些选项实例化行为。行动选择随后可以从这些行为中进行选择。因此,意志行动选择的第一部分是有意识的,而第二部分是无意识的(意识广播正在被利用,但代理并未意识到行动选择模块中发生的过程)。事实上,在任何行动选择模式中,代理都无法意识到行动选择模块内部正在发生什么——该模块只是持续地执行其工作。简而言之,在意志行动选择期间,代理意识到他们正在权衡的选项,但并未意识到行动选择“内部”正在发生什么。

警报是从未意识的过程,它们绕过全局工作空间中的竞争。如果某个对象或事件被感知联想记忆识别为警报,该对象或事件将被直接发送至程序性记忆以实例化图式。与警报内容相关的行为在行动选择中被赋予高激活值,通常被选中并立即传递给感觉运动记忆——感觉运动记忆反过来将运动计划传递给运动计划执行。简单来说,许多代理都有过在警报情况下行动的经历,并且只在事后才意识到他们的行动。例如,对于许多人来说,一只大蜘蛛爬在手臂上会导致一系列刷拂、跳跃和痉挛反应,他们只在事后才意识到威胁。同样,在驾驶中,许多司机体验到对危险情况的反应速度快于或等于他们有意识地意识到情况的速度。注意此处,警报既可以是像蜘蛛例子中那样的先天性的,也可以是像驾驶例子中那样由文化决定的。

行动选择的最后一种模式是自动化行动选择。自动化行动是过度学习的行动,其中一个行动可以被视为调用下一个行动。自动化行动的选择是无意识地进行的,也就是说,选择不一定需要来自意识广播的内容。这些通常是那些已经反复练习过的行动,它们可以在没有意识思考的情况下执行。例如,在空旷的人行道上行走是典型的自动化行动。它只需要很少的注意力,代理可以同时专注于其他事项。在本文中,我们将在"LIDA 中的流畅应对”部分详细讨论自动化行动选择。

虽然我们在"LIDA 中的流畅应对”部分会详细讨论自动化,但值得在此注意自动化行动选择与警报之间的一个核心区别。警报行动一旦执行完毕就会恢复到正常功能,并且不要求进一步的行动。通过这种方式,警报是对代理正在进行的任何事情的暂时中断。另一方面,自动化行动不会中断系统内的正常过程,也不会优先于正常过程。此外,自动化行动指定哪些行动将从自动化行动选择模块内随后进行(关于此更多内容见"LIDA 中的流畅应对”部分)。

虽然在人类看来,这个整个过程,从程序性记忆开始,经过行动选择、感觉运动记忆,最后到运动计划执行,可能显得漫长且费力,但重要的是要记住这个过程极其迅速。每个认知周期通常发生在几百毫秒之内(Madl et al., 2011)。因此,当处理快速动态行动时(正如流畅应对中经常发生的那样),重叠的认知周期足够迅速,足以进行调整并即时行动。此外,我们必须记住,运动计划执行与所有其他系统并行运行,允许对进行中的运动计划进行无意识调整。此外,LIDA 感觉运动系统基于 Brooks 的包容架构(Brooks, 1991),允许代理与世界进行快速交互。

同样,类似于生成式和预测性处理的心智方法,LIDA 代理始终处于适应性行动的过程中;我们可以说,LIDA 代理始终在回答“我接下来应该做什么?”这个问题。在 LIDA 中,行动选择不断从候选行为中选择一个行为并将其发送至感觉运动记忆(除非该行动是进行深思)。这确保了代理始终处于行动过程中,以保持与其环境的最佳适应关系。

行为流与技能

流畅应对涉及“技能”和“最佳把握”(optimal grip)。对一项活动拥有最佳把握,意味着熟练地、流畅且轻松地驾驭该活动(Merleau-Ponty, 1945/2012; Rietveld and Kiverstein, 2014; Bruineberg et al., 2021)。诸如“技能”和“流畅性”之类的概念,通常包括能够以不间断的方式执行多个行动,并将这些动作链调整以适应情境的动态实时变化和需求(Nakamura and Csikszentmihalyi, 2014)。

在 LIDA 中,技能和流畅性部分是通过行为流来实现的。除了单个图式外,程序性记忆还包含可以被实例化的图式流。图式流是一系列串在一起的动作图式,可以使用来自一个或多个全局广播的内容集体实例化。整个实例化的图式流被称为行为流。一旦行为流被发送到行动选择模块,该模块可以快速一次选择一个行为,并将每个行为传递给感觉运动记忆(后者反过来将运动计划传递给运动计划执行)。

对于生物代理而言,流畅应对通常涉及一系列流畅的行动。例如,运篮球、迈三大步,然后跳起扣篮,可以作为一系列整合的、流畅的动作发生。此外,人们很少一次只做一件事。因此,LIDA 中的行动选择过程通常涉及行动选择模块从几个行为流中快速挑选行为。历史上,在 LIDA 概念模型中,行动选择一直是一次只选择一个行动,且仅选择一个。然而,在生物代理中,物理行动经常重叠。因此,在本文中,我们正在增强 LIDA 的行动选择以支持多个行动的同时选择。具体来说,除了通过我们原始的行动选择算法一个接一个地选择行动外,我们还支持自动化行动的同时选择。这是通过行动选择的新自动化行动选择子模块实现的。开发这个子模块是本文的贡献之一。

例如,人们可以想象一个(令人难忘的)场景:马戏团小丑骑着独轮车,杂耍,同时故意地、疯狂地大笑,同时表演性地龇牙咧嘴。这样的表演需要多个熟练行动同时重叠。即使行动选择被限制为一次只选择一个行为,这并不意味着先前选择的行为的执行必须是顺序的。此外,行动选择可以从多个并发行为流中快速选择行为,并将它们向前传递给感觉运动记忆以执行。

成为某项活动的熟练代理涉及(除其他外)拥有经过微调、排练良好的行为流和运动计划模板,这些可以灵活地调整以适应当前情境的需求。在 LIDA 中,流畅应对的许多“熟练”方面由行动选择、感觉运动记忆,尤其是运动计划执行处理。当行为被发送到感觉运动记忆时,系统必须创建一个运动计划——一个高度具体的身体运动计划。运动计划指定特定运动命令序列(即运动命令),这些命令指导代理的每个特定执行器。这里,执行器仅仅意味着代理通过其作用于世界的物理部件之一。例如,工厂机器人可能只拥有一个“手臂”执行器。另一方面,人类拥有多得多的执行器。

运动计划及其运动命令通过背侧流对来自感觉记忆的快速传入数据做出反应和适应(Neemeh et al., 2021),以保证代理的行动与环境的最当前状态同步。

通常在流畅应对中,当代理作用于环境时,环境可能会发生变化。例如,作为一名运动帆船手,涉及在船只被不规则的风和水流碰撞和摇晃时,熟练地操纵船帆。为了在这种动态情境中熟练地完成运动计划,运动计划在代理行动时通过 LIDA 的背侧流不断对感官信息做出反应。一个正在航行的代理可能会发出一个运动计划去抓取特定的绳索。然而,当他们抓取时,船被一个大浪摇晃。而不是以相同的方式继续抓取,通过背侧流实时更新运动计划确保代理调整其抓取动作,并仍然成功抓住绳索。

可供性、面向行动的表征和行为流

最近关于流畅应对的研究用可供性,有时是面向行动的表征,阐释了代理与环境之间大部分熟练的交互循环(Milikan, 1995; Clark, 2016; Williams, 2018; Gallagher, 2020; Bruineberg et al., 2021; Kronsted, 2021a)。可供性和面向行动的表征是两个非常相似的概念。可供性通常被定义为行动的可能性,这种可能性作为一种关系存在于受文化熏陶的代理与环境之间(Gibson, 1979/2013; Chemero, 2009)。重要的是,可供性通常被认为是一个非表征概念。面向行动的表征非常相似——但正如名字所暗示的,它们是一类心理表征。面向行动的表征是那些也召唤或推动代理进入行动的表征(Milikan, 1995; Ramsey, 2007; Clark, 2016; Kirchhoff and Kiverstein, 2019)。

在 LIDA 中,我们通过使用表征性可供性采取了一种中间立场的方法。LIDA 可供性被概念化为系统内的表征。关于 LIDA 代理如何学习和使用可供性的最近论述(见 Neemeh et al., 2021)。在此只需说明,随着 LIDA 代理在各种活动中变得受文化熏陶并接受训练,它们学习感知新的可供性,并可以对此做出反应。随着 LIDA 代理获得更高的技能,其感知系统可以检测到越来越细粒度的可供性,这些可供性可以纳入越来越细粒度的行为流的选择中。

行动、学习、行为流和可供性之间存在着细致的关系。LIDA 使该模型区别于其他认知架构的方面之一是"L"——学习。严格来说,LIDA 代理可以在每个认知周期中“学习”新事物。随着每次全局广播,几乎所有模块都可以用来自广播的内容进行更新,并且每个模块(包括各种记忆模块)都可以根据该广播执行某些功能。例如,感知联想记忆可能会建立新的连接,瞬态情景记忆可能会组合成一个新事件,意识内容队列添加到似是而非的当下(specious present),也许程序性记忆开始构建一个新图式,等等。关于 LIDA 中学习的详细论述(见 Kugele and Franklin, 2021)。

就流畅应对而言,随着 LIDA 代理作用于其环境,每次广播后,代理会慢慢变得更加熟悉该环境和手头的相关任务。这种适应包括为这些可供性构建更专门化和细粒度的可供性及行为图式。例如,代理可能对巴西柔术一无所知,但经过训练,对手的不同动作会与行动或反行动的可供性相关联(Kimmel and Rogler, 2018)。对手试图进行后颈绞杀——提供了将背部平贴在垫子上的可供性。对手在封闭防守期间将体重放在错误的位置提供了执行腿部三角绞的可供性。可供性与其相关的行为图式之间存在一个良性循环。流畅应对通常是一个拥有细粒度可供性的问题,这些可供性使得使用适当细粒度的行为图式成为可能(见图 4)。


当代理感知到一个事件时,它们也感知到相关的可供性。如果包含可供性的联盟在全局工作空间的广播竞争中胜出,那么广播内容中可供性的存在将有助于实例化行为图式,从而也促进在行动选择中赢得竞争。

如前所述,选择一个行为(可能来自行为流)也会创建一个期望代码元,以促进对行为相关结果的监控。期望代码元的创建不仅有助于将行动结果带入意识,还有助于确保与这些行动结果相关的可供性也被有意识地广播。在一个促进行动的反馈循环中,对一个可供性采取行动会带来下一个可供性。这种反馈循环符合关于可供性的经验和理论文献,这些文献将流畅应对概念化为行动与可供性之间的反馈循环(Di Paolo et al., 2018; Kimmel and Rogler, 2018; de Oliveira et al., 2021; Kimmel and Hristova, 2021; Kronsted, 2021b)。

总体而言,我们看到流畅应对不是一个已经熟练某项活动的问题。相反,流畅应对涉及不断提高自身技能和适应性的能力。在 LIDA 中,这种适应性内置于跨模块的信息流中,由意识广播促进。

当然,流畅应对不仅关乎知道“做什么”,还关乎拥有足够发展的感觉运动协调性来做到这一点——用外行话说就是拥有正确的运动技能。因此,LIDA 中的技能循环还包括代理构建和完善日益复杂的运动计划模板。经过许多认知周期,感觉运动记忆被缓慢更新,以便代理(希望)始终处于知道“如何做”的位置,并且具有高度的复杂性。详细说明感觉运动记忆如何构建和更新运动计划超出了本文的范围。重要的要点是,LIDA 代理通过更新其“做什么”的图式(行为)和“如何做”的计划(运动计划模板)来一致地更新其行动能力。

让我们以变得擅长运动为例——在这种情况下,是足球。通过练习,足球运动员学习感知场地,并根据不同的机会来看待它。也就是说,球员随着时间的推移,学会根据不同的可供性来体验比赛,“在这种情况下,我可以长传,从右边这个人身边运球过去,或者短传回传。”随着时间的推移,球员学会根据提供“做什么”可能性(潜在行为)的可供性来看待场地。然而,学习利用可供性也是学习如何具体利用可供性“如何做”(运动计划)的问题。因此,通过练习,代理还通过开发日益复杂的运动计划模板来微调其身体能力——起初,运球和踢球是笨拙的,但随着时间的推移,它变得成为第二天性。

自然地,做像专家级足球这样高级的事情需要多个过程——一些是意识介导的,另一些是自动的。因此,接下来,我们将看看在流畅应对期间不同的行动选择模式是如何交织在一起的,以及自动化行动的作用。

自动化与自动化行动选择子模块

流畅应对的一个关键方面在于它同时涉及高层和低层认知过程(Christensen et al., 2016; Montero, 2016; Høffding and Satne, 2019; Gallagher and Varga, 2020)。让我们回到小丑的例子。那位同时骑着独轮车、杂耍、咧嘴笑并与选定的观众成员交谈的小丑表演者,可能会利用意识介导的、完全意识的以及自动化的行动。因此,为了说明流畅应对期间行动中这种重叠现象,我们需要看一看 LIDA 代理是如何实现自动化的。自动化行动被实现为行为流中的一系列行为,这些行为已被掌握到这样的程度,即这些行为可以在没有意识广播介导的情况下被选择——也就是说,自动化行为可以在不需要感官输入更新的情况下被选择。然而,这些行为的执行可能通常仍需感官输入(例如通过背侧流甚至意识广播)。

自动化与自动化行动选择子模块

就流畅应对而言,代理能够同时执行多个行动往往是重要的(例如,踩踏板和传球,运球和铲球,拳击和格挡,等等)。因此,在本文中,我们向 LIDA 模型引入了一个新的子模块,即行动选择的自动化行动选择子模块(AAS)。该子模块与行动选择并行运行,并反复将行为发送至感觉运动记忆(SMM)。例如,在我们的独轮车小丑例子中,自动化行动选择可以反复选择自动化行为“踩踏板”并将其发送至 SMM。

拥有一个完全处理自动化行为的子模块,并能够反复选择此类行为,允许行动选择并行专注于其他形式的行动选择,如意识介导的行动选择或深思。让我们回到柔术和三角绞的例子。“三角绞”是一个高层行为,由几个动作组成(见图 5):腿勾、三角勾、手臂勾和挤压。当行动选择选择该高层行为时,它将该行为发送至 AAS 子模块。从那里,AAS 可以从“三角绞”行为流中的组成行为中进行选择。简而言之,行动选择将高层自动化行为传递给 AAS,然后 AAS 从高层行为的行为流中的低层组成行为中进行选择。能够并行选择行动,使得柔术练习者能够仔细阅读对手的模式,并深思接下来做什么,同时产生复杂的行为,如“三角绞”(图 6, 7)。流畅应对通常是通过让自动化行动选择与其他形式的行动选择和谐地并行工作来实现的。




自动化行动选择与行动选择并行运行,从自动化行为流中选择行为(例如,行走、踩踏板、运球、演奏一首根深蒂固的歌曲等)。来自所选行为流的每个行为可以被视为在该流中“调用下一个”行为。因此,一旦选择了高层自动化行为,其每个低层行为,比喻地说,得以选择下一个行为是什么。例如,如果一个代理通过自动化行动选择演奏一首过度学习的钢琴曲(比如 Bent Fabric 的《Alley Cat》),每个音符,对应一个低层行为,“调用下一个”。一旦从"Alley Cat 自动化行为流”中选择了第一个音符,第一个音符在其完成后选择下一个音符。这产生了许多音乐家认可的感觉,即乐曲本质上在演奏自己。这种一个行动调用下一个行动的自动化也确保音乐家可以同时唱歌,与观众眼神交流,俏皮地抖动肩膀等,所有这些都同时进行。

用 LIDA 术语来说,自动化行为是“退化”行为流——它们是不包含分支选项的过度学习的行动。缺乏分支选项是允许行为直接“调用下一个”的原因。一个用于踩踏板的高层自动化行为可能包含一个用右腿踩踏板的行为,然后调用一个用左腿踩踏板的行为——没有分支选项。

重要的是,自动化行为流也可以是层级结构化的,其中这些流中的每个行为可以对应其他行为流。这种能力至关重要,因为许多行动的规格受益于层级结构,并且这些高层行为的复用在记忆中可能更高效。高层行为通常包含必须“对齐”的多个行为流。例如,制作一个鲁本三明治需要获取面包、蛋黄酱、酸菜、咸牛肉和瑞士奶酪,组装组件,并将它们放在盘子上。这些子行动中的每一个都可以是自动化的,并属于其自己的行为流。共同地,这些自动化行为有助于实现高层“鲁本三明治”行为。

熟食店工人可能会像往常一样制作和包装三明治,而不考虑顾客的困难特殊订单“只加一点蛋黄酱,多加泡菜,加沙丁鱼!”以不同方式制作三明治需要意识介导的行动选择,而非一个行动调用下一个行动的自动化。这解释了为何有时即使明确打算做一件事,代理最终却做了另一件事,因为行动的开端具有自动化性质。

值得注意的是,尽管自动化行为没有分支选项并调用下一个行动,它们仍然生成期望代码元。就像 LIDA 中的所有其他行动一样,期望代码元的生成允许系统跟踪其行动的完成情况,以便系统可以知道是继续其行为还是切换到其他行为。

当自动化行动选择将自动化行为向前馈送到感觉运动记忆时,该模块可以实例化运动计划,这些计划也指示自动化行动需要执行多长时间的“时机”——从而降低“无心”做某事太久的风险。在音乐例子中,每个音符的运动计划被指定非常短且精确的时机。另一方面,自动化“行走”的运动计划可以在运动计划内具有“直到进一步通知”的时间指定。我们必须记住,虽然自动化通常对专家表现有益,但流畅应对涉及交织的行动类型。过度依赖自动化通常会导致任务失败。

LIDA 中的流畅应对

描述流畅应对的一种方式是:使用自动化,并间歇性地使用意识介导的行动(见图 8),以及其他重叠的行动选择类型,以实现某个意图(Kronsted et al., 2021)。代理并非仅仅在进行多任务处理或仅仅进行自动化。相反,代理的全部或大部分认知过程都连贯地朝向实现一个意图(完成这个困难的食谱、足球动作、穿过交通到达工作地点)。


如果某个事件迫使代理放弃其行动朝向该意图的连贯性,流畅应对过程就会被中断。例如,骑独轮车的小丑正在进行流畅应对——骑车、杂耍、咧嘴笑和唱歌,所有这些都朝向以迷住的观众完成其表演的意图。然而,如果一个舞台工作人员突然跑到舞台上大喊:"你必须马上过来,你妻子要生了,"那么代理的行动就不再指向完成表演这一远端意图。流畅应对已被中断。不那么戏剧性的是,如果代理在烹饪时电话响了,如果代理接起电话并关注电话交谈而非炉灶,流畅应对就暂时被中断了。当然,一旦代理放下电话,这些过程就可以重新参与。相比之下,如果代理在打电话时继续烹饪,则仍可以说该代理处于流畅应对状态。

虽然我们在此主要关注感知和行动选择,而非记忆过程,但 LIDA 中的流畅应对是一个跨所有模块运作的现象。如前文所述,我们在本文中在此向 LIDA 认知架构引入了一个新补充——自动化行动选择子模块。在本节中,我们将简要更详细地讨论不同的行动选择模式,然后描述它们在流畅应对期间交织的性质,特别是与自动化行动选择子模块相关的方面。最后,我们提供三个具体案例研究,以展示整个理论框架可能如何展开(见"结论"部分)。

交织的行动选择与反馈循环

我们现在可以看到,LIDA 代理如何在流畅应对期间通过行动选择类型的交织来实现行动选择——意识介导的行动选择、意志行动选择、警报和自动化行动选择。当代理在各种动态变化的情境中行动时,它们必须部署不同形式的行动选择以适应性地实现其目标。例如,代理可能会部署一系列行为和行为流,以仔细操作台锯,将木块雕刻成正确的尺寸。此类行为和行为流可能包括走向台锯、抓住木材、仔细将其在台面上对齐,并将木材向前滑动到锯上,同时瞄准以确保直线切割。当代理部署这些行为流时,它们也可能会有间歇性的深思时刻,在此期间它们积极思考先切割哪些块以及如何按正确顺序将它们堆叠起来。代理可能会进一步深思切割的正确尺寸,这反过来将向下传递并影响实例化运动计划的具体细节以及运动计划执行中的行动执行。

由于我们例子中的代理非常擅长木工,他们经过多年练习开发了用于操作台锯的自动化行为流和高度复杂的运动计划模板。因此,代理主要通过自动化行动选择来操作锯。也许当代理操作台锯时,他们的手指危险地靠近刀片,系统中触发警报将手向后拉。重要的是,当警报使代理能够继续预期活动时,它们是流畅应对流程的一部分。因此,在台锯例子中,阻止代理切断手指的警报自然允许代理继续该活动。然而,将大蜘蛛从手上甩掉的警报并不会延续预期活动,并且通常会打破流畅应对。在此提出警报的原因是为了强调警报通常必须被学习,并且通常是特定于技能和情境的。例如,在巴西柔术的情境之外,得到一个漂亮的下勾抱是甜蜜且令人安慰的。然而,在柔术情境内,这意味着练习者即将被扫倒并可能输掉比赛。因此,可能会触发一个特定于情境的警报,使练习者收回手臂并试图夹紧腋窝(以拒绝对手的下勾)。警报通常是掌握技能的组成部分,因为它们迅速且绕过意识广播的竞争。

让我们回到我们的台锯例子。在多年练习的某个时刻,操作台锯已变得自动化;选择木块、在台面上准备它们以及执行切割现在由自动化行为流完成,其中一个行动调用下一个行动。通过这种方式,代理可以反复一次又一次地选择相同可靠的行为流,直到工作完成。自动化允许在自动化行动展开的同时并行选择其他行动(通常是意识介导的或深思的行动)。工人可以操作台锯(得益于自动化行动选择子模块),同时大声呵斥其学徒纠正姿势、给他们端咖啡,或者深思对于需要不同技术的困难木块使用哪种技术。

总的要点是,LIDA 中的流畅应对涉及部署各种形式的行动选择,每种形式都针对手头的任务。无论是警报、意识介导的行动、深思行动还是纯自动化行动,每个被选择的行为都连贯地朝向以适应性的方式完成代理的目标。

在此关头,我们不能忘记流畅应对涉及代理的行动与环境变化之间的多个反馈循环。例如,跟在一辆车后面驾驶同时试图阅读车上有趣的保险杠贴纸,涉及必须与该车辆保持正确的距离范围。太远则无法阅读贴纸,太近则车辆可能相撞——代理必须保持“最佳把握”(Merleau-Ponty, 1945/2012; Dreyfus and Wrathall, 2014; Bruineberg et al., 2021)。如前所述,运动中感官信息的快速背侧流更新会更新行动中的运动计划执行,以便代理在行动期间能与环境保持最佳关系。LIDA 代理的行动与背侧流信息之间存在持续的反馈循环。

此外,随着每个行动,也会生成一个期望代码元。如前所述,此类代码元扫描当前情境模型,寻找与代理行动预期结果相关的对象和事件。由期望代码元带入全局工作空间的结构通常具有高度显著性,并且非常可能赢得意识广播的竞争。以这种方式,代理的行动与其期望之间存在一个反馈循环。通过行动与高激活结果之间的反馈循环,LIDA 代理可以在动态情境中与其活动的展开保持仔细协调。我们看到,与代理行动同时发生的是对这些行动结果的注意,这反过来有助于确定预期活动的完成。这是对行动结果的注意偏向,这反过来有助于延续预期活动的完成。

最后,认知周期通常通过学习协助增加适应性。LIDA 代理可以在每个认知周期更新其记忆模块(Kugele and Franklin, 2021)。通过这种方式,代理总是缓慢但肯定地使其自身朝向更大程度的适应性移动。

通常,我们可以想到至少三个帮助 LIDA 代理进行流畅应对的反馈循环——一般认知周期(远端时间尺度上的适应性)、行动注意循环(近端时间尺度上的适应性)和行动背侧流循环(快速时间尺度上的运动适应性)。简而言之,认知周期有助于较长时间内的任务适应性。意识介导的行动选择有助于代理当前情境中的适应性。自动化、运动计划和背侧流负责快速的瞬间适应性(见图 9)。


我们已经探讨了不同形式的行动选择,以及它们在流畅应对期间如何交织朝向任务的完成。我们也探讨了伴随这些各种形式行动选择的不同反馈循环,以及这些反馈循环如何帮助代理在不同时间尺度上适应任务。

在我们的讨论中,我们将把迄今为止所探讨的所有内容应用于三个小型案例研究,以观察流畅应对如何在每种情境下的 LIDA 代理中展开。我们从相对简单的行走例子开始,逐步提升到驾驶,然后是快餐烹饪。

独自行走

萨姆(Sam)早上 5:00 起床,在谢尔比农场公园(Shelby Farms Park)进行日常散步。这条小路是环绕湖泊的一英里环路,清晨时分意味着同时散步的人非常少。

萨姆的系统利用了行走的自动化行为流。当小路围绕湖泊略微弯曲时,感觉记忆更新萨姆的运动计划和运动命令,以便萨姆调整其身体方向、每一步的高度和长度,以及在非常易行的平坦地形中移动所需的其他微小调整。路面高度的微小差异意味着有时萨姆的感觉记忆必须更新其踏步运动命令,使其稍微更长、更高一些。

由于这主要是自动化的问题,萨姆可以让他的思绪漫游,并积极思考生活中其他需要深思的事情(我应该加入比特币热潮吗?《鱿鱼游戏》真的那么好看吗?我的人生在做什么?)。鉴于地形中没有障碍物,萨姆的系统可以简单地继续选择和执行自动化行走行为。然而,没有任何自动化行为是无限期的,萨姆确实仍需定期检查障碍物。因此,萨姆仍然频繁地看向前方道路并重新选择自动化行走行为。

最终,萨姆注意到一个行人和他们的狗正在靠近。这个人和他们的狗赢得了意识竞争,萨姆的行动选择现在在多个候选行为之间进行选择(而自动化行动选择则确保萨姆仍在行走)。在行动选择中,走到草地上或站立不动让狗和主人通过是两个最显著的选项。站立不动在行动选择的竞争中胜出,萨姆让这个人及其狗在狭窄的小路上通过。选择这个行为也中断了自动化行走行为。一个期望代码元被生成,除其他外,寻找一条清晰的行走路径,因为这是萨姆行动预期结果。当狗和主人现在位于萨姆身后时,当前情境模型继续更新。然后,期望代码元将空路径结构带入全局工作空间以竞争广播。由于萨姆打算行走并期望拥有一条清晰的路径,该结构具有高激活值,并可能赢得意识竞争。

由于空路径进入意识,程序性记忆实例化相关图式,包括一个高层"行走"行为。该行为及其行为流被发送到行动选择。行动选择选择高度相关的自动化"行走"行为并将其发送至自动化行动选择子模块。结果,萨姆继续行走,由自动化行动选择子模块负责选择行动。现在,他再次可以自由地继续思考加密货币、热门电视节目和存在主义。

驾驶

萨姆结束了他充满存在主义思考的晨间散步。上午 8:00,萨姆开车去当地一家餐馆上班。路线结合了郊区道路和高速公路驾驶,大约需要 20 分钟完成。部分交通是高峰时段的交通。

萨姆正在利用自动化行为流,以安全距离跟随他前面的车辆。这当然也包括安全距离跟随的运动计划,该计划正在接受持续的背侧流更新。背侧流输入到运动计划确保萨姆不会将油门踏板踩得太重或太轻。在高峰时段交通中以适当距离跟随另一辆车涉及对运动命令的持续调整,以向油门踏板施加适当量的压力。

然而,由于这是高峰时段,萨姆也需要经常踩刹车,并在适当的压力下踩刹车。这意味着通过意识介导的行动选择,踩刹车的行为被选择并在适当的压力水平上执行。因此,萨姆拥有一个自动化跟车行为图式和运动计划,该计划经常被踩刹车的意识介导行为所中断,以保持适当距离。每次刹车被踩下时,一个期望代码元被生成,并帮助车辆之间产生的距离进入意识。车辆之间新的距离被广播反过来帮助行动选择要么重新选择自动化跟随行为图式,或者其他一些自动化驾驶行为。

通过意识介导的行动选择,萨姆决定激活变道的行为流。行动选择快速地从变道行为流中选择每个行为。感觉运动记忆为每个变道行为在运动计划之间进行选择,运动计划执行开始执行物理运动。简而言之,萨姆变道;检查后视镜、侧视镜、回头查看、打开转向灯、再次检查、向左转动方向盘、将方向盘转回中立位置、重新检查车窗和后视镜。

突然,一个正在发短信并驾驶的人偏离车道进入萨姆的车道,触发了警报。情况的紧急性意味着车辆的靠近绕过了意识广播的竞争,并被直接发送到程序性记忆。图式被实例化,行动选择选择一个适当的行为流(刹车并转向)。鉴于情况的紧急性,刹车并转向行为流具有非常高的显著性,并轻松赢得行动选择中的竞争。感觉记忆选择适当的运动计划模板并实例化它们,萨姆猛踩刹车并将车转向避开鲁莽的司机。

由于警报负责规避机动,萨姆尚未意识到刚刚发生了什么。大约 100 毫秒后,在事件在当前情境模型中被重建之后,萨姆才"意识到"刚刚发生了什么。然而,在这 100 毫秒期间,由于警报过程的迅速性,刹车并转向机动已经发生。通过这种方式,萨姆在鲁莽司机面前幸存下来。

在警报机动期间,期望代码元被创建,在当前情境模型中搜索规避机动的预期结果——与迎面而来的司机保持安全距离。由于这种事态获得,萨姆现在可以使用意识介导的行动选择,并选择对分心的司机 aggressively 鸣喇叭——真是开始轮班的绝佳方式。

快餐厨师

萨姆因驾驶遭遇而略显烦躁地到达工作岗位。他开始他在餐馆担任快餐厨师的轮班。这家餐馆有一个柜台,快餐厨师在柜台后面,还有几张桌子。这家餐馆在一天中的最初几个小时特别繁忙(人们进来吃早午餐和宿醉早餐)。萨姆在那段时间全神贯注于工作,同时处理多个订单。订单以快速节奏涌入,许多客人对他们的菜品要求修改(额外奶酪、不要奶酪、旁边加巧克力豆煎饼、旁边加辣酱、用沙拉代替薯条等)。除了制作各种菜单项目外,几位常客带着他们的特殊订单到达,并期望在他们坐在柜台时得到问候。

让我们从第一个订单开始——两份班尼迪克蛋、土豆和一份哈罗米沙拉(订单一)。看到订单纸条后,一个远端意图在当前情境模型中被创建(完成订单一)——这个意图提示关于哈罗米沙拉、土豆和班尼迪克蛋的信息进入 CSM。首先,意图(完成订单一)赢得意识竞争,在接下来的几个周期中,关于厨房当前状态的结构以及包含班尼迪克蛋、土豆和哈罗米蛋信息的结构,各自赢得意识竞争(鉴于认知周期的迅速性,这一切仍然发生在最初的一两秒内!)。

此时,关于厨房状态和要做什么的信息现在存在于 CSM 中,并被广播到程序性记忆。这些信息现在被用于实例化大量的图式和图式流。这些候选行为被发送到行动选择,行动选择现在必须选择"做什么"。在这种情况下,对应于水波蛋自动化行为流的高层行动被选择并发送到 AAS。AAS 从"水波蛋"自动化行为流中选择行为并将它们发送到感觉运动记忆模块。感觉运动记忆实例化厨师高度熟练的水波蛋运动计划,并将其发送到运动计划执行。这个过程继续,行为流中的其他行为被自动化行动选择子模块选择,其中每个行动可以被视为调用下一个行动。因此,萨姆最终利用自动化快速搅拌醋水混合物、打碎鸡蛋并将它们捞出来。

当萨姆通过自动化水波蛋时,一位常客坐在柜台旁(大卢)。这位常客的存在对萨姆来说非常显著,并轻松赢得意识竞争。程序性记忆在接收到全局广播(包含"常客大卢"的内容)后实例化几种问候行为,其中一种被行动选择选择。同时,水波蛋自动化行为仍在被执行。换句话说,萨姆现在一只手快速搅拌锅,另一只手将鸡蛋打入锅中,同时将身体朝向顾客,说道:"嘿伙计,最近怎么样?"

大卢试图隔着柜台与萨姆握手问候。但由于萨姆双手占满,他需要使用补偿性行为。伸出的手进入意识并实例化几种可能的候选行为——其中一种行为是用肘部完成问候。选择这个行为意味着实例化一个运动计划,该计划也考虑到萨姆仍在通过自动化搅拌锅并打鸡蛋。当萨姆将肘部伸过柜台以便大卢可以与他的肘部击掌时,萨姆用于搅拌和打鸡蛋的运动计划可以通过背侧流信息和/或后续的意识广播进行大幅调整。

当鸡蛋即将完成时,一个新订单进来:法式吐司和炒鸡蛋,配一份培根(订单二)。这个事实进入意识并为订单二创建一个远端意图,该意图被存储在萨姆的瞬态情景记忆以及当前情境模型中以备后续检索。一旦萨姆完成订单一,他就可以关注并处理订单二。然而,此刻萨姆仍需组装订单一。订单二的意图赢得意识竞争,该意图在整个模型中被广播,包括各种短期和长期记忆模块(萨姆现在处理的是当前情境模型中存在的两个远端意图)。

然而,萨姆仍在处理订单一。因此,萨姆现在使用意识介导的行动来仔细组装订单一的班尼迪克蛋(他需要抓取并组装英式松饼、火腿、水波蛋和荷兰酱)。鉴于厨房里有几位厨师,萨姆不必从头制作所有东西(例如,一名工人在酱汁站,另一名在肉类站)。然而,萨姆确实需要知道每个组件的位置以及他同事的位置和活动。这些信息在萨姆的当前情境模型中更新,包括环境中的可供性。例如,如果荷兰酱锅的盖子盖着,酱汁就无法倾倒。然而,如果盖子倾斜,萨姆从根深蒂固的机构知识中知道他的同事已完成酱汁工作。在这种情况下,锅因此提供了"可倾倒性",萨姆利用该信息执行一个意识介导的行动,将一些酱汁倒在鸡蛋上。

当萨姆组装班尼迪克蛋、倒酱汁并调整装饰时,他将菜肴的当前状态与班尼迪克蛋通常应该是什么样子的长期记忆进行比较——呈现效果是成功的一半。此外,当他向菜肴添加每个组件时,期望代码元持续保持他的注意力在轨道上。

萨姆将完成的菜肴放在服务台上供服务员取走,并开始订单二,此时订单三、四和五也陆续到达。当萨姆使用自动化行动制作更多鸡蛋、翻炒煎土豆或搅拌时,他也在跟踪每个订单,行动选择反复发送新的行为向前推进。在自动化行为与意识介导行为之间持续舞蹈的间歇,萨姆可能需要进行深思。例如,萨姆应该处理订单五而不是订单四,因为订单四的所有原料尚未准备好?一个观念运动过程开始,包含提议者、支持者和反对者。"不,让我们按先来先做的顺序处理菜肴。那样最简单""是的,让我们把订单四搁置,以便在等待三文鱼完成烹饪时处理我们能处理的订单。"即使萨姆在积极深思,他仍在执行自动化行动和意识介导的行动。最终,在三文鱼烹饪期间跳过订单四赢得了深思过程,行动选择选择与制作订单五相关的行为。

下午 4 点左右,早午餐高峰终于结束,萨姆可以挂起围裙回家。真是忙碌的一天!

结论

流畅应对是高技能活动(如体育和表演)中的常见现象,但也存在于我们日常导航世界的生活中。流畅应对通常涉及认知活动朝向某个任务或活动的连贯性和集中性(这通常是高度文化决定的)。

学习智能决策代理(LIDA)代理通过交织几种形式的行动选择来参与流畅应对,包括:意识介导的行动选择、意志行动选择、警报和自动化。自动化是过度学习的行为流,允许在没有意识干预的情况下选择行为;概念上是一个行动调用下一个行动。这些自动化也促进了自动化行动执行的并发性。自动化行为流不仅可以并发执行,而且也可以是层级结构化的。流畅应对通常涉及将注意力和适应性偏向任务,以便代理能够在各种情境中获得最佳把握。

LIDA 模型包含跨远端、近端和快速时间尺度的各种反馈循环,以帮助代理实现适应性。符合最近具身和生成式的认知方法,LIDA 代理始终在回答"我接下来应该做什么?"这个问题。通过交织的行动和感知循环,代理追求其议程,并在此过程中在不同时间尺度上达到更高程度的适应性。

流畅应对文献以及我们在 LIDA 中对流畅应对探索的一个优势在于,专家行动和日常生活都利用相同的认知资源,因此我们可以在不使用任何额外"特殊"认知资源的情况下,清晰地描绘从新手到专家的进展。事实上,从流畅应对的文献以及我们在 LIDA 中对流畅应对的概述中,我们可以体会到专家表现和日常认知中所涉及的复杂性。尽管流畅应对执行起来看似轻松,但它对任何认知系统(无论是人工的还是有机的)而言都是一项巨大的成就。

原文链接:https://www.frontiersin.org/research-topics/20474/bio-ai---from-embodied-cognition-to-enactive-robotics/magazine?page=2

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
王毅这次出访不一般,身边多带了一个人!东南亚三国要变天了?

王毅这次出访不一般,身边多带了一个人!东南亚三国要变天了?

闫树军论评
2026-04-22 15:47:07
曼晚更新曼城伤情:罗德里下一场复出,鲁本预计踢埃弗顿回归

曼晚更新曼城伤情:罗德里下一场复出,鲁本预计踢埃弗顿回归

懂球帝
2026-04-23 23:33:02
手握20多个冠军,嫁外国名将带夫定居广州,如今是中山大学副教授

手握20多个冠军,嫁外国名将带夫定居广州,如今是中山大学副教授

以茶带书
2026-04-16 14:50:51
回家不撅两下,都觉得委屈它!

回家不撅两下,都觉得委屈它!

飛娱日记
2026-04-23 08:10:41
东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

番外行
2026-03-31 08:28:28
马筱梅直播称:以后大宝二宝的问题都不回答,自己没对不起任何人

马筱梅直播称:以后大宝二宝的问题都不回答,自己没对不起任何人

观鱼听雨
2026-04-23 23:02:03
CBA要变天了!四川41连败球员都快跑光了,香港金牛3连冠坐等升级

CBA要变天了!四川41连败球员都快跑光了,香港金牛3连冠坐等升级

弄月公子
2026-04-22 21:11:03
福特:解散电动汽车事业部

福特:解散电动汽车事业部

中国能源网
2026-04-22 17:39:14
我需要你:这句话,我等了太久才敢说出口

我需要你:这句话,我等了太久才敢说出口

疾跑的小蜗牛
2026-04-23 19:37:33
“暴力抗法”半月后,拼多多发生重大高管调整

“暴力抗法”半月后,拼多多发生重大高管调整

一见财经
2026-04-23 08:04:06
悲哀!26岁女孩大半年攒下1万元,想去旅游被母亲怒斥不管弟弟了

悲哀!26岁女孩大半年攒下1万元,想去旅游被母亲怒斥不管弟弟了

火山詩话
2026-04-23 09:54:06
以色列成了赢家?虽然没有拿下伊朗,内塔尼亚胡获得大片土地交差

以色列成了赢家?虽然没有拿下伊朗,内塔尼亚胡获得大片土地交差

三石记
2026-04-22 16:53:58
1962年MVP之争!这仨人数据太可怕了

1962年MVP之争!这仨人数据太可怕了

篮球大图
2026-04-23 15:13:08
聚焦身体敏感部位、衣着暴露……得物中小学穿搭内容被指擦边!

聚焦身体敏感部位、衣着暴露……得物中小学穿搭内容被指擦边!

柴狗夫斯基
2026-04-22 21:41:01
队史首次闯进季后赛!宁波男篮官宣:与NBL场均20+8内线完成签约

队史首次闯进季后赛!宁波男篮官宣:与NBL场均20+8内线完成签约

狼叔评论
2026-04-23 16:08:07
张小泉,要造芯片了?

张小泉,要造芯片了?

中国新闻周刊
2026-04-23 18:24:15
33岁章泽天风格大变!穿艳俗纱裙、副乳突出,比实际年龄成熟10岁

33岁章泽天风格大变!穿艳俗纱裙、副乳突出,比实际年龄成熟10岁

阿讯说天下
2026-04-18 14:53:39
都说美国是敌对势力,那这些事如何解释?

都说美国是敌对势力,那这些事如何解释?

听哲学
2026-04-21 13:05:02
豪门姐打脸沙滩影后?刘宇宁厌恶宋祖儿?范世錡方忙告黑?李卿恋爱?姨太问答

豪门姐打脸沙滩影后?刘宇宁厌恶宋祖儿?范世錡方忙告黑?李卿恋爱?姨太问答

毒舌扒姨太
2026-04-23 22:34:03
江苏一女生去吃早餐,发现店竟然开在卧室里,屋内除了餐桌和凳子,还有一张挂着蚊帐的床和床头柜,网友:走进早餐主理人寝室了

江苏一女生去吃早餐,发现店竟然开在卧室里,屋内除了餐桌和凳子,还有一张挂着蚊帐的床和床头柜,网友:走进早餐主理人寝室了

台州交通广播
2026-04-23 20:36:36
2026-04-24 00:15:00
CreateAMind incentive-icons
CreateAMind
CreateAMind.agi.top
1368文章数 19关注度
往期回顾 全部

科技要闻

马斯克喊出"史上最大产品",但量产难预测

头条要闻

媒体:海军宣传片出现的"新兵何剑" 传递了巨大信息量

头条要闻

媒体:海军宣传片出现的"新兵何剑" 传递了巨大信息量

体育要闻

给文班剃头的马刺DJ,成为NBA最佳第六人

娱乐要闻

王大陆因涉黑讨债被判 女友也一同获刑

财经要闻

关于AI算力链"瓶颈" 这是高盛的最新看法

汽车要闻

令人惊艳的奇瑞车 风云A9可不只是样子货

态度原创

旅游
健康
教育
公开课
军事航空

旅游要闻

文旅观察丨玩转“票根+”,山东何以用一张票解锁一个省?

干细胞如何让烧烫伤皮肤"再生"?

教育要闻

中考填志愿这个电话一定要打

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

人民海军成立77周年 主力舰艇亮相上海

无障碍浏览 进入关怀版