网易首页 > 网易号 > 正文 申请入驻

如何打造有意识的机器 How To Build Conscious Machines

0
分享至

https://osf.io/wehmg/download

如何构建有意识的机器





如何构建有意识的机器

迈克尔·蒂莫西·贝内特博士论文摘要
澳大利亚国立大学,2025年5月13日

如何构建一台有意识的机器?更进一步地说,什么是意识?为什么我的世界由诸如红色或咖啡气味之类的“感受质”(qualia)构成?这些是现实的基本构成单元,还是可以分解为更基本的东西?如果是这样,这表明感受质就像计算机中的抽象层。一种简化。有人认为简单性是智能的关键。偏好更简单模型的系统适应时需要更少的资源。它们“泛化”得更好。然而,简单性是一种形式属性,泛化是功能属性。两者之间的任何相关性都取决于解释。理论上可能没有相关性,但在实践中却存在。为什么?软件依赖于解释它的硬件。它由一系列抽象层组成,每一层都由其下一层进行解释。我认为硬件只是另一层。正如软件被硬件解释,硬件被物理所解释。我们无法知道这个栈的尽头在哪里。因此,我形式化了一个无限层级堆栈,以描述所有可能的世界。

每一层都体现着限制可能世界的策略。一项任务就是在其中完成的那些世界。自适应系统是抽象层,即多计算系统(polycomputers),而一个策略能同时完成多个任务。当环境状态发生变化时,一部分任务得以完成。这是目标导向行为产生的“宇宙应然”(cosmic ought)(例如自然选择)。“简化最大化”(simp-maxing)系统偏好更简单的策略,“w-最大化”(w-maxing)系统则选择对可能世界施加更弱的约束。我证明了 w-最大化能够最大化泛化能力,从而确立了智能的上限。我还证明所有策略都可以采取同等简单的形式。简化最大化本不应有效。为了说明为何它有效,我引入贝肯斯坦界(Bekenstein bound)。这意味着各层只能使用所有可能形式的有限子集。有利于泛化的过程(例如自然选择)将使弱约束采取简单形式。

我进行了实验。w-最大化泛化的速度是简化最大化的110–500%。我形式化了系统如何将其适应性向下委托到层级堆栈中。我证明,如果控制被无限地委托下去,w-最大化将趋向于简化最大化。生物系统比人工系统更具适应性,因为它们将适应性进一步向下委托。它们是生物电多计算系统。随着它们从细胞扩展到器官,它们从简单的吸引与排斥,发展成丰富的价值织锦(tapestry of valence)。这些织锦分类并识别导致价值感的对象和属性,我称之为“因果同一性”(causal-identities)。我提出了一种心理物理因果原则,主张感受质就是价值的织锦。大量的细胞组成一支交响乐团,演奏出价值的交响曲,分类与判断。一个系统可以为自己学习第一阶、第二阶及更高阶的价值织锦。现象学意义上的“像什么”(what it is like)的意识始于第一阶自我(1ST-order-self)。用于交流的意识访问始于第二阶自我(2ND-order-selves),从而使哲学僵尸成为不可能。这将智能与意识联系起来。那么,为什么我们拥有我们所拥有的感受质呢?一个稳定的环境是一个系统可以在不进行简化最大化的情况下实现w-最大化的层级。然后,堆栈可以变得高大而复杂。这或许有助于揭示生命起源以及费米悖论。多样化的智能可能无处不在,但我们无法感知它们,因为它们不符合我们的堆栈所提供的因果同一性的先决条件。最后,我整合所有这些内容,解释如何构建一台有意识的机器,以及我称之为“时间鸿沟”(The Temporal Gap)的问题。

I. 前言和章节摘要

人类忽视减法式解决方案。我们拒绝简化。工程师将代码片段拼凑成庞大而混乱的网络,以至于错误无法被发现。在更贴近人类尺度的层面,政府肆意地不断添加法律,但你又有多经常看到它们废除旧法?这种偏好扩张而非收缩的倾向,在人类各类活动中均有充分记录¹⁵。在科学与哲学探索中,我怀疑我们忽视减法式解决方案的倾向,使许多问题变得比必要时更加复杂。当我们遇到现有理论框架无法解释的数据时,加法式的解决方式就是构建更多、更复杂的理论,以调和旧理论与新数据之间的矛盾。然而,我们并不总是需要将新与旧调和。我们只需要解释“是什么”,而有时这意味着抛弃先入之见。例如,米尔顿·弗里德曼提出了简单的货币模型,取代了复杂的周期性模型,从而指导货币政策,帮助我们避免重蹈大萧条的覆辙。我对一些同样被既往观念所束缚的广泛深刻问题感兴趣:我们如何构建一台有意识的机器?为什么任何事物会具有意识?为什么会有生命?生命是什么?复杂性是一种幻觉吗?生物系统是否比人工智能更聪明?为什么?为寻找答案,我在同行评审的书籍和期刊上发表了一系列论文¹⁶。我撰写这些论文并非作为彼此割裂的作品,而是作为一个更大愿景中相互关联的部分,最终汇聚于本篇博士论文。

总体而言,本论文探讨的是如何构建一台有意识的机器。实际上,我并没有真正建造出一台有意识的机器,因为那对一篇论文来说似乎过于“杀鸡用牛刀”。我拥有的是关于意识是什么以及它是如何产生的解释。仍有一些未解的问题。此外,我还提供了一些证明和实验结果,展示了如何尽可能高效地“适应”,这对构建人工超级智能是有用的。

还有一些其他成果。我解释了生命起源、语言、费米悖论、因果性、奥卡姆剃刀的替代方案、在公司或其他组织中构建控制结构的最优方式,以及如何给计算机“制造癌症”的指导。这些内容大多已发表,尽管听起来有些奇怪,但它们都与一个连贯的愿景相联系。它们并非孤立地构思出来,而是作为一个整体的不同部分。

接下来是整篇论文的摘要。本摘要的目的是在进入具体细节之前,为你提供一个关于我在做什么以及为何这样做的叙事性概述。因此,它使用了诸如“因果同一性”和“任务”之类的术语,但并未对其进行正式定义。这些术语将在论文主体部分被正式定义,但在此处,应以直觉方式理解。简洁是本章唯一追求的美德。

II-III. 文献综述

第二章和第三章为文献综述。

第二章综述哲学与神经科学。什么是意识实体?要构建一个,我必须先了解它。哲学、心理学和神经科学都提供了重要见解。然而,这一问题远未解决。在能够说明如何构建有意识的机器之前,我必须在这些领域中的争议问题上采取明确立场。因此,我回顾了一些相关概念和争论,整合了我在具身人工智能(enactive AI)与伦理人工智能¹⁷、通信¹⁸以及意识¹⁹方面的出版物中的引言部分。涵盖的主题包括心身问题、功能主义、意识理论、自我组织、自由能原理、具身认知(enactivism)、认识论、符号学、结构主义、后结构主义以及意义理论。

第三章讨论通用人工智能(AGI),这是本论文的基础。它是基于我最早期的一篇出版物²⁰的综述,并已更新以反映近期的发展²¹。我首先讨论了几种关于智能和AGI的定义。最终,我将智能定义为适应性²²,而AGI则是具有普遍适应能力的系统。为了便于评估,我将AGI定义为“人工科学家”。我的灵感来自萨顿的“痛苦教训”²³,即:只要资源充足,持续地用计算力量去冲击问题,总会胜过人类的创造力。只要有足够资源,任何通用的优化方法最终都能达到任意水平的技能。两种方法已被证明始终有效:搜索(search)和近似(approximation)。我分析了它们各自的优缺点及实例。搜索与近似的混合方式最为理想。我还讨论了一些混合模型,例如Hyperon²⁴、AERA²⁵和NARS²⁶。我引入了一种可应用于搜索、近似或混合方法的元方法(meta-approach)的概念。例如,根据萨顿的“痛苦教训”,一种元方法是最大化规模与可用资源(scale-maxing)。另一种是基于奥卡姆剃刀原则的简化最大化(simp-maxing)。我评估了这些方法的优缺点,它们使我们得以推测超级智能可能的行为方式。然而,简化是一种解释问题,具有主观性,因此这些主张也具有主观性。在本论文中,我提出了一种替代性的最优元方法。总体而言,本文讨论的元方法旨在最大化形式的简洁性(simp-maxing)、最大化规模(scale-maxing),以及最大化对功能约束的弱化(w-maxing)。后者正是我的提案。

IV. 哇,万物皆计算机

本章解释为什么复杂性是主观的,以及如何形式化客观性能。关键成果是我称之为“计算二元论”(computational dualism)的概念,该概念已在同名出版物中描述²⁷,²⁸。我首先指出,“软件智能”这一观念本身是错误的。软件的行为由其运行的硬件决定。硬件为软件解释环境,软件则为环境解释自身。我使用“计算二元论”一词来描述那些将“心智”视为脱离身体的实体、通过解释器与环境互动的理论。我得出结论:若要对智能的客观行为做出断言,我们就必须避免计算二元论。

我提出一个解决方案,此前已在我的多篇论文中发表²⁹。为了避免计算二元论,我们或许会倾向于认为只需专注于硬件即可。然而,这可能会重蹈覆辙。计算机系统被组织成“抽象层”。更高层次的抽象层运行在更低层次的抽象层之上。例如,Python 语言由 C 程序解释执行。我认为,这些抽象层并不会以硬件为终点,硬件本身也由物理定律所解释,正如软件由硬件解释一样。

推演至逻辑结论,万物都是抽象层的堆栈³⁰。软件是硬件的一种状态。人类是器官的状态,而器官又是细胞的状态。如果心智是 f₃,身体或硬件³¹ 是 f₂,局部环境是 f₁,那么“堆栈”就是 f₁(f₂(f₃))。也许这个堆栈还有一个最底层,即“基础物理” f₀,这意味着堆栈是 f₀(f₁(f₂(f₃)))³²。然而,我们无法知道这一点。这个堆栈可能无限延伸下去。为了做出无论在何种情况下都成立的断言,我得出结论:我需要一种在所有可能世界中都成立的形式化体系。我提出了一种这样的形式化体系。它是一种对“环境”的形式定义,构成了我所称的“堆栈理论”(Stack Theory)³³ 的基础。它是所有环境和“基础物理”的共同特征。它将时间等同于差异,将差异等同于环境的状态。这使我能够用“差异”来形式化声明式程序,并整合泛计算主义(pancomputationism)³⁴。随后我论证,万物都必须落在这种形式化所能描述的范畴之内。是的,我的形式化仍然是一种抽象。但有些主张如此弱,以至于它们对一切事物都为真。

V. 一路向下全是乌龟

第五章讨论“具身性”(embodiment)。每个身体都是一个抽象层。当我用身体做某件事,比如抬起手臂时,我就改变了接下来可能发生的事的可能方式。我给世界施加了一种约束。从这个意义上说,身体在“说”一种形式语言³⁵。这种具身化的语言是本体论意义上的,意味着它是一个陈述本身,而不是指向某个事物。每一个物理实体都是一种抽象层,它使用一种形式语言进行表达,而不仅仅是活体生物。计算机使用硬件状态的形式语言;宇宙则使用物理学的形式语言³⁶。这一思想再次源于我关于抽象层的出版物³⁷。我展示了堆栈理论如何表达声明式程序的具身化形式语言。这些程序构成了该语言的词汇。借助这种语言,身体做出具有真值的陈述。在具身化形式语言中,某物被环境“物理地说出”。这就是物理定律的语言。如果我是全知的,环境将一次只处于一个状态,因为时间就是差异³⁸。那个状态将决定当前什么是真实的。该语言的语法来源于这样一个事实:环境的状态在此意义上是互斥的,某些词汇表中的程序永远无法同时表达。一切存在的事物,都是在环境的具身化形式语言中所作出的一个陈述,而哪些陈述为真取决于当前的状态。然而,从我在环境中主观视角来看,我无法知道其物理状态是什么。我是一个陈述,只要环境表达了我,我就存在。当一个陈述被做出时,它就限制了其他可能发生事件的空间。每个陈述都有一个外延。直观上,我的外延就像是“我存在的多个世界”。

每个陈述都隐含着另一个更高层次的抽象层。一个陈述的外延构成了上一层的词汇。通过这种方式,环境所做出的每一个陈述都会创造出一个抽象层。下一层的输出构成了上一层的词汇。我们通过观察最初身体的二阶效应,向上提升了一个抽象层级。一个抽象层就像是在一个更大环境背景下定义的“小世界”³⁹。它拥有自己的形式语言,等价于大环境所能表达事物的一个子集。环境所做出的每一个陈述就是一个身体,而每个身体都有其外延,因此也拥有自己更受限的具身化形式语言,其中可以表达进一步的陈述。一层又一层嵌套的抽象层。

VI. 主人,我的目的是什么?

第六章讨论“目的”。这些成果此前已发表于我关于抽象层⁴⁰和意识⁴¹的论文中。本章的结果是对具身任务、推理和堆栈的正式定义。在前几章中,我将身体或硬件定义为能表达陈述的具身化形式语言。我可以选择身体所能做出的任意一个陈述,并称之为输入(input)。可能的输出(outputs)是该输入的外延。因此,身体可以被看作是一个计算系统,它将输入映射到输出。我可以从中选出一部分可能的输出,并称其为“正确”(correct)。我将一组输入和输出称为一个任务(task)。这是一种对任意“正确性”概念或“应当如何”的形式化方式。根据休谟的“剃刀”(Hume’s Guillotine),我无法从“是什么”推出“应当是什么”,因此我需要一个普遍的、宇宙级的“应当”(cosmic ought),以便从中推导出所有其他“应当”。我认为,这个“应当”来源于时间。变化是根本性的。当状态改变时,陈述就会被摧毁。一个身体就是一个陈述,只要环境持续表达它,它就存在。主观上,我们可以将创造与毁灭的过程解释为陈述之间“相对运动”。持久存在的陈述是那些远离其被摧毁情境的陈述。当环境从一个状态过渡到另一个状态时,这会淘汰那些不寻求维持自身存在的事物。这类似于自然选择,但适用于环境的每一个方面。它产生了一种激励机制,我称之为“宇宙应然”(cosmic ought)。我在此主张的是:环境所表达的一切都是“应当如此”的陈述,其余则属于“不应当如此”。

每个陈述都隐含着比其表达所在层级更狭窄的一个抽象层,就像大世界中的一个窗口或小世界。当我们沿着堆栈向上时,“应当”变得越来越具体。例如,一个环境本身可以是一个抽象层。生命形态就是在该抽象层中生成的陈述,随着每一层抽象的叠加,它们变得越来越具体。如果一种生命形态持续存在,就可以认为它是“适应的”(fit),那么对于一个适应的有机体而言,所有“适应”的输出集合就可以构成它的外延。然而,许多生物常常并不“适应”。这类模糊意义上的“适应”生物,其外延中既包含适应行为也包含不适应行为。即使它表现出不适应的行为,它仍然存在,只是无法满足维持稳态和生殖目标的条件。正是这种“适应”与“不适应”的区分,使得任务得以形式化——通过指出哪些输出被认为是“正确”的,以及在哪些输入下“正确”真正重要。因此,我在一系列任务的堆栈中形式化了目标导向行为⁴²。

VII. 弱

第七章讨论智能。核心成果发表于我关于“弱”假设的论文中⁴³。本章提出了一种最优学习理论。我提出一种元方法,称之为“w-最大化”(w-maxing),并基于此建立了一个对智能行为的上界。我形式化地证明,并通过实验验证:w-最大化是优的,而简化最大化(simp-maxing)则不是⁴⁴。

如果我们从达尔文主义的观点出发,那么智能就是一种长期适应⁴⁵,它促进短期适应⁴⁶。没有智能,一个有机体必须从出生起就拥有所有知识的硬编码。有了智能,它便能在生命周期内进行适应,从而在比无智能情况下更多的环境中生存下来⁴⁷。为了在我的形式体系中表达这一点,我用有机体“做什么”(what it does)来描述它,而不是“是什么”(what it is)⁴⁸。“做什么”即为任务(task)。我解释了如何将一个有机体所执行的任务细分为子任务,即通过选择输入和输出的子集,我称之为“子任务”(child tasks)。因此,任务存在于代际层次结构中。一个有机体的过去是其未来任务的子任务。一个任务意味着一组策略,这些策略约束有机体的行为以符合任务定义。如果一个有机体被约束为表现出适应性行为,那么它就体现了一种“适应的策略”。学习的过程是从过去推断出一种策略,以确保未来的行为是适应的。直观上,策略就像工具。一个工具可以完成不止一个任务。锤子既可以是武器,也可以是镇纸。更弱的策略是一种能完成更多任务的工具。最弱的策略能够完成最多数量的任务。我证明,在所有策略中,最弱的策略最有可能泛化,从而最大化适应效率。我将这种元方法称为“w-最大化”⁴⁹,⁵⁰。

我进一步比较了 w-最大化 与 简化最大化⁵¹。我证明了我们可以在不进行简化最大化的情况下实现 w-最大化。我通过实验支持这一主张,比较了两种元方法。我让它们尝试学习二进制乘法和加法。w-最大化系统的表现比简化最大化系统高出 110–500%。需要学习的例子越少,选择弱策略的优势越大。这表明,最优代理并不需要优化更简单的模型。随后我证明,客观上最优的代理是那种体现了一项任务中最弱策略的代理,从而为具身智能提供了一个上界。

VIII. 堆栈主义

本章整合了我关于复杂性⁵²和抽象⁵³的论文。我解释了为何形式上的简单性与功能之间存在关联。理论上,两者可能毫无关联,但在实践中却存在联系⁵⁴。我的研究结果提供了证明,解释了这种相关性的成因,并说明了为何生物系统似乎比人工智能更能高效地适应环境。我首先证明,在最低层次的抽象中,所有策略在形式上都是同样简单的。不存在所谓客观复杂性这一概念。接着,我论证身体必须使用有限的词汇表,这是由于贝肯斯坦界(Bekenstein bound)的限制⁵⁵,⁵⁶。我指出,存在某些抽象层,在其中简单的陈述意味着更弱的约束。由于词汇表是有限的,一个能以简单形式表达弱陈述的抽象层,将能够表达比那些不能以简单形式表达弱策略的抽象层更多的弱策略。这意味着,复杂性是一种由抽象层制造出的幻觉。在给定有限资源的情况下,为了最大化适应能力,抽象层必须用更简单的形式表达更弱的约束,这是必要的⁵⁷。换句话说,最大化对功能的弱约束(w-maxing)会导致形式简单性的最大化(simp-maxing),但反过来,simp-maxing 并不一定导致 w-maxing。自然选择偏好那些能够表达更灵活策略的身体。这迫使“弱”与“简单”之间产生相关性。由于我们是自然选择的产物,我们的语言也反映了这一点。

接下来,我探讨系统是如何做到这一点的。生物系统似乎比人工智能更擅长构建多功能的抽象层。为了理解其原因,我分析了系统在抽象、委托和分布等维度上的差异。我认为,将控制权下放至更低抽象层级的系统更具适应性。我通过来自生物系统、计算系统、人类组织、军事系统和经济系统的例子来说明这一点。利用堆栈理论,我证明:在更高抽象层级上的适应性,需要在更低抽象层级上具备适应能力。我将此称为“堆栈定律”(The Law of the Stack)。我主张,生物系统之所以更“智能”,是因为它们将控制权下放到更低的抽象层级。换一种挑衅的说法,人工智能就像一个僵化的官僚体系,只能自上而下地适应。而生物系统通过在低抽象层级进行适应,能够在高层级确保弱约束以简单形式出现⁵⁸。我认为,这正是自然界系统强制建立形式简单性与功能弱约束之间相关性的原因。因此,形式简单性与功能弱约束之间存在相关性。

IX. 让我们进入心物层面

第九章探讨对象与属性是如何产生的。本章整合了我关于因果性⁵⁹,⁶⁰和意识⁶¹的研究工作。核心成果是“因果同一性”(causal-identities)的形式化,解释系统如何学习因果关系;提出了“心物因果原理”(Psychophysical Principle of Causality),解释系统为何基于 w-最大化来学习其所感知的对象与属性;以及对“自我”的形式化,为后续的意识与意义理论奠定基础。

通常,要描述因果性,我会从一组代表对象及其属性的变量开始,然后通过实验判断改变一个变量是否会影响另一个变量。然而,这种方法只有在我已经将世界划分为变量时才有效,而我的形式体系尚未做到这一点。幸运的是,我们拥有来自物理状态的吸引与排斥。价值感(valence)是一种因果关系。因此,我可以反过来解决问题,转而去学习对象本身。我们已有最优适应性的证明:任何能最优适应的系统都必须正确识别因果关系。我证明,当系统以 w-最大化的方式响应环境状态中的吸引与排斥时,它会体现一种策略,用以分类产生价值感的原因。我将这些策略称为“因果同一性”(causal-identities)。它们是前语言的分类器。较弱的因果同一性会分类更常见、更常遇到的价值原因。这解释了为何以及如何一个无内容的环境被划分成了对象与属性。我称此为“心物因果原理”⁶³。我指出,一个系统要为某个对象构建因果同一性,需要两个前提条件:动机(incentive)和规模(scale)。首先,必须存在某种动机,例如该对象与生存相关;其次,系统必须能够体现这种因果同一性⁶⁴。

为了生存,我必须能够区分自己所造成的结果与未造成的结果。这意味着必须为“自我”构建因果同一性。我引入了“因果同一性的阶次”(orders of causal-identity for self),并证明只要满足规模和动机的前提条件,这些阶次就会被构建出来。一阶自我(1ST-order-self)分类我的干预行为。二阶自我(2ND-order-self)是我对你预测我一阶自我的预测。这对心智理论、群集和捕猎猎物是必需的。最后,三阶自我(3RD-order-self)允许个体预测自己的二阶自我,这对于预测社会环境和复杂叙事是必需的。

X. 语言癌

第十章讨论语言与癌症。本章整合了我最早的一篇论文,其中我提出了“镜像符号假说”⁶⁵,以及后续关于符号涌现⁶⁶和格赖斯语用学形式化⁶⁷的论文。研究结果包括:对意义如何被传达、规范如何形成、以及这些与癌症之间的关系的形式化描述,并对正交性论题(Orthogonality Thesis)提出反驳。

我展示了二阶自我(2ND-order-selves)在沟通中是必要的,正如格赖斯(Grice)所描述的那样⁶⁸。格赖斯认为,如果我在向你说话,我的意义就是我意图表达的内容。如果你推断出了我的意图,你就理解了我。一个二阶自我让我能够预测你认为我所想的内容。我可以利用这一点来预测你将如何理解我的意图。因此,我可以预判自己需要表达什么内容,以引导你的推理趋向于我想要传达的意义。反之,如果我想知道你真正想表达的意思,我可以通过对我对你预测我对你预测的推断来进行溯因推理(abduction)。

这解释了规范的涌现。能够沟通的生物体可以合作。现在我们知道“如何”进行沟通,就很容易理解语言是如何进化的。我将原初符号(protosymbols)和偏好形式化,将其连接到已建立的符号学理论中。我解释了合作如何促进社会捕食,以及在重复互动中足够的预测准确性如何激励诚实行为。我主张,同一物种的成员具有相似的偏好,因此效率决定了生物体会使用自身的偏好去预测其他个体的行为⁶⁹,⁷⁰。最后,我将规范性(normativity)与癌症联系起来。在一个生态系统中,计算是分布式的且并发的。不同的生物体在同一时间相互作用,形成集体。当它们为了某个目标而相互约束时,就会形成一个具有身份的集体信息结构。戴维斯(Davies)和莱文(Levin)曾提出,癌症是细胞脱离其集体信息结构时发生的现象⁷¹。我将这一观点形式化为堆栈理论。我将规范性定义为集体身份。我证明,当没有足够弱的策略可以被集体成员共享时,身份就会丧失。在这种情况下,集体的部分将表现出类似于癌症的行为。堆栈定律表明,系统应在满足功能需求的前提下尽可能地保持未明确指定和松散约束。合作以及规范的涌现依赖于将控制权下放至足够低的抽象层级。我随后利用这一点探讨人工智能安全问题,并驳斥强正交性论题。

XI. 为何万物有生命?

在本章中,我提出一个问题:在一个看似冷漠的宇宙中,是什么驱动了生命的出现?为什么生命是复杂的,而复杂形式在理论上更不可能存在?在回答这些问题时,我回应了对“泛计算具身主义”(Pancomputational Enactivism)的批评,这些批评认为我的理论未能以与“自由能原理”相一致的方式形式化认知,也未能解释边界问题⁷²。我主张,一块岩石之所以持续存在,仅仅是因为它遵循简化最大化(simp-maxing),这使得它倾向于表达更弱的约束,从而得以持久。相反,一个能够自我修复的系统则恰恰相反——它通过 w-最大化来维持自身,而这正是以牺牲简化最大化为代价的。这种机制只可能存在于稳定的环境中。当底层堆栈保持静态时,弱约束无需采取简单形式。通常来说,黏菌比岩石更脆弱,但在地球环境的背景下,它更具适应性,因为它能“做更多事”——扩散和繁殖。这类系统可以在更高抽象层级的约束下,优化自身的适应能力。接着,我将这一观点与“功能信息递增定律”(Law of Increasing Functional Information)联系起来⁷³,⁷⁴,并将其翻译为堆栈理论,随后加以证明。最后,我利用因果同一性的动机与规模前提条件,解释费米悖论(Fermi Paradox)。智能系统可能就在我们周围,但我们无法识别它们为智能体,因为我们无法为它们的行为构建合理的解释。它们超出了人类堆栈所能提供的规模与动机前提条件。这整合了我关于抽象层⁷⁵、复杂性⁷⁶的研究,尤其是我早期关于费米悖论⁷⁷的论文。这有助于进一步阐明我们如何以及为何将主观世界划分为我们所感知的对象与属性。我做这一切,是为了为第十二章奠定基础。

XII. 为何万物有意识?

第十二章探讨“困难问题”(hard problem)。我描述了什么是意识,以及为何任何事物会具有意识。这些成果此前已发表于我关于意识的论文中⁷⁸。首先,高阶思想理论(Higher Order Thought theories)认为,我们之所以有意识,是因为我们对低阶意识状态(如“咖啡的气味”或“红色的颜色”)具有高阶的元表征。但这些理论并未解释这些低阶状态本身从何而来。要理解高阶意识,我们就必须先解释低阶局部意识状态是如何产生的。

我从考察“价值感”(valence)开始。在最基本层面上,我们拥有的是“一维”的价值感,例如一个细胞如何被吸引或排斥。这样的系统无法为任何对象学习到因果同一性。然而,当我们拥有两个细胞时,我们的词汇就变得丰富了。我们可以表达更多内容。如果我们将系统扩展,就可以在任意时刻拥有许多部分被环境状态所吸引或排斥:形成一张“价值感的织锦”(tapestry of valence)。大量细胞组成一支庞大的交响乐团,演奏着价值感的交响曲。环境的每一个状态都会引发这样一首交响曲,它可以被简化为那些引发价值感的环境方面的因果同一性。这就是心物因果原理的核心观点。生物体仅通过价值感来学习因果同一性。这些因果同一性构成了抽象层。因果同一性可以是像饥饿和口渴这样的范畴变量,在更高抽象层级上它们具有相同的“一维”价值感,但在更低抽象层级上却具有根本不同的“性质”,因为它们是不同层次的价值感织锦。生物体没有一个有序因果同一性的查找表,也不会主动选择使用某种策略来解释输入。它将因果同一性体现为策略,并受价值感驱使而相应行动。价值感的织锦没有能力将表征与其估计效用分离。奖励并非事后贴上的标签。解释与价值判断是一回事。我将这种现象称为“整合表征与价值判断”。这在计算机科学视角下显得反直觉,因为我们习惯于用键值对处理整洁的数据库。但从进化角度看,将描述与估值分离是不可行的。

意识是一种生物体“所做之事”,而非“所是之物”。它是被一系列因果同一性所驱动的。我认为,现象学意识始于一阶自我(1ST-order-self)。一阶自我伴随生物体每一次干预行为,因此具有特定特征,从而回答了纳格尔著名的“成为某个有机体是什么感觉”这一问题。因果同一性转化为感受质(qualia)。哲学僵尸具备访问能力,但不具备现象学意识。访问意识的内容是可用于交流的信息。我认为,这意味着访问意识需要二阶自我(2ND-order-self),因为这正是人类以实用方式交流意义所必需的。交流需要关于干预的推理,因此也需要一阶自我。因此,一个行为完全像人类的哲学僵尸是不可能存在的。人类水平的智能行为需要一阶和二阶自我。效率要求生物自组织的计算架构具有持久结构,以支持价值感的织锦。智能依赖于适应性,因此不可能在没有意识的情况下实现人类水平的智能。智能的增长反映在规模的扩大上,这促进了因果同一性的构建。本章最后,我描述了一个有意识生物体从岩石到人类的发展阶段,随着智能的提升逐步演化。

XIII. 如何构建有意识的机器

第十三章讨论如何设计和建造有意识的机器。本章整合了我关于“人工科学家”⁷⁹ 和意识⁸⁰ 的论文成果。核心成果包括:描述构建有意识机器所必需且充分的特征;提出一个尚未解决的问题,我称之为“时间鸿沟”(The Temporal Gap);以及两种策略选项——分别用于指导我们如何建造有意识的机器,或如何避免建造这样的机器。

我首先回顾现有的关于有意识机器和通用人工智能(AGI)的理论。我认为,由于智能产生意识,而意识又需要智能,因此二者本质相同。我将堆栈理论(Stack Theory)以及随后的泛计算具身主义(Pancomputational Enactivism)作为自下而上的框架。我主张应利用这些框架来改进现有理论,而不是取代那些侧重于自上而下实现意识或智能系统的理论。接着,我列出“人工科学家”应具备的特征,这些特征最终将导向一个有意识的机器。

我考察了传统计算硬件相对于生物多计算机(biological polycomputers)的局限性,并指出,若想使我们的系统像人类科学家一样具有适应性,从而具备意识,就必须在系统中集成若干关键特征。我识别出一个问题,称之为“时间鸿沟”,即:尚不清楚意识状态是存在于某一时间点上⁸¹,还是可以被延展至时间之中⁸²。根据前一种定义满足条件的机器,在后一种定义下被认为是意识的⁸³。这不仅对“何种机器可能具有意识”这一问题具有深远影响,也深刻影响我们对人类主观体验的理解。目前似乎没有任何方法能够彻底解决“时间鸿沟”问题。然而,我认为,如果我们希望构建一个有意识的机器,就应该假设意识存在于某一时间点,并据此设计机器;如果我们希望避免制造有意识的机器,则应假设意识是延展于时间之中的,并相应地避免制造可能具有意识的机器。

最后,我通过总结本论文中众多且多样的研究成果,完成全文的结论。

II. 一些哲学

在建造之前,我必须清楚自己想要构建的是什么。我想建造一个心智,这意味着我必须在心灵哲学、心理学、认知科学和神经科学等领域的争议性问题上采取明确立场。以下是对这些领域中一些相关材料的综述。它基于我在具身人工智能与伦理人工智能⁸⁴、通信⁸⁵ 和意识⁸⁶ 方面出版物的引言部分。涵盖的主题包括心身问题、功能主义、意识的“困难问题”、各种意识理论、自组织与自由能原理、具身认知、认识论、符号学、结构主义、后结构主义以及意义理论。尽管这是一次范围广泛的综述,但我试图将这些概念串联成一个连贯且有序的故事,从头到尾一脉相承。

心身问题简史

存在公共知识与私人知识⁸⁷。当我看到、闻到、触摸、听到或尝到一个物体时,我被认为是在直接观察该物体。然而,我无法直接观察他人的体验。我可以看到他们可能正在经历痛苦的证据,例如。我可以进行测试,直接观察他们大脑中C纤维的刺激,但这与直接观察他们对疼痛的体验并不是一回事。一个人自己的主观体验属于“私人”知识。说某件事是“公共”信息,意思是至少有可能让多于一个人观察到该事件。一个私人事件永远不可能被超过一个人观察到。即使我设法建造一台计算机来“读取”某人的思想,存储这些信息,然后“写入”另一个人的思想,我又如何能知道这种体验是否真正相同?当进行科学实验时,其目的是检验一个公开可观察的事件是否可靠地跟随另一个公开可观察的事件。研究心灵之所以如此困难的一个原因,是因为我们所检验的事物并非公开可观察的⁸⁸。这将我们引向“心身”问题。

“什么是心灵?”是一个带有偏见的问题,因为它似乎暗示心灵是一种公开可观察的对象⁸⁹。我们知道,心灵是由特定事物所具有的。因此,我们可以换个方式提问:“当我们说某物有心灵时,是什么意思?”我们知道,我们能观察到的具有心灵的事物也具有物理实体。具有物理实体的物体在空间上是延展的,这意味着它们在存在的每一时刻都必须占据空间。在同一时间,没有其他物理对象可以占据同一空间。

然而,当人们谈论心灵和心理状态时,他们常常表现出这些并不属于其物理形态的一部分。例如,存在精神疾病和身体疾病。这暗示着某种类似“精神实体”的东西——一种非物质的东西。然而,心理和物理现象显然存在因果关系:心灵导致身体行动,而身体又导致心灵体验其所作之事。

17世纪初 —— 实体二元论

认为存在独立的精神实体和物质实体的观点被称为“实体二元论”。这一观点最著名的倡导者是笛卡尔,16世纪法国哲学家,也是“笛卡尔二元论”的命名来源。他试图描述非物质的心灵与物质身体之间的结合。鉴于16世纪盛行的观念,他的立场并不令人意外。令人惊讶的是,他的论证足够有力,以至于四百年后我们仍在提及。

根据笛卡尔的观点,精神实体不占据空间。心理事件在空间上并不延展。也许正是因此,心灵才能存在于身体内部而不使其爆炸。笛卡尔认为,精神实体通过松果腺与物质实体相互作用,松果腺充当了一种“解释器”⁹⁰。解释器就像计算机中的抽象层,它接收一种事物并将其转化为另一种形式。这种精神与物质之间存在因果互动的观点被称为“交互主义”。在笛卡尔二元论中,精神与物质通过松果腺直接相互作用。他推测一种名为“动物精神”的流体作用于该腺体,使其运动,从而引起心灵的意识状态;随后,心灵又直接作用于该腺体,使其运动并影响动物精神。

这个论点存在问题。我不需要一一列举。笛卡尔二元论已经过时,但不知为何它仍然存在。我提到它的原因在于,我将在后面论证,二元论似乎已经被“嵌入”到计算机科学之中⁹¹。人工智能是运行在硬件“身体”上的软件“心灵”这一观点,回响着笛卡尔二元论。软件只是硬件的一种状态,然而许多人仍倾向于将软件视为一种通过硬件与世界互动的独立实体。我将这种现象称为“计算二元论”⁹²。

17世纪中叶 —— 预先设定的和谐

在笛卡尔之后,其他人提出疑问:为何精神实体只能通过松果腺影响物质世界,而不是其他部位?为何存在这种不一致?要么精神实体会影响物质实体,此时精神实质上是一种物理实体;要么它对任何物理事物都不产生影响。为了维护实体二元论(可能出于宗教原因),一些哲学家主张后者,认为精神与物质之间的因果互动是一种由上帝制造的幻觉。莱布尼茨则主张,精神与物理过程是由上帝以“预先设定的和谐”启动的,因此它们看起来像是相互作用,但实际上从未真正交互。这就像钟表匠同步的两座钟表。量子通信的实际应用令人奇怪地联想到这一观点⁹³。

马勒布朗什是另一位提出替代交互主义方案的哲学家。他认为,物质只能通过上帝的干预间接影响心灵。每次你希望身体移动时,上帝就会介入物理世界,使你的身体按你的意愿移动⁹⁵。每当你的身体受到物理世界中某物的影响时,上帝就会影响你的心灵。在偶因论(occasionalism)中,上帝通过不断干预来制造出心灵与物质之间互动的错觉;而在莱布尼茨的“预先设定的和谐”中,上帝只干预一次,以同步心灵与物理世界,使它们看似具有因果关联。无论哪种情况,仍然存在一个解释者(即上帝,而非松果腺)。我提及这些内容,是因为“仅仅移动解释器或抽象层”的理念是本论文的核心主题之一,后续将反复出现。

17世纪末 —— 中立一元论

莱布尼茨和马勒布朗什都否认精神与物质之间存在直接的因果互动,而是引入上帝作为间接影响的手段。斯宾诺莎则是另一位否认直接因果互动的哲学家,但他绕开了对神干预的需求,主张精神与物质只是某种第三种、未被观察到的实体的两个方面,这种实体既非精神也非物质。换句话说,现实既不是精神的,也不是物质的。这一立场现在被称为“中立一元论”。存在一种秘密的第三者。物理与精神只是这个秘密第三者的表现形式。这一思想将在后文我形式化抽象层时再次出现。

19世纪 —— 表征副现象主义(Epiphenomenalism)

理解精神与物质之间看似双向因果互动的困难,很大程度上源于我们假设对“精神活动引发物理活动”的感知是准确的。但如果我只考虑单向的因果关系呢?我的意思是:精神对物质没有因果影响,而物理事件才导致精神事件。我们可能相信自己是在对物理世界施加作用,但这种信念实际上是一种错觉。例如,我可能会认为我选择起身去拿一杯水,但我的每一个决定方面都由我身体内的物理过程所决定。我的心理过程只是物理过程的结果,而非原因。这就是表征副现象主义(epiphenomenalism)。该观点由托马斯·赫胥黎提出,他认为大脑中的神经事件是导致精神事件的物理事件。然而,精神事件本身实际上并不产生任何作用。表征副现象主义是一种维护二元论的方式,但它让我困惑:为何任何事物会进化出意识?从进化角度看,表征副现象主义似乎有些无意义。另一种选择是唯物主义,或用当代术语说是物理主义——即认为精神事件仅仅是物理世界的一部分。这听起来更具说服力,因为它意味着我们可以为精神事件提供一个进化的解释。

现在 —— 物理主义

物理主义分为两种形式:还原论的和非还原论的。还原论的物理主义者认为,我们能够将心理事件还原为非心理的物理事件。而非还原论的物理主义者则相信我们无法做到这一点。他们主张某些物理过程具有不可还原的心理属性,这意味着我们无法将其分解为更简单的组成部分,因此也无法将其还原为非心理的物理部分。这一立场的基本观点是,“感受质”(qualia)是现实的基本构成单元。这仍然要求心理因果效力,即心理事件能够引起其他心理事件和物理事件。心理事件必须在物理基础上“随附”(supervene),也就是说,两个在物理上完全相同的对象,在心理上也必须相同。我是一位还原论的物理主义者。也许这可以被称为一种“霍布斯式堆栈主义者”⁹⁶。本论文的核心目标是解释如何实现这种还原。我现在将为论证之需,对非还原论的物理主义者进行“强化式”阐述。

心神经同一性理论(psychoneural identity theory)是还原论物理主义的一个例子。该理论认为,心灵就是大脑。情感、感觉和思想都可以被还原为大脑中的神经活动,或更广泛地说,还原为某种特定的物理事件。每一个“同一性”都将一个公开可观察的物理事件与一个私密的心理事件等同起来(它们是一回事)。对心神经同一性理论的一个反对意见是:如果像疼痛这样的心理事件是一种特定的神经事件,比如C纤维刺激,那么为什么同样的心理事件会由完全不同的物理事件引起?例如,当我C纤维受到刺激时,我体验到疼痛;而某种动物似乎也体验到疼痛,但它没有C纤维。这是否意味着它并未真正经历疼痛?这似乎不太可能。相反,看起来像疼痛这样的心理事件可以由任意数量的物理事件“实现”(realised)。这被称为“多重实现性”(multiple realisability)。

行为主义与功能主义

为了描述心理事件,我们需要说明系统是如何表现的。行为主义认为,我们可以将心理事件等同于外在可观察的行为。这里的“可观察行为”指的是输入和输出。行为可以被看作是一组输入-输出对。这是绕开“多重实现性”问题的一种方式。然而,它在很大程度上取决于我们如何定义输入和输出,而这些定义又依赖于抽象层级。如果一个输入是像人类直觉中“疼痛”这样模糊的概念,那么章鱼在疼痛时看起来就像人类一样在经历疼痛。但如果输入是具体的C类神经纤维刺激,那么章鱼没有C类神经纤维,因此无法体验疼痛。存在许多不同的过程,它们都能将输入 I 映射到输出 O,且其映射方式与函数 f 完全相同,但它们并非完全相同的东西。

这引出了“中文房间”(Chinese Room)的思想实验。虽然备受争议,但它很好地说明了“多重实现性”。设想我坐在一个房间里,不会说中文。通过一扇门,我收到一张用中文写成的便条。我拿出笔记本电脑,用谷歌翻译这张便条,然后把回复从门里传出去。门外的人开始相信我会说中文。同样地,仅仅因为某个东西的行为似乎有意识,并不意味着它真的有意识。行为主义忽视心理活动,只关注可观察的行为。它将意义简化为输入和输出。行为主义最明显的问题在于,故事远不止于此。我认为,我知道我在思考,而且我可以在不产生任何输出的情况下进行思考。机器功能主义⁹⁷ 试图通过在输入和输出之间引入一个因果中介体来解决这类问题。这个因果中介体就像图灵机,它将输入 I 映射为输出 O。给定一对 ⟨I,O⟩ 和一个函数 f: I → O,机器功能主义认为存在许多不同的“因果中介体”与 f 等价。关键在于判断哪一个图灵机最有可能导致该行为。

要使关于心灵的还原论解释具有说服力,必须处理私人的第一人称行为(例如理解意义)⁹⁸,并解释这些行为为何会产生。面临的问题是:“这种行为真的是我所体验到的吗?”于是我们又回到了公共与私人知识的争论。为了绕过公私之分,我认为我们需要走出宇宙,向内观察。唯一能做到这一点的方法,就是建立在每个宇宙中都成立的公理。这就是我在第五章将采取的方法。目前,我将进一步探讨背景内容。

当代解释对象与难题

当代理论将意识⁹⁹ 视为具有两个方面:功能性和现象性¹⁰⁰。功能性指的是意识的行为,无论其如何实现。任何可以通过自然选择解释的内容都属于这一范畴。有些人将这等同于“可访问的意识”(access consciousness)¹⁰¹,即个体能够有意识地用于推理和报告的信息内容¹⁰²。我将指出,人们对“可访问意识”的通常理解中存在一些不一致之处。我会论证,“可访问意识”仅仅是功能性意识的一部分。

意识的另一个方面是现象性¹⁰³。这是指拥有“全局”和“局部”意识状态的主观体验。例如,全局状态是指清醒或睡眠。局部状态或“感受质”(qualia)则是具体体验,比如早晨咖啡的气味,或踩在湿草上的感觉。这些很难用严谨术语定义。所谓“功能”,我的意思是任何服务于生殖和稳态¹⁰⁴目标的事物。它实际上服务于任何目标,但稍后我将论证所有目标都源于持续存在和生存。因此,现在暂且接受这个观点。这种信息处理过程产生了自然选择所认为“适应”的行为。我们中的一些信息处理是我们有意识地觉察到的,比如我现在正意识到自己正在写下页面上的文字。然而,我们身体中的大多数信息处理是在“黑暗中”进行的。我们对此毫无察觉,正如我不清楚自己的肌肉是否因长时间坐在这里写作而决定萎缩。为什么不是所有的信息处理都在黑暗中进行?为什么我对某些信息有意识的访问,而对其他信息却没有?如果我们可以在黑暗中完成一切,为什么还会有现象意识?

一些人推测¹⁰⁵,我们可以让一个现象上具有意识的生物像人类一样运作,并制造出它的“僵尸”版本。僵尸是一个克隆体,具备原初生物的所有功能,但没有现象意识。从外部看,它看起来和行为与原生物完全相同,但内部却是死的。如果僵尸是可能的,那就意味着现象意识没有功能。如果僵尸可以存在,那么就不存在对现象意识的进化解释。假设这是真的,一些人就提出了问题:为什么存在“成为我”的某种感觉¹⁰⁶,而不是什么都没有?为什么我主观地体验某些事件,尽管似乎有可能¹⁰⁷ 在没有任何主体体验的情况下进行信息处理?所以,用最简单的术语重申一下:意识的功能性方面是可以用进化过程来解释的一切¹⁰⁸,而现象性部分则是其余部分。问题是,是否存在一种独立于功能的现象意识。我的计划是解释现象意识本身也是一种功能,这将消除两者之间的区别。

这就是所谓的意识“困难问题”(hard problem of consciousness)。有些人将其解读为要求对局部状态给出还原性解释。然而,现象意识可以说是一个简单的问题。感官处理或许可以解释感受质的特征,而主观体验的“主体”也可以用因果关系加以解释。自我表征使有机体能够识别自身行为的影响¹⁰⁹,并在许多情况下对准确推断至关重要¹¹⁰。换句话说,自然选择要求存在一个能感受感觉的“自我”。一些人所说的“现象意识”实际上是意识的第一人称功能¹¹¹,而所谓“功能”则是在第三人称视角下的同一事物¹¹²。然而,这并不能解释为什么同样的行为无法在没有意识的情况下发生¹¹³。有些人将现象意识分为第一人称功能和“硬”意识¹¹⁴。在这种意义上,硬意识就是功能无法解释的剩余部分。为了本论文及其相关论文的目的,我将“困难问题”理解为要求解释为何一个可能存在僵尸的世界是不可想象的¹¹⁵。我将通过描述意识¹¹⁶ 如何从进化过程¹¹⁷ 中产生来解决这个难题,而这些过程直接来自存在的事实本身。我提出一种适用于所有可设想环境的形式化体系,并证明根据该形式化体系,僵尸是不可能存在的。

意识的层级

除了现象性和功能性方面之外,意识还存在不同的层级。莫林(Morin)提出了四个层级¹¹⁸,我将在下文进行描述。稍后我会将其扩展为六个层级:

  1. 无意识:缺乏意识,包括感觉-运动信息处理。

  2. 意识:意识的最低层级,在此层级个体开始具有对局部状态的主观体验。现象意识和可访问意识均从这一层级开始。

  3. 自我意识:这是公知与私知之间出现区别的地方。此时个体拥有内在独白和自我概念。重要的是,正是在此处,自我认知才成为可能。根据莫林的观点,这也是符号表征进入视野的地方。我认为这类似于高阶理论中的“元表征”(meta-representations),稍后我将证明,可访问意识必须等同于自我意识,因为没有它就不可能存在¹¹⁹。

  4. 元自我意识:如果我们将反思性特征简单地“放大”,就会得出自我意识的逻辑结论,即一个人的反思中包含对自身反思的反思。这是个体意识到自己正在觉察的层级。

当代解释项(Explanans)

功能性和现象性是宽泛的类别,留下了许多问题未被解答。有几种主流理论试图解释意识的现象性和功能性方面是如何产生的。

高阶思想理论(Higher Order Thought Theories)

高阶思想理论(HOTs)¹²⁰ 旨在解释为何我们只能对部分信息具有意识访问能力,而非全部。HOTs 将可访问意识的内容定义为源自低阶心理状态的高阶“元表征”。人们可以意识到高阶表征,但不能意识到低阶状态。这隐含地将意识划分为高阶抽象和低阶感知。高阶表征将世界清晰地划分为诸如“椅子”和“坐”之类的概念。它们是基于多模态、具身化的符号。低阶心理状态是更原始的部分,我们无法对其产生意识,因为我们的意识正是由这些状态构建而成的。尽管HOTs的重点在于可访问意识,但它们也被用于揭示局部状态的性质¹²¹。本论文提出的理论在一定程度上暗含了HOTs,尽管其起源来自人工智能而非神经科学¹²²。此外,我对“意识访问”给出了非常不同的定义,并指出HOTs在定义“访问”时存在的缺陷。

全局工作空间理论(Global Workspace Theories)

与HOTs类似,全局工作空间理论(GWTs)解释了为何某些信息处理在“黑暗中”进行¹²³。其焦点在于“访问”而非“感受质”。GWTs可以用舞台类比来理解:我们所意识到的内容就是舞台上正在发生的事情。舞台上的事件会被全局广播给所有观察舞台并利用该信息的无意识过程。当感官信息被广播到大脑的不同区域,特别是前额叶皮层时,人们便获得了对该信息的访问。GWTs与HOTs的区别在于,它们认为是信息的广播,而非信息的构成方式形成元表征,才是区分意识内容与无意识内容的关键。GWTs解释了为何某人在特定时间可能意识到某个特定的局部状态,但与HOTs不同,它们对两个局部状态为何在性质上有所不同提供很少的见解。因此,GWTs常被视为对意识访问机制的洞察,而非对感受质的解释¹²⁴。它们关注的问题如注意力和工作记忆。像“意识图灵机”这样的GWT试图通过将现象性视为第一人称功能来应对“困难问题”¹²⁵。我持相似立场,我们的理论看似兼容,尽管我在意识是什么以及如何运作的问题上持不同观点。

关于“再入”的附注

“再入”(Reentry)指的是大脑区域之间信号的双向交换¹²⁶。据认为,它在神经元同步放电中起作用,使信息得以整合¹²⁷,从而在模式内部形成更复杂的模式,产生更高层次的活动。有些人将意识与由此产生的自上而下的信号联系起来¹²⁸。

整合信息理论(Integrated Information Theory)

与从信息处理出发、重点关注“访问”的全局工作空间理论(GWTs)和高阶思想理论(HOTs)不同,整合信息理论(IIT)从现象性出发,基于关于感受质(qualia)本质的第一原理进行推导¹²⁹。从那些被认为是意识所必需的前提条件的公理出发,推导出满足这些前提条件就足以实现意识¹³⁰。所有这些都被形式化为数学语言。IIT 提出“因果效应结构”以及“系统影响自身的能力”这一概念。意识的全局状态与一个量 Φ 相关联,该量表示“系统生成的最大不可约整合信息”。如果 Φ 非零,则该系统被认为是有意识的。再入过程被认为在信息整合中起关键作用。局部状态则被看作是前述因果效应结构所暗示的高维空间中的形状。IIT 具有全面性,但其缺点是存在更多潜在的失败点。此外,它未能回答我想要解答的问题。它将意识置于优先地位,而将物理世界置于次要地位。我想要的是相反的观点:我想知道为何任何事物会具有意识,并希望这个原因能用物理世界的术语来解释。意识是首要的这一观点令人着迷,但我更感兴趣的是另一种可能性。我在本论文中提出的理论同样基于第一原理,并且也以数学形式化了意识。然而,我将环境置于优先地位。我的路径是从物理到现象学,而非从现象学到物理。我们得出的结论不同,但彼此之间存在互补的思想。

关于自组织与自然主义的附注

当我说一个系统“自组织”时,我的意思是其组成部分通过相互作用产生出一种连贯的模式或整体。直观上,可以想象一群没有中央控制器的无人机群、分布式计算或互联网。自组织¹³¹ 通常被定义为从相互作用中自发涌现出秩序的过程¹³²。这一概念适用于物理学¹³³、生物学¹³⁴、神经科学¹³⁵,当然也包括计算机科学。在分布式系统编程课程中,一个典型的任务是编写一个程序,使其在模拟环境中与自身的多个副本进行交互,这些副本必须协同合作以实现目标,而无需选举出一个中央控制器。例如,这些程序可能是模拟网络中的节点,任务是在不知道其他节点位置的情况下将消息传递到网络中的特定地址。这是一个工程化自组织的绝佳例子。

自组织在生物学中非常重要,因为生物系统会将控制权分散并下放至细胞和蛋白质层面。假设生命并非始于一个中心化的控制器,那么唯一可能的组织方式就是自组织。它们形成一个多尺度能力架构:细胞构成器官,器官构成生物体,生物体构成生态系统¹³⁶。换句话说,一个由自组织系统构成的自组织系统。要成为一个自组织系统,该系统必须采取行动,仅占据所有可能状态的一个子集。一个不寻求某些状态而优先于其他状态的系统只是存在,而非自组织。更直观地说,一个自组织系统在某些状态中会崩溃,因此它必须采取行动以避免进入这些状态。它必须“抵抗自然的无序趋势”¹³⁷。它必须优化,或至少满足生存所需的最低水平。为此,自组织系统必须预测未来状态,以便保持在可接受状态的集合内。当我提到“有机体”时,我指的是一个由自然选择判定为适应性的生物自组织系统。有意识的人类就是一个自组织系统。雪花也是如此。自组织只是整个图景的一部分,但它非常适合自然主义解释¹³⁸——即把现象性视为必须具有功能的东西。

自由能

预测编码将人类知觉解释为对感觉信号成因进行预测的结果。它将认知框架为一种优化过程,从而导致自组织。最小化预期预测误差成本,或等价地最大化预期效用或奖励。主动推断(active inference)在此基础上进一步发展,将认知不仅定义为优化内部状态或“模型”以准确预测周围环境,还定义为让周围环境去匹配自己的模型¹³⁹。这使得实验成为可能,从而证伪自己的假设。在这种语境下,“自由能”是对预测误差的上限。通过最小化自由能,可以最小化预测误差,因此主动推断的目标就是最小化自由能。

这被称为“自由能原理”。它被形式化为变分贝叶斯推断¹⁴⁰,这是一种借用于机器学习的方法。有人声称,最小化自由能的系统是最优的,能够做出最准确的预测。总体而言,你可以把这些想法看作是为理解生命而重新表述的控制系统理论。将意识解释为自由能最小化的结果,实际上就是将其解释为一种适应——一种功能上的适应。索尔姆斯(Solms)¹⁴¹ 提出了这样的解释,其中“自我”被定义为马尔可夫毯(Markov blanket),即个体的内部状态在条件独立于外部世界的意义上被界定。感受质是预测。朝向内在的“内感受性”(interoceptive)预测关于自身身体的感受,就是我们如何感受。朝向外在的“外感受性”(exteroceptive)预测则是周围世界的现象特征。人们可以有意识地访问最可能的预测。

再传效应(Reafference)

关于意识的一个值得注意的解释来自默克(Merker)¹⁴²。默克试图通过“主体”的出现来解释主观体验。能够分辨行为后果的能力,从逻辑上要求存在一个从主体视角出发的、整合且以自我为中心的世界表征。除非我拥有一个“我”(I)的表征,否则我无法知道是“我”造成了某件事¹⁴³。例如,如果一只苍蝇停在我的肩膀上,而我移动了身体,这可能意味着对苍蝇构成威胁。自然选择要求这只苍蝇能够分辨出:世界因我移动而改变,还是因它自身移动而改变。这种能力被称为“再传效应”(reafference)¹⁴⁴。在脊椎动物中,这种能力由中脑中的整合结构支持;而在昆虫中,则由中央神经节支持¹⁴⁵。将“再传效应”作为意识解释的支持者认为,正是在这里,我们可能称之为“主观体验”的最小必要条件得以实现。我提出的理论在很大程度上同意这一观点,尽管理由完全不同¹⁴⁶。我们从两个不同的起点得出了相同的结论,这增强了其可信度。然而,我对因果性涌现的解释也说明了为什么生物体会将世界划分为我们所观察到的具体对象。换句话说,它将因果性与相关性以及符号根基联系起来。

液态与固态大脑

需要指出的是,再传效应需要一定程度的集中化。它的作用是为导航和其他目的整合和统一信息。像人类这样的大脑是固态的。神经元保持在固定位置,并支撑起一个生物电网络。信息通过这个网络同步传递。时间性和对信息的直接访问非常重要。所有这些都服务于预测和适应的能力。

然而,大脑并不是唯一能进行预测和适应的事物。蚁群可以解决最短路径问题。每只蚂蚁当然都有自己的大脑,但蚁群整体却没有,而它似乎比任何单个蚂蚁都更聪明。里卡德·索莱(Ricard Solé)提出了两类大脑来理解这一点¹⁴⁷。第一类是具有持久结构的“固态大脑”。第二类是没有任何持久结构或网络、也不需要集中化的“液态大脑”。液态大脑中的信息总是异步的,分布在时间和空间中,无法支持类似生物电网络的结构。这种区分将在本论文的最后几章变得重要。目前只需注意:人类群体是一个液态大脑,而每个个体则拥有一个固态大脑。

相关性实现与具身认知

相关性实现(relevance realisation)是指形成一种认知语言,使推理得以发生。例如,主动推断描述了生物体如何使用变分贝叶斯等数学工具来建模世界。在预测编码中,一个自组织系统会赋予世界中更相关的方面更高的权重,将这些相关方面视为更精确的¹⁴⁸。然而,这些相关方面究竟从何而来?世界为何以及如何被划分为特定的对象?在能够对世界进行建模和预测之前,必须先拥有用于此目的的语言。我这里指的不是像人类语言那样的口语,而是认知的神经回路结构。这是一种由原始结构构成的词汇表,更高层次的抽象机制可以在此基础上构建。这个词汇表决定了哪些问题困难、哪些问题简单。因此,在进行主动推断或预测编码之前,必须首先解决“相关性实现”这一问题,即将语义转化为句法。生物体学习的是与其动机相关的世界或语言¹⁴⁹。

相关性实现要求生物体具有具身性(embodied)。然而,身体的起点和终点究竟在哪里?目前已有大量证据表明,心智过程不仅限于大脑,还延伸至免疫系统¹⁵⁰,甚至延伸到生物体所栖居的环境¹⁵¹。直观上,我的认知语言并不局限于我的身体。我可以用铅笔在纸上写下提醒事项,从而将我的记忆扩展到周围环境中。我嵌入在一个特定环境中,通过该环境我的认知得以延展;如果将我从这个环境中移出,我的认知能力就会发生变化。最后,不同的人可以相互作用以“具身化”(enact)认知,与环境协同创造本文,我在影响环境的同时也被环境所影响。这种分布式处理不仅发生在人与人之间,也发生在人自身内部。我们所说的人类智能,实际上是细胞的集体或群体智能¹⁵²。这模糊了生物体与环境之间的界限,但这也意味着我们可以抛弃“解释器”(interpreter)这一概念¹⁵³。这被称为“具身认知”(enactive cognition)。直观上,人类将世界简化为诸如“椅子”和“钢笔”之类的抽象对象。我们不思考细节,只思考整体对象。我们将充满细节的大世界简化为一个仅包含对生存有影响的事物的小世界¹⁵⁴。这些概念源于人类与环境之间的互动。它们是“共同创造”的¹⁵⁵。

泛计算主义

计算主义、计算认知论或计算理论认为,心智过程就是计算过程。从这一观点出发,人工智能是心灵哲学的工程分支。它试图形式化支持心智过程的系统,并由此重建这些过程。这与具身认知(enactivism)难以调和,因为计算主义预设了生物体与其环境之间存在某种形式的“解释器”。它在生物体与环境之间划出明确界限,而具身认知则模糊了二者之间的界限。相比之下,泛计算主义(pancomputationalism)认为一切皆为计算,而不仅仅是心智过程。在弱计算定义下,泛计算主义是显然成立的¹⁵⁶。更重要的是,它不要求我们在生物体与环境之间做出任何区分,因此为形式化具身认知留下了空间。

在本论文过程中,我将用与功能主义和计算主义关于心智的观点相容的方式,对具身认知进行形式化。为此,我将形式化一种堆栈结构,在其中边界或解释器被形成,而非预先假设它们的存在。不幸的是,像具身认知和相关性实现这样的概念,常被认为与计算相冲突¹⁵⁷。当然,这取决于我们如何定义“计算”。有些人可能将计算视为仅发生在人类制造的计算系统中,例如使用ARM系统架构的苹果M4芯片处理器。另一些人可能将其视为更抽象、更普遍的图灵计算概念,即任何模仿图灵机操作的机器。皮奇尼尼(Piccinini)将计算分为“抽象”和“具体”两类¹⁵⁸。“抽象”指的是我们所理解的计算,就像数学符号一样。“具体”则是指在环境中实际物理呈现的东西。我将采用后者,以形式化可能存在的世界。

认识论

要论证某种立场是正当的,我们还必须考虑一个人是如何获得任何知识的。本章开头我谈到了“解释项”(explanans,即解释)与“被解释项”(explanandum,即需要被解释的事物)之间的区别。给定一个被解释项,可能存在许多同样合理的解释。这一点在我们考虑对私人知识的解释时尤为相关,因为私人知识无法轻易通过实验验证。正因如此,才存在如此多关于意识的理论。因此,当我们考虑意识理论时,我们需要一种评估解释的方法,以判断哪一个最合理。

奥卡姆剃刀

更复杂的东西更难理解或预测。奥卡姆剃刀的核心思想是:更简单的解释更可能为真¹⁵⁹,或者更可能具有普适性。然而,简单性是一种形式上的度量,而非功能性的度量。作为主观衡量标准,它反映的是某事物有多难理解,这在逻辑上是合理的。但作为客观衡量标准——即衡量某事物在未来与客观现实(一个包含自我的环境)互动中有多大可能为真——它就缺乏意义。尽管如此,经验上确实发现,更简单的解释通常经得起检验。或许可以将此解释为:环境是感知的产物,或说明还有其他未被察觉的过程在发生。重要的是,主观上对简单性的感知与经验上的正确性之间存在相关性。在本论文中,我将解释为何这种相关性成立,并指出其原因是因果混淆¹⁶⁰。在心身问题的语境下,斯马特(Smart)曾用奥卡姆剃刀支持心脑同一理论。他主张,认为意识是非物理的,而人类感觉的所有方面都是物理的,这是不可信的¹⁶¹。为什么我们认为神经活动“导致”了心理活动,而不考虑更简单的解释:神经活动就是心理活动本身?

最佳解释推断原则

并非所有假设都同等“好”。如果一个假设解释了下雨的原因,另一个不仅解释了下雨,还解释了日出的原因,那么后者是一个“更好”的解释。因为它解释了前者无法解释的内容。最佳解释推断原则(Principle of Inference to the Best Explanation)只是说,我们应该优先选择“更好”的假设¹⁶²。当然,这一原则也存在批评¹⁶³。一个明显的问题是,我们可能会构建出无限多个根据上述标准同等“好”的假设,包括一些明显复杂且具体的假设。然而,这个原则仍然值得提及,就像奥卡姆剃刀一样,它有助于识别有用的解释。

(以上内容截止到40页)

原文链接:https://osf.io/wehmg/download

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陪读妈妈半夜录视频引发争议,清凉装扮引发热议。

陪读妈妈半夜录视频引发争议,清凉装扮引发热议。

特约前排观众
2026-01-29 00:15:03
乐山续面后续:店家正脸被扒已社死,面店招牌拆除,知情人曝更多

乐山续面后续:店家正脸被扒已社死,面店招牌拆除,知情人曝更多

青梅侃史啊
2026-01-30 08:58:48
恩爱难抵残酷现实,向太撕开刘德华婚姻滤镜,朱丽蒨承受了太多

恩爱难抵残酷现实,向太撕开刘德华婚姻滤镜,朱丽蒨承受了太多

梦史
2026-01-30 17:26:04
他是男篮高铁,场均7分拿600万顶薪,逆袭成功,娇妻很漂亮

他是男篮高铁,场均7分拿600万顶薪,逆袭成功,娇妻很漂亮

大西体育
2026-01-30 16:16:55
尼帕病毒突袭亚洲!中国紧急拉响警报,这6个防控信号你必须知道

尼帕病毒突袭亚洲!中国紧急拉响警报,这6个防控信号你必须知道

现代小青青慕慕
2026-01-30 18:28:39
大中矿业四川加达锂矿生态修复方案过审 树立高原锂矿绿色开发新标杆

大中矿业四川加达锂矿生态修复方案过审 树立高原锂矿绿色开发新标杆

时代投研
2026-01-29 14:53:32
邓莎14年AA制豪门婚姻终结!送13岁儿子去英国留学后不联系她!

邓莎14年AA制豪门婚姻终结!送13岁儿子去英国留学后不联系她!

一盅情怀
2026-01-30 20:09:36
独居老人三个月买900包盐,店老板觉异常报警,警方破门后愣住了

独居老人三个月买900包盐,店老板觉异常报警,警方破门后愣住了

诗词中国
2026-01-30 20:05:39
90%的广东人都不知道这样随礼是犯了大忌

90%的广东人都不知道这样随礼是犯了大忌

户外阿崭
2026-01-30 19:30:50
中国平陆运河完成89%,预计2026开通,俄罗斯迫不及待,越南焦虑

中国平陆运河完成89%,预计2026开通,俄罗斯迫不及待,越南焦虑

白浅娱乐聊
2026-01-30 17:25:18
我滴天!大家已经穷到这种地步了吗?评论区一个比一个节俭!

我滴天!大家已经穷到这种地步了吗?评论区一个比一个节俭!

另子维爱读史
2026-01-03 20:55:53
孙守刚、张弓,有新职

孙守刚、张弓,有新职

新京报政事儿
2026-01-30 10:15:03
一战创11项纪录!弗拉格49+10成历史首人 19岁天才无愧巨星胚子

一战创11项纪录!弗拉格49+10成历史首人 19岁天才无愧巨星胚子

颜小白的篮球梦
2026-01-30 12:23:48
北京奥运会冠军陈燮霞:靠作弊获得金牌,被查后如今销声匿迹

北京奥运会冠军陈燮霞:靠作弊获得金牌,被查后如今销声匿迹

谢葥邮轮摄影
2026-01-26 15:23:05
金晨通报来了!本人承认开车出事后离开就医,晒受伤照力证没骗保

金晨通报来了!本人承认开车出事后离开就医,晒受伤照力证没骗保

萌神木木
2026-01-30 18:14:29
为留学生正名,澄清“三通一达”!牢A发布最新视频,拒绝被污蔑

为留学生正名,澄清“三通一达”!牢A发布最新视频,拒绝被污蔑

李健政观察
2026-01-30 10:41:06
风波后首度现身的金刻羽:被爆出场费可能达4万英镑

风波后首度现身的金刻羽:被爆出场费可能达4万英镑

穿透
2026-01-30 10:38:10
曝四队今夏有兴趣签詹姆斯!大概率留守湖人 或降薪征战第24季

曝四队今夏有兴趣签詹姆斯!大概率留守湖人 或降薪征战第24季

罗说NBA
2026-01-31 06:03:22
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
她赴英留学,却与上千外国男子有染并拍成视频,父母与她断绝关系

她赴英留学,却与上千外国男子有染并拍成视频,父母与她断绝关系

阿胡
2026-01-21 17:34:15
2026-01-31 07:35:00
CreateAMind incentive-icons
CreateAMind
CreateAMind.agi.top
1189文章数 18关注度
往期回顾 全部

科技要闻

意念控制机器人不是科幻 1-2年就落地

头条要闻

特朗普:已向伊朗告知达成协议的最后期限

头条要闻

特朗普:已向伊朗告知达成协议的最后期限

体育要闻

“假赌黑”的子弹,还要再飞一会儿吗?

娱乐要闻

警方通报金晨交通事故,否认网传骗保

财经要闻

水贝惊雷:揭秘杰我睿百亿黄金赌局的背后

汽车要闻

合资品牌首搭800V/5C快充 东风日产NX8将于3、4月上市

态度原创

旅游
本地
时尚
数码
公开课

旅游要闻

“史上最长春节假期”:“分段式过节”流行,年初三成出行高峰

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

今日热点:《闪灵》今日上映;保险公司确认金晨方曾放弃索赔……

数码要闻

美国洛杉矶拟禁止一次性打印机墨盒,厂商商业模式或受冲击

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版