2 The Apperception Engine
自我意识引擎
作者相关内容:
2 自我意识引擎
摘要:
本文描述了一项尝试,即将康德的先验心理学重新用作机器学习系统的建筑蓝图。首先,它描述了代理必须满足的条件,以实现经验的统一:直观必须通过二元关系连接,以满足各种统一条件。其次,它展示了在这个模型中范畴是如何被推导出来的:范畴是从纯粹的二元关系中推导出来的纯粹一元谓词。第三,我描述了康德的认知架构是如何被实现在一个计算机系统(自我意识引擎)中的,并详细展示了系统是如何从一连串原始感觉输入中构建统一经验的。
1 引言
本文描述了一项尝试,即将康德的先验心理学重新用作机器学习系统的建筑蓝图。
想象一台机器,配备了传感器,接收感觉信息流。它必须以某种方式理解这感觉数据流。但这究竟涉及什么呢?我们对“理解”感觉数据所涉及的内容有一种直观的理解——但我们能精确地说明这涉及什么吗?这种直观的概念能被形式化吗?
在机器学习中,这被称为无监督学习问题。它既根本重要又令人沮丧地难以明确定义。这个问题与有监督学习问题形成对比,即感觉数据附有标签。在有监督学习问题中,有一个明确的学习目标,有许多强大的技术能非常成功地执行。然而,现实世界并不会给感觉数据附上标签。我们只是接收数据。正如杰弗里·辛顿所说:1
当我们学习看东西时,没有人告诉我们正确答案是什么——我们只是看。偶尔,你的母亲会说“那是一只狗”,但这信息很少。如果你能通过这种方式获得一些信息——即使每秒一位——你就很幸运了。大脑的视觉系统有10¹⁴个神经连接。而你只活10⁹秒。所以每秒学习一位没用。你需要更像每秒10⁵位。而只有一处能获得这么多信息:从输入本身。
在无监督学习中,我们被给予一连串传感器读数,并希望理解这个序列。问题是,我们对“理解”这个词没有一个明确的、可形式化的理解。我们的问题是难以言说。并不是说我们有一个明确定义的、可量化的学习目标,却不知道如何优化这个目标。相反,我们不知道我们真正想要的是什么。
一种方法,即自监督方法,是将感觉序列视为预测问题的输入:给定从时间步骤1到t的感觉数据序列,最大化时间t+1的下一个数据的概率。但我认为“理解”不仅仅是预测未来感觉读数。预测光感受器的未来状态可能只是理解的一部分——但它本身并不足够。
那么,理解感觉序列到底是什么意思呢?在本文中,我主张这个问题的解决方案已经隐藏在众目睽睽之下超过两百年了。在《纯粹理性批判》(康德,1781年)中,康德明确定义了理解一个序列的含义:将该序列重新解释为由在时间上持续存在的、具有随时间变化属性的外部世界对象所组成的表征,这些属性根据一般规律变化。
在本文中,我将康德《纯粹理性批判》的一部分重新解读为一种认知架构的规范,即对理解感觉流所涉及内容的精确、可计算实现的描述。这是一个跨学科项目,因此始终面临两面不讨好的危险:既不忠实于康德的哲学意图,也不能对人工智能研究做出有意义的贡献。康德本人也提供了警告,不要同时进行两种在处理方式上截然不同、或许各自需要特殊才能的工作,而将这两种工作结合在一个人身上只会产生笨拙的人[AK 4:388]
跨学科项目既涉及人工智能又涉及哲学,其危险在于两个潜在的受众群体都不满意。计算机科学家可能会合理地质疑:为什么一本两百年前的书现在还能教会我们什么?如果康德有什么重要的东西要教我们,那早就应该被吸收了。康德学者可能会合理地抱怨:真的有必要用计算形式主义重新表达康德的理论吗?我们不需要这些技术细节来谈论康德。充其量,这是一种不必要的重新阐述。最糟糕的是,当康德的思想被强行塞进简单的计算形式主义时,误解会不断累积。
尽管如此,我将论证,首先,当代人工智能可以从康德那里学到一些东西,其次,当康德的研究用计算机科学的语言重新阐述时,康德学者也能从中获益。
1.1 人工智能可以从康德那里学到什么
目前,神经网络和基于逻辑的学习方法的优缺点是互补的。神经网络对噪声或模糊数据具有鲁棒性,能够吸收和压缩海量数据集中的信息,但它们对数据的需求量大,难以解释,且在训练分布之外的泛化能力较差。相比之下,基于逻辑的学习方法数据效率高,模型可解释性强,且能够在训练分布之外良好泛化,但在处理噪声或模糊数据时表现不佳,难以扩展到大规模数据集。
我们真正希望的是一种结合两者优点的系统,但这说起来容易做起来难。如何将低层次的感知与高层次的概念性思维结合起来呢?康德在《纯粹理性批判》中详细描述了这种混合架构应有的形式。康德试图将经验主义和理性主义这两种当时对立的哲学流派结合起来,而神经网络和基于逻辑的学习方法分别是经验主义和理性主义的现代继承者。康德的统一架构尝试结合两者的优点,为人工智能中神经网络与逻辑方法的结合提供了理论基础。
1.2 康德解释可以从人工智能中受益
近年来,哲学领域中一些最令人兴奋且雄心勃勃的工作(如布拉顿、塞尔拉斯等)试图用分析哲学的语言重新阐述康德(以及后康德)哲学。这种重新阐述并非仅仅是表面功夫,也不是用最新的术语包装旧思想,而是试图通过一种为清晰和精确而设计的半形式化语言,达到一个新的明晰层次。
本文的目标是通过将康德的理论重新诠释为一种计算架构的规范,进一步提升其精确性。为什么要选择这种特定的描述层次?这样做能有什么收获?计算层面的描述是精确描述的终极层次。没有比这更精确的了:即使是计算机也能理解计算机程序。计算机迫使我们澄清自己的想法,不容许模糊或含糊其词。任何含糊不清的地方都会导致编译错误,而未兑现的承诺则会被退回。
用计算术语重新阐述康德的理论,可以为我们提供一个新的具体性层次。但这种尝试也存在风险:在努力将康德的理论强行塞入某种可实现的系统时,可能会扭曲他的原始思想,使其变得面目全非。这种不幸的后果是否真的发生了,还需由读者自行判断。
1.3 康德的认知架构
《纯粹理性批判》的前半部分是一项持续的先验心理学研究:探讨如果一个主体要获得经验,必须执行哪些过程。对康德来说,这种先验心理学在很大程度上是一种手段——或者更准确地说,是实现两个目标的手段。他的一个高级目标是形而上学的:一劳永逸地列举出认知的纯粹方面——无论接收到何种感觉输入,这些认知特征都必须具备。认知的纯粹方面包括纯粹直观的形式(在《纯粹理性批判》的“先验感性论”中描述的空间和时间)、纯粹概念(在“概念分析论”中描述的范畴)以及纯粹判断(在“原理”中描述的先天综合命题)。他的另一个高级目标是元哲学的:划定理性的界限,并通过表明纯粹概念只能应用于可能的经验对象,最终平息各种无休止的争论。
但我认为,除了作为实现其形而上学和元哲学目标的手段之外,康德独特的心理学本身具有独立的兴趣,可以被视为一种认知架构的规范。根据康德的规范,理解感觉序列涉及构建一个符号因果理论,该理论能够解释感觉序列并满足一组统一性条件。根据我们的解释,理解感觉输入是一种程序合成,但它是无监督的程序合成,受到约束以实现自我意识的综合统一。为了验证这一假设,我们需要将这种架构实现在计算机程序中,并在广泛的实例中进行测试。康德的理论旨在成为一种关于实现经验所涉及内容的一般理论,因此——如果它真的有效——它应该适用于任何感觉输入。为了验证这种架构的可行性,我们需要真正实现它,并在一个庞大且多样化的实验中进行评估。
我们对康德认知架构的计算机实现被称为“自我意识引擎”。由于康德的统一性约束提供了强烈的归纳偏差,我们的系统能够从极少量的数据中生成可解释的、人类可读的因果理论。我们在多种实验中测试了这一系统,并发现它在理解未标记的感觉输入方面显示出潜力。
在本文中,我将首先(第2节)从《纯粹理性批判》的前半部分提取一些核心论点,并将它们组装成一种认知架构的规范。接下来(第3节),我将描述“自我意识引擎”在一些实例中的表现。我会详细展示一个具体示例。最后(第4节),我将讨论所做出的各种解释性决策,并对替代方案进行辩护。使计算实现具有挑战性的一个原因是,它迫使人们选择康德理论的某种具体解释,因为计算机对模糊性或模棱两可完全无法容忍。
2 实现经验
在《纯粹理性批判》的前半部分,康德关注以下基本问题:
如果主体要获得经验,必须执行哪些活动?
请注意,这是一个关于意向性的问题——而不是关于知识的问题。康德的问题与标准的认识论问题截然不同:
给定一个信念,主体还必须具备什么条件,我们才能将这个信念视为知识?
康德的问题是前认识论的:他并不假设主体已经拥有一个信念。相反,他将信念视为一种不能被想当然地接受,而必须被解释的成就:
“理解属于一切经验及其可能性,而它首先要做的是,不是使对象的表征变得清晰,而是使对象的表征本身成为可能” [A199, B244-5]。
康德追问的是主体要拥有任何可能的认知(无论真假)必须满足的条件[A158, B197]。请注意,这并非一个关于人类偶然使用的心理过程的经验心理学问题,而是一个先验心理学的问题:一个系统——任何物理实现的系统——为了获得经验,必须做什么?
在本文中,我将尝试提炼康德对这一根本问题的回答,并将其重新解释为一种认知架构的规范。
2.1 通过统一直观来实现经验
先验演绎的一个核心主张是:
(1) 为了实现经验,我必须统一我的直观。[A110]
在我们能够评估这一主张的真实性之前,我们首先需要理解它的含义。(i) 康德所说的“经验”是什么意思?(ii) 直观是什么?(iii) 统一直观意味着什么?我将依次探讨这些问题。
2.1.1 康德所说的“经验”是什么意思?
康德对“经验”(“Erfahrung”)的理解与我们通常使用这一术语的方式非常接近。我将列举一些康德使用这一术语时所涉及的特征。首先,经验是日常的。它不是一种人们偶尔才能达到的不寻常的高峰状态,比如启蒙或狂喜。相反,它是大多数人在清醒时大多数时间所拥有的状态[^A110^]。其次,经验是统一的。在任何时刻,我都在经历一次经验[^A110^]。我不能同时拥有多种经验。我可能意识到多种刺激,但它们都是同一次经验的一部分。第三,经验是有条理的(Stephenson, 2013)。它不是一种单纯的“喧嚣混乱”(James et al., 1890)。相反,经验由具有不同属性的独立对象组成。第四,经验不是(仅仅)概念性的。它不仅仅是信念的集合。可以预见的是,经验是直觉和概念的统一组合。第五,经验不一定是真实的。它声称准确地代表世界,但可能失败(Longuenesse, 1998; Stephenson, 2013; Waxman, 2014)。
经验不是我们应该想当然地接受的东西。相反,经验是一种成就。当我睁开眼睛时,我看到各种具有不同属性且随时间变化的对象。但这种经验是一种复杂的成就,只有在无数底层过程完全按应有的方式运行时才会发生。康德先验心理学的核心贡献在于详细描述实现经验所需的底层过程。
2.1.2 康德所说的“直观”是什么意思?
直观(“Anschauung”)是对一个特定对象的表征(例如,这件特定的毛衣),或者是对一个特定对象在特定时间的特定属性的表征(例如,这件特定毛衣在这一刻的特定污渍程度)。
直观是由感性能力产生的[^A19/B33^]:感性是一种接受感觉输入的能力。感性为主体提供了一系列直观[^B68^],而心灵需要对这些直观进行理解。
直观是个人独有的。我的直观与你的直观不同。这不仅是因为我们不共享直观,而是因为我们无法共享直观,因为它们本质上是私人的。为了理解这一点,考虑行动与其对象之间的四种可能关系:
1. 对象在行动之前和之后都存在(例如,踢足球)。
2. 对象在行动之前存在,但在行动之后不存在(例如,销毁证据)。
3. 对象在行动之后存在,但在行动之前不存在(例如,制作蛋糕)。
4. 对象在行动之前和之后都不存在,而只在行动过程中存在,因为对象只是行动的一个方面。
让我们关注第四种情况。当我用手在空中画一个圆时,这个东西——圆——只在活动持续期间存在,因为它只是活动的一个方面。或者考虑“他声音中的轻蔑”:这个东西,这种轻蔑,只在他说话的持续时间内存在,因为它只是说话的一个方面。
按照我对康德的理解,直观的对象是一种(第4种)对象:它只作为行为的一部分存在,因为它只是行为的一个方面。
但为了在空间中认识某物,例如一条线,我必须将它画出来[B137]。因为直观是一种私人的心理行为(没有其他主体能够执行完全相同的同一行为),并且因为直观的对象是一种(第4种)对象,它只作为行为的一个方面而存在,所以直观的对象继承了它所属的直观行为的私人性。没有人能够拥有我的特定直观对象,因为这个对象是我的直观活动的一个方面,而没有人能够执行这一特定的活动。
直观与概念不同。直观是对一个特定对象的表征,而概念是一种一般性的表征,许多直观都归属于它[^B377^]。对康德来说,直观和概念是两种完全不同的表征类型。尽管经验主义者将概念视为一种以一般性方式使用的特殊直观,而理性主义者将直观视为一种具有最大特异性的特殊概念,但康德认为直观和概念是完全独立的、独特的表征类型。他认为直观和概念完全不同的理由是:(i) 它们来自不同的能力(分别是感性和知性);(ii) 虽然直观是个人独有的,但概念可以在个体之间共享;(iii) 虽然直观是直接指向对象的(特定对象只作为直观活动的一个方面而存在,就像圆只作为在空中画圆的行为的一个方面而存在),但概念只是通过直观间接地与对象相关[A68/B93, B377]。
在康德的先验心理学中,直观占据着独特的位置:它是所有思维的最终目标,所有认知所追求的最终目的。思维的其他方面(例如概念和判断)之所以需要,仅仅是因为它们有助于统一直观。
无论一种认知以何种方式、通过何种手段与对象相关,那使它能够直接与对象相关的东西,以及作为手段的所有思维所指向的最终目标,就是直观
[A19/B33,重点为我所加]。
2.1.3 康德所说的“统一直观”是什么意思?
回顾康德的关键主张:
(1) 为了实现经验,我必须统一直观[A110]。
在这里,需要解释的是一个心理状态(经验),而解释的手段是一个过程(统一直观的过程)。但这个过程到底涉及什么,我们又如何知道它何时完成?
统一直观的过程可以被理解为一种特定的综合过程,它需要满足一个特定的约束条件——统一性约束[^B130^]。我将首先讨论综合过程的一般性,然后转向统一性约束。综合活动可能看起来令人困惑,甚至定义模糊:
“‘结合在一起’和‘连接’这类表达的不足之处显而易见,无需多言。感知并不会像传送带上的部件一样在心灵中依次经过,等待被挑选出来并组装成最终产品。不存在一个忙碌的自我可以将感官体验的片段拼凑在一起,将一种颜色与一种硬度连接起来,并将它们平衡在一个形状之上。”[Wolff, 1963, p. 126]
那么,统一直观到底是什么意思?是什么将直观连接在一起?按照我对康德的理解,唯一能够将直观连接在一起的是二元关系。综合直观意味着使用二元关系将直观连接起来,使得最终形成的无向图完全连通。综合过程是由生产性想象力完成的[A78/B103; A188/B230],相关内容将在第2.2节中讨论,并在第2.4节中形式化。
但统一直观远不止是通过二元关系将它们连接起来那么简单。要使一个连通的二元图被视为统一直观,必须满足康德的统一性条件。虽然可以通过二元关系将直观连接起来形成连通图的方式有很多,但其中只有很小一部分能够满足康德所施加的各种统一性条件。这些统一性条件由知性能力来满足[A79/B104],并在第2.3.1节、2.3.2节、2.3.3节和2.3.4节中详细描述。
因此,第二个主张进一步阐释了统一直观的含义:
2.1.4 主张1的地位
因此,主张(1)是说,只有当主体能够通过将直观连接成一个满足各种(尚未具体说明的)统一性条件的关系图时,它才能获得经验——即对一个统一且有条理的世界的日常意识经验。
我们可以将其拆解为两个主张:
(1a) 为了获得经验,我的直观必须被统一。
(1b) 为了使我的直观被统一,我必须亲自将它们统一。
主张(1a)可以有两种不同强度的解释。一种较强的解释将该主张视为定义性的:经验就是统一的直观。一种较弱的解释则将该主张视为仅仅是必要条件:经验需要统一的直观,但它还需要更多其他条件。在本项目中,我采用较强的解释,并且有理由认为康德也支持这种较强的解释。
第二个主张(1b)并非完全显而易见。一种替代的可能性是,我的直观通过感性能力呈现时已经处于统一状态。但康德明确排除了这种替代方案。因此,如果我的直观并非已经统一,而我又不能让别人替我统一它们,那么我就必须亲自将它们统一起来。这是一个只有我才能完成的任务。
2.2 综合
在本节中,我将描述想象力用来连接直观的关系[A78/B103]。
当康德谈到纯粹综合[A78/B104]时,他指的是通过适用于所有情境下所有直观的纯粹关系来连接直观。康德为什么坚持综合只能使用纯粹关系来连接直观呢?因为统一性条件(将在第2.3.1节、2.3.2节和2.3.4节中描述)是必须适用于每一种可能的直观综合的条件。如果统一性条件要适用于每一种可能的综合,那么它们只能引用出现在每一种可能综合中的关系,而这些关系就是纯粹关系。
有三种操作可以将直观结合在一起:
包含:in(X, Y) 表示对象X(当前)在对象Y之中(例如,包裹在厨房里);
比较:X
内在:det(X, Y) 表示属性Y(当前)属于对象X(例如,这种特定的重量(2.3公斤)是这个特定包裹的属性)。
当两个直观通过这三种操作之一结合在一起时,其结果是一个规定(determination)。因此,在(a, b)中,a < b和det(a, b)都是规定。规定在特定的时刻或某些时刻成立;它们不会无限期地持续[A183-4, B227]。
规定的构成要素是直观,即对个体的表征;这些可以是特定的对象,或者是这些对象的特定属性。持有det(a, b)意味着将特定属性b归属于特定对象a(例如,将这种特定的污渍归属于这件特定的毛衣)。
我认为,对于理解康德的架构来说,清晰地区分属性和概念是绝对必要的。属性是一种直观,表征了特定对象在特定时刻的存在方式。相比之下,概念是一般性的表征。许多不同的属性通常归属于同一个概念。例如,这件特定毛衣的特定污渍和这台特定笔记本电脑的特定污渍,这两个属性都归属于“脏”这一概念,但它们仍然是不同的属性:这件毛衣的特定污渍在无数细微之处与我的笔记本电脑的污渍不同。
(翻译并不准确,准确理解请参考原文)
正如属性与概念是不同类型的表征一样,规定determination与判断也是不同类型的思维。看到这件特定毛衣在这一刻的特定污渍(一个规定)与相信这件毛衣是脏的(一个判断)是非常不同的。在前者中,我注意到一个个体对象的个体属性;在后者中,我将一个代表个体对象(这件特定毛衣)的概念归摄于一个一般概念(“脏”)之下。
规定determination不是判断,而是一种感知方式:我看到婴儿在婴儿床里(包含);我感觉到杯子比勺子重(比较);我听到话语中的轻蔑(内在)。在每种情况下,感知动词的宾语是一个名词短语,而不是一个宾语从句[Sellars, 1978]。
由于规定determination是一种感知方式,因此它没有真值:
“因为真理和幻觉并不在被直观的对象中,而是在关于它的判断中,只要它是被思考的。因此,正确地说,感官不会出错;但这并不是因为它们总是做出正确的判断,而是因为它们根本不做出判断。因此,真理和错误,以及导致后者的幻觉,只存在于判断中,即只存在于对象与我们知性之间的关系中……在感官中根本不存在判断,无论是真实的还是虚假的。”[A293-4/B350] 亦可参见
[Jäsche Logic 9:53]。
除了将直觉联系在一起的三种纯粹运算之外,还有三种纯粹关系将规定联系在一起:
继起:succ
表示 P1 在下一个时间步被 P2 所继起。
同时性:sim 表示 P1 与 P2 同时发生。
不相容性:inc 表示 P1 和 P2 是不相容的。
当两个规定通过这三种关系之一被联系在一起时,结果就是一个联结。例如,succ(in(a, b), in(a, c)) 表示 a 在 b 中的状态被 a 在 c 中的状态所继起,而 inc(det(a, b), det(a, c)) 表示将 b 归属于 a 与将 c 归属于 a 是不相容的。
2.2.1 这组特定操作和关系的合理性
为什么是这些特定的纯关系?是什么使这份特定的清单如此特殊?
这份清单的合理性在于,这三种纯操作和三种纯关系共同构成了一个最小的二元运算符集合,它们足以构建空间和时间的形式[A145/B184ff]。
根据康德的说法,直观和判断并不会附带空间和时间坐标[B129]。感性的任务仅仅是为我们提供直观,而不是将它们安排在客观的空间/时间中。综合的功能,即想象力的工作,是利用上述描述的纯操作和关系将直观连接起来,从而构建客观的时空形式:
由于时间本身无法被感知,对象在时间中的存在只能通过它们在一般时间中的组合,因而只能通过先天的连接概念来确定。
[A176/B219]
要理解感性并没有为我们提供已经定位在空间和时间中的直观对象,可以考虑一个带有摄像头的机器人,它为每个视觉快照提供一个二维像素阵列。机器人接收关于每个像素在以自我为中心的二维空间中的位置信息,但它必须确定对象在三维空间中的位置。假设一个黄色像素在红色像素的左边。黄色像素是否代表一个位于红色像素所代表对象前面或后面的物体?视觉输入并没有提供这些信息——机器人必须自己做出判断。接下来,考虑时间。假设机器人在它的摄像头巡视一座大房子的不同部分时接收到一系列视觉印象[^B162^]。这些主观上连续的印象是否算作客观时间中的一刻的不同表现,还是它们代表客观时间中的不同时刻?感觉输入在主观空间/时间中是有顺序的,但在客观空间/时间中却没有。为了将我们的直观放置在客观的空间/时间中,想象力需要利用上述描述的纯关系将它们连接起来。
这三种纯操作与三种纯关系共同构成了一个最小的集合,足以生成客观空间/时间的形式。包含操作(“在……中”)使我们能够将直观组合成一个空间场(一种抽象了维度数量的最小空间表现形式[Waxman, 2014])[A162/B203ff]。比较操作(“小于”)使我们能够比较两个不同的属性;如果我们生成两个可比较属性之间的中间属性,我们就可以在两个观察到的时刻之间生成一个中间时刻,从而填充时间[A165/B208ff],进而构建时间[^A145/B184^]。归属操作使我们能够将不同的属性归属于不同时间的对象。同时性和连续性关系使我们能够在时间中对判断进行排序。最后,不相容关系使我们能够检验一组判断是否可以共存。
从所有这些内容中,我们可以看到,每个范畴的图式都包含并使……得以表现:在量的图式中,时间本身的生成(综合),即在对一个对象的连续感知中;在质的图式中,感知(感觉)与时间表现的综合,或者说是时间的填充;在关系的图式中,感知之间的相互关系与所有时间的关系(即,按照时间确定的规则);最后,在模态及其范畴的图式中,时间本身作为对象是否以及如何属于时间的确定的相关物。因此,图式无非是按照规则的先天时间确定,这些规则按照范畴的顺序,涉及时间序列、时间的内容、时间的顺序,以及最后关于所有可能对象的全部时间 。
[A145/B184ff]
2.3 统一条件
到目前为止,我已经描述了如何通过各种纯二元关系将直观连接在一起。然而,综合统一远不止是直观的简单连接,它包含更多内容。在这一节中,我将描述康德所提出的四种统一条件。
2.3.1 数学关系综合的统一条件
康德将纯粹关系分为两组:数学关系(包含和比较)和动力学关系(内禀性、继起、同时性和不相容性)。数学关系控制着同质元素的任意综合,而动力学关系则控制着异质元素的必然综合[B201n]。
康德指出,数学关系结合的是“不一定属于彼此”的事物,而动力学关系结合的是“必然属于彼此”的事物[^B201n^]。这意味着,主体在使用包含和比较进行综合时,可以自由地进行,而不受知性概念领域的约束,但使用动力学范畴进行综合时,则受到知性产生的判断的约束。
我将先从数学关系的统一条件开始,然后再讨论动力学关系的统一条件。数学关系的基本统一条件是,直观被结合在一个完全连通的图中。还有两个更具体的条件,一个针对包含,一个针对比较。
包含的统一条件要求存在某个对象,即最大容器,它在所有时间包含所有对象[A25/B39]。更正式地说,数学关系综合的第一个统一条件是:
当然,对象可以在容器之间移动,但从每一个时刻来看,这些对象都必须始终包含在最大容器中。满足这一统一条件意味着假定既有纯粹的对象(具有部分论结构的空间区域),也有不纯粹的对象(现象),这些现象存在于空间区域中。
一旦对象被放置在包含的层级结构中,一旦我们知道了哪些直观属于哪些概念,那么我们就拥有了计数所需的所有信息。为了计算盒子里有多少支笔,我需要能够判断每个对象是否属于“笔”这一概念,同时我也需要能够判断哪些对象实际上在盒子里,哪些在外面。因此,正如康德所说,量的纯粹图式是“数,数是一种表示,它总结了一个(同质的)单位依次加到另一个单位的过程”[^A142/B182^]。现象是同质的,因为它们属于同一个概念,而我们通过选择包含层级中的一个特定容器来决定哪些现象需要计数,哪些可以忽略。
现在,这种包含的层级结构是任何空间表象的必要方面:如果我们固定了三维空间中对象的位置和延伸,那么包含的层级结构也就固定了。然而,当然,反面并不成立:指定包含的层级结构并不能决定所有空间信息。例如,假设x和y都在容器z中。我们知道x和y在同一个容器中,但我们不知道x是在y的上方还是下方。我们也不知道x和y之间的距离有多近,等等。
包含的层级结构是空间世界的独特子结构。如果我们从我们的空间表象中抽象掉所有与我们人类的直观形式有关的特殊方面,剩下的就只有包含的层级结构。正如康德所说:
因此,例如,当我通过把握其多样性,将对一所房子的感性直观转化为感知时,我的基础是空间和外感性直观一般所具有的必然统一性,我仿佛按照空间中多样性的这种综合统一性来描绘它的形状。然而,如果我抽象掉空间的形式,这种综合统一性则存在于知性之中,它是关于在直观中一般对同质的综合的范畴,即量的范畴,因此,把握的综合,即感知,必须与之完全一致。[B162]
再次强调:
外感官的所有量(quantorum)的纯粹图像是空间……然而,量(quantitatis)的纯粹图式,作为一种知性概念,是数。
[A142/B182]
当然,空间表象具有许多功能。例如,它使我们能够定位和调整身体各部分的方向,以便操纵其他对象。但在《纯粹理性批判》中被突出强调的空间功能是空间作为统一现象的媒介。作为统一直观的空间,其本质属性比作为人类外感官形式的空间要少。作为直观的统一者,空间的关键属性是它支持一个包含层级结构,我们可以通过它判断哪些对象在哪些容器中。康德在《纯粹理性批判》的“先验感性论”中首次引入空间时,明确指出他所关注的空间功能是其支持包含层级结构的能力:
因为,为了使某些感觉与我之外的某物(即与我所在空间位置之外的某个空间位置中的某物)相关联,从而使我能够将它们表象为彼此之外的存在,从而不仅仅是作为不同的存在,而是作为处于不同位置的存在,空间的表象必须已经是它们的基础。
[A23/B38]
作为统一者的空间,仅仅是现象能够被放在一起的媒介,是使我能够从“我在直观着x”和“我在直观着y”推导出“我在直观着x和y”的媒介。这种抽象的统一空间就是包含层级结构:“空间是对共存(并置)的表象”[A374]。
总结来说,尽管康德的空间概念是当时的标准欧几里得几何的三维空间([B41]),但当他思考空间作为统一现象的媒介时,他关注的是一个许多空间特征已被抽象掉的子结构:包含层级结构。
比较的统一条件仅仅要求:
当然,我们并不坚持认为“<”是一个全序关系:尽管这件毛衣的脏污程度可以与这个杯子的脏污程度进行比较,但这件毛衣的重量不一定能够与这个杯子的脏污程度进行比较。
我们也并不坚持认为“<”是密集的。这是因为我们遵循康德的观点,希望允许有限模型的存在。
2.3.2 动力学关系综合的统一条件
我在上面已经描述了数学关系(包含和比较)综合的统一条件。接下来,我们转向康德对动力学关系(内禀性、继起、同时性和不相容性)综合所施加的条件。这或许是先验分析中最重要的、最具原创性且最困难的部分。事实上,康德在B版中重写先验演绎的一个主要原因正是为了尽可能清晰地重新表达这一条件。在本节中,我将首先解释康德的一般策略,然后再深入探讨他如何处理每一种纯粹动力学关系的具体细节。
康德对A版中先验演绎的表述并不满意。在B版中,他通过将证明分为两部分(分别在第20节和第26节结束)显著改变了阐述方式。先验演绎的第一部分,以第20节为高潮,大量依赖于在B版第13节中新增的对范畴的新解释:
我将仅在此之前对范畴进行解释。它们是关于一个对象一般的概念,通过这些概念,其直观被认为是在判断的逻辑功能之一方面被确定的。因此,范畴判断的功能是主词与宾词之间的关系,例如,“所有物体都是可分割的。”然而,就知性的纯粹逻辑使用而言,这两个概念中哪一个被赋予主词的功能,哪一个被赋予宾词的功能仍然不确定。因为人们也可以说:“某种可分割的东西是物体。”然而,通过实体范畴,如果我把物体的概念置于其下,那么就确定了其经验直观在经验中必须始终被视为主词,而不能仅仅是宾词;其他所有范畴也是如此。[B128-9]
康德在许多其他地方也提出了类似的主张。这里的主张到底是什么,康德又是如何确切地证明它的呢?
想象一下有人试图将他的直观连接起来。假设他患有“直观阅读障碍”——他不确定这个直观是对象,而另一个直观是属性,还是反过来。或者他有两个处于继起关系中的规定,但他不确定哪一个在先,哪一个在后。直观在他眼前漂浮不定。他需要某种东西来确定哪些直观被赋予哪些角色,但什么能够履行这一功能呢?康德的基本主张是,只有判断才能固定直观的位置。而且,这不仅仅是判断的众多角色之一——这是判断的首要角色:
判断无非是将给定的认识引向意识的客观统一的方式。 [B141]
更具体地说,直观在一种规定中的相对位置只能通过形成一种判断来固定,这种判断必然要求这种特定的定位。这种判断包含直观所归属的概念,而直观在规定中的位置则是通过这些概念在判断中的位置间接确定的。康德指出:
同一功能使判断中的不同表象获得统一,也使直观中不同表象的单纯综合获得统一。因此,正是通过知性及其分析统一将逻辑形式引入概念的同一行动,知性也通过直观中杂多的综合统一,为表象带来了先验内容。
在更复杂的判断层面,这种说法也适用:规定在一种联系中的相对位置只能通过形成一种复合判断来固定,这种复合判断本身包含两个判断作为组成部分,从而必然要求这种特定的定位。这种复合判断包含两个组成部分——判断,规定归属于这两个判断,而规定在联系中的位置则是通过这些判断在复合判断中的位置间接确定的。
康德为这一主张提供了怎样的理由呢?他的论证大致如下:动力学关系的目标是将直观和规定在客观时空秩序中排列。而我们只有通过对组合施加必然性,才能实现客观性。然而,想象力完全无法施加这种必然性。想象力所能做的仅仅是利用纯关系将直观连接起来,而无法对这些连接施加必然性。实际上,唯一能够提供这种必然性的要素就是判断。因此,动力学关系在客观时空中的排列只能通过判断间接实现,判断为这些连接提供了所需的必然性。
从不同认知能力的角度来看,判断能力负责构建判断,而判断力(即判断的权力)则负责构建归摄,决定哪些直观归属于哪些概念。
这就是适用于所有动力学关系的一般主张。接下来,我将描述支持各种动力学关系(如内禀性、继起性、同时性和不相容性)所需的判断形式。
内禀性必须由范畴判断来支持。动力学统一的第一个条件是,直观在内禀性规定中的位置必须由相应的判断来支持。
例如,假设我正在看到这件特定毛衣的特定脏污程度。这种内禀性规定是两个纯粹特殊事物的结合:
这种特定的毛衣和这种特定的脏污实例。现在,在正确看到这种内禀性时,至关重要的是,这种特定的脏污是属性,而这件特定的毛衣是属性内禀于其中的对象。如果脏污的直观是对象,而毛衣的直观是属性,情况就会大不相同。
康德的基本主张是,只有因为我形成了某种相应的范畴判断,我才能够固定内禀性算子det的两个参数的位置[B128-9]。在这个例子中,假设我形成了判断“有些毛衣是脏的”。现在,我对这件特定毛衣的直观属于概念“毛衣”,而我对这种特定脏污(在这一刻的这件特定毛衣上的)的直观属于概念“脏”。因此,我能够通过判断和归属关系间接地固定内禀性算子的两个参数的位置。我是通过相应的判断看到直观在内禀性中的位置的。
当然,我不需要使用那个精确的判断“有些毛衣是脏的”来固定内禀性规定中直观的位置。我可以使用“有些毛衣是令人反感的”,或者“这件毛衣是脏的”,等等。所需要的只是一个范畴判断,其中两个直观分别属于两个概念。
继承必须由因果判断来支持。动力学统一的第二个条件是,每一种规定的继起都必须由因果判断来支持:
例如,假设我看到这件毛衣从干净变为脏污。在看到这种继起时,至关重要的是我必须正确地看到顺序。看到干净之后是脏污,与看到脏污之后是干净,是截然不同的。
康德声称,只有因为我形成了某种相应的因果判断,我才能够固定继起关系中两个规定的顺序[A189/B232]。例如,假设我形成了这样的因果规则:如果我在泥泞中打滚,那么我的衣服就会从干净变为脏污。现在,我对这件毛衣的直观属于概念“衣服”,我对这种特定的干净的直观属于概念“干净”,而我对这种特定的脏污的直观属于概念“脏污”。因此,我能够通过因果判断和归属关系间接地固定继起关系中两个规定的顺序。
同时性必须由一对因果判断来支持。动力学统一的第三个条件是,每一种规定的同时性都必须由一对因果判断来支持。
例如,假设我同时有两个规定,一个涉及太阳,另一个涉及月亮。由于同时性是一种对称关系,这两个规定在“sim”关系中的位置并不重要。然而,我们是将这对规定归为同时性还是继起性,却是很重要的。当我们面对规定的一种主观继起时,我们应该将它们归于客观时间的同一时刻,还是归于客观时间的两个连续时刻呢?
康德在这里的主张是,为了选择同时性而非继起性,我们需要形成一对判断,描述两个对象的属性如何因果依赖于对方的属性[^A212/B259^]。我不深入讨论这一原则,因为它最具争议性,难以理解,并且在我们的计算机实现中并未涉及。
不相容性必须由析取判断来支持。康德在《公设》中一直讨论的是对象的可能性,而不是句子为真的可能性。很容易将这视为一种范畴错误,或者是一种省略:也许“对象是可能的”是“对象存在是可能的”的简写?这种诱惑必须抵制。康德将可能性/现实性/必然性既归属于规定,也归属于判断。当我们用“inc”连接词连接两个规定时,我们是在两个元素、两种看待方式之间建立一种模态联系,而这些元素本身并没有真值。
康德声称,每一种规定之间的不相容性都必须始终由析取判断来支持:
假设,例如,我把这件毛衣的干净看作与毛衣的脏污不相容。再次强调,这是一种对规定性(或“规定方式”)之间的不相容,而不是判断之间的不相容。但康德声称,这种规定性之间的不相容必须由一种排他性析取判断来支持。假设,例如,我已经形成了这样一种判断,即每件衣物要么是干净的,要么是脏的。那么,我对这种特定的干净的直观就属于“干净”这一概念,我对这种特定的脏污的直观就属于“脏”这一概念,而我对这件特定毛衣的直观则属于“衣物”这一概念。因此,这种排他性析取判断(表达概念之间的不相容)为规定性之间的不相容关系提供了正当性。
2.3.3 使概念具有感性
除了要求规定性由判断所支撑的统一性条件外,还有另一方向的统一性条件,要求判断由相应规定性所支撑。
因此,使心灵的概念具有感性(即在直观中为它们添加一个对象)与使直观具有可理解性(即把它们置于概念之下)一样必要。[A51/B75]
这里的要求是,判断不能脱离其基础的直观而“漂浮不定”。相反,每个判断都必须由一个相应规定性所支持。
更具体地说(并且仅限于一元谓词):
人们可能会认为,鉴于主体是从直观和规定性出发,并通过形成判断来使它们变得可理解,这一条件似乎很容易得到满足。但事实并非总是如此:有时主体会构造新的虚构对象,以解释感性材料,并将属性赋予这些虚构对象。在这种情况下,条件(7)要求,除了将对象o归入概念P之外,还必须有一个相应的特定个体属性a属于o。
2.3.4 概念的统一性
除了上述的综合统一性之外,康德还要求概念通过判断被联结在一起而实现统一。我将首先考虑这种约束的较弱形式,然后再描述一个更强的版本。
判断将不同的概念联结在一起。例如,判断“有些物体是可分割的”将“物体”和“可分割的”这两个概念联结在一起。假设两个概念是“在一起”的,如果它们共同出现在某个判断中。定义“在一起*”为“在一起”的传递闭包。现在,概念统一性的较弱约束是:每一对概念都是“在一起*”的。
康德使用了一个显著更强的约束。他的要求是,概念不仅被联结,而且被联结成一个属种层级结构。为了使概念在这一意义上形成一个系统,我们专注于排他性析取判断形式[A70/B95]。
考虑一个形式为“每一个X要么(排他性地)是P,要么是Q”的判断。这不仅仅是说P和Q是排他的;它还表明P和Q构成一个整体:一个共同捕捉X的全部概念。通过将概念置于排他性析取判断形式之下,我们将它们带入一个具有属种结构的层级共同体。
概念统一性的条件要求:
2.4 总结
现在是时候进行总结了。对于康德来说,基本的心理表象是直观,即对个别元素的表象(例如某个特定对象或某个特定对象的特定属性)。其他所有类型的表象都只是为了将直观统一成一个连贯的整体。
直观可以通过包含、比较和内禀这三种纯粹操作结合成规定性(见第2.2节)。此外,规定性可以通过先后、同时和不相容这些纯粹关系结合成联系。
为了使规定性的联系达到统一,必须满足多个条件。数学操作(包含和比较)必须形成适当类型的结构(第2.3.1节),动态功能(内禀、先后、同时和不相容)必须由适当类型的判断来支撑(第2.3.2节),判断必须由适当类型的规定性来支撑(第2.3.3节),判断中使用的概念必须形成自身的统一(第2.3.4节)。
为什么是这些特定的统一条件呢?康德哲学的奇妙之处之一在于它的系统性。康德并不满足于仅仅列举知性概念,而是坚持展示这些概念如何形成一个系统,即展示这些是且仅是理解经验所需要的先天概念。同样的系统性要求也适用于统一条件:他必须证明这些是且仅是使直观的综合达到客观性所需要的统一条件。要看到上述统一条件构成了一个系统,可以观察到有两个认知领域:感性直观和概念。这两个领域之间恰好有四种可能的条件:(i)要求直观自身达到个体统一;(ii)要求直观领域尊重概念领域;(iii)要求概念领域尊重直观领域;(iv)要求概念领域自身达到个体统一。在这里,(i)是要求综合把握形成一个满足5(a)和5(b)的完全连通图(第2.3.1节)。条件(ii)是要求直观之间的联系由相应判断来支撑(第2.3.2节)。条件(iii)是要求判断尊重直观(第2.3.3节)。最后的条件(iv)是要求判断领域达到概念统一(第2.3.4节)。
如果我们的主体完成了所有这些事情,并满足了所有这些条件,那么它就实现了经验:它将众多的感官输入结合成一个单一世界的连贯表象。实现经验需要四种能力:感性(接受直观)、想象力(使用纯粹关系将直观连接起来)、判断能力(生成判断)和判断力(决定直观是否属于某个概念)。根据我们的解释,直观是由感性形成的,完全独立于知性。此外,直观可以通过想象力(通过第2.2节的纯粹关系)连接起来,而无需知性。但直观只有在被置于概念之下(通过判断力)并将概念结合成判断(通过判断能力)时,才能构成经验:经验需要知性与感性和想象力协同工作,将连接起来的直观统一起来。因此,感性和知性需要彼此合作才能共同实现经验。
以下是核心观点,为了便于查阅,汇总如下:
1. 为了实现经验,我必须统一我的直观。
2. 统一直观意味着使用二元关系将它们结合起来,形成一个连通图,以满足各种统一条件。
3. 综合包括:(i)通过包含、比较和内禀操作将直观连接起来,形成规定性;(ii)通过先后、同时和不相容关系将规定性连接起来。
4. 康德总共提出了四种统一条件:(i)数学关系综合的统一条件;(ii)动态关系综合的统一条件;(iii)判断由规定性支撑的要求;(iv)概念统一条件。
5. 数学关系综合的统一条件是:
(a)存在某个直观x,使得对于每个直观对象y,在每个时间点上,y和x之间都有一条由规定性构成的链。
(b)比较操作符 <形成一个严格偏序。< pan>
6. 动态关系综合的统一条件是:
(a)如果我形成一个内禀规定性,将一个特定属性a归属于一个特定对象o,那么我必须承诺一个判断“这个/一些/所有X是P”,其中o属于X,a属于P。
(b)如果我形成一个先后关系,其中一个规定性(比如,特定对象o具有特定属性a)被另一个规定性(比如,o具有不相容属性b)所跟随,那么我必须已经形成了一个条件判断:“如果ϕ(X)成立且X是P,那么X在下一个时间步变为Q”,其中对象o属于概念X,属性a属于概念P,属性b属于概念Q,ϕ(X)是一个包含自由变量X的句子。
(c)如果我形成一个同时关系,其中一个规定性(比如,特定对象o1具有特定属性a)与另一个规定性(比如,对象o2具有属性b)同时存在,那么必须有一对因果判断,其中一个表明o1的属性因果依赖于o2的属性,另一个表明o2的属性因果依赖于o1的属性。
(d)如果我形成一个不相容关系,其中一个规定性(比如,特定对象o具有属性a)与另一个(比如,特定对象o具有属性b)不相容,那么我必须已经形成了一个判断“所有X要么(排他性析取)是P,要么是Q,或者……”,其中o属于X,a属于P,b属于Q。
7. 要求概念领域尊重直观的条件是:如果我形成一个判断,将概念P归属于特定对象X,那么必须有一个相应的内禀规定性,将特定属性a归属于特定对象o,其中o属于X,a属于P。
8. 概念统一的统一条件是:每个概念都必须出现在某个析取判断中。
在本节中,我将形式化实现先验统觉的综合统一的任务。引入的形式化是推导以下范畴所必需的。
2.5 实现综合统一
设I为直观的集合,D为规定性的集合,C为联系的集合。包含、比较和内禀这三种纯粹操作的符号是:
心灵从感性接收到的输入是来自D的一系列个别规定性。请注意,输入并不是一个已经被假定为同时的若干规定性集合的序列,而是一个个别规定性的序列。康德坚持这一点:
> 对于现象的多样性的把握总是连续的。部分的表象是相互继起的。它们是否也在对象中继起,这是第二个需要反思的问题,而它并不包含在第一个问题中……因此,例如,对于我面前的一座房子的现象的多样性,其把握是连续的。现在的问题是,这座房子的多样性本身是否也是连续的,这当然没有人会承认。[A189/B234ff]
在这里,康德要求我们想象一个主体在近距离观察一座大房子。它的视野无法一次性将整座房子纳入其中,因此它的焦点从房子的一个部分转移到另一个部分。它的视觉印象序列是连续的,但还有一个进一步的问题:一对(主观上)连续的视觉印象是否代表房子在客观时间的同一时刻,还是代表两个连续的客观时刻。
给定一个由直观集合I使用三种纯粹操作(包含、比较和内禀)构建的个别规定性序列(d₁, ..., dₜ),理解感官输入的任务是构建一个综合统一——一个满足各种条件的元组(J, D, κ, υ, θ),其中:
- J是一个直观的集合,它必须包含I,但也包括由生产性想象力构建的新直观。
- D是一个规定性集合,它必须包含d₁, ..., dₜ,但也包括由生产性想象力构建的新规定性。
- κ ⊆ C是规定性之间的联系集合。
- υ ⊆ I × P₁是直观与一元谓词P₁之间的“属于”关系(也称为归类),以及直观对与二元谓词P₂之间的关系,等等。
- θ是一组判断。
联系κ是由想象力能力生成的。需要注意的是,并非κ中的所有规定性都来自原始序列(d₁, ..., dₜ)。其中一些规定性可能涉及由纯粹直观(针对空间和时间)或想象力(针对假设的未被感知的经验对象)构建的新虚构对象。联系必须满足以下条件:
- 对于J中的每一对直观,D中存在一条规定性链将它们连接起来。
- 如果dᵢ, dᵢ₊₁是(d₁, ..., dₜ)中连续的规定性,那么sim(dᵢ, dᵢ₊₁)或succ(dᵢ, dᵢ₊₁)必须在κ中。
- 规定性是完全连接的:D中的每一个规定性都通过某条无向边路径与另一个规定性κ-连接。
虽然“属于”关系υ是由判断力生成的,但理论θ是由判断能力生成的判断集合。定义判断的形式语言Datalog⁻在(Evans等,2021b)中有详细描述,但简而言之:判断可以是规则或约束。规则可以是箭头规则α₁ ^ ... ^ αₙ → α₀(表明如果α₁, ..., αₙ都成立,那么α₀在同一时间步也成立),或者是因果规则α₁ ^ ... ^ αₙ ⇒ α₀(表明如果α₁, ..., αₙ都成立,那么α₀在下一个时间步成立)。约束可以是排他性析取判断α₁ ⊕ ... ⊕ αₙ(表明αᵢ中恰好有一个成立),或者是一个唯一性约束∀X, ∃!Y, r(X, Y)(表明对于每一个X,都恰好有一个Y使得r(X, Y)成立)。
图2.2展示了根据两种交叉区分对四种能力的两种不同分组方式。根据一种区分,感性和想象力都属于感性,因为这两种能力都处理直观。根据另一种区分,感性属于受动性,因为它是一种纯粹的被动能力,仅仅接收所给予的内容。其他三种能力则属于自发性,因为主体可以自由构建任何它想要的东西,只要最终的构建满足各种统一条件。
我们现在已经收集了定义综合统一任务所需的材料。
2.6 范畴的推导
纯粹范畴的问题在《图型论》的开头几段中得到了解释:
在所有将对象归入概念的行为中,前者的表象必须与后者同质,也就是说,概念必须包含要被归入其中的对象所代表的内容,因为这就是“一个对象被包含在概念之下”这一表述的含义……然而,与经验的(甚至一般而言感性的)直观相比,知性概念是完全异质的,而且永远不会出现在任何直观中。那么,如何可能将后者归入前者,从而使范畴应用于现象呢?因为没有人会说,范畴,例如因果性,也可以通过感官被直观到,并且包含在现象中呢?[A137/B176 ff]
对于经验概念,一个对象被归入一个概念可以通过对象所具有的某个特定属性来解释,该属性属于该概念。见图2.3(a)。例如,假设我对这件特定毛衣的直观被归入“脏”这一概念。这种归入可以通过(i)直观的对象作为一个规定性具有一个特定的直观属性(我对这件特定毛衣在这一特定时刻的特定脏污的表象),以及(ii)这个直观属性属于“脏”这一概念来解释。对于像单一性、实在性、实体性等纯粹概念,问题在于不存在对应的直观属性,因此图2.3(a)中的归入解释不适用。那么,是什么使我们能够将直观的对象归入纯粹概念呢?
根据康德的说法,使我能够将一个对象归入纯粹概念的是对象所绑定的一个纯粹关系的存在。见图2.3(b)。在这里,对象被归入纯粹概念的解释是(i)直观的对象绑定于纯粹关系,以及(ii)纯粹概念可以从纯粹关系中推导出来。请注意,在图2.3(a)和(b)中,都存在一个中介来解释对象被归入概念,但在两种情况下中介的性质是不同的:
现在很清楚,必须存在一个第三者,它一方面与范畴同质,另一方面与现象同质,并且使前者能够应用于后者。这种中介表象必须是纯粹的(没有任何经验性的东西),一方面具有理智性,另一方面又具有感性。这种表象就是先验图型。 [A138/B177]
“先验图式”只是我所称的纯粹关系的另一种说法:in、<、det、succ、sim 和 inc。
因此,这就是康德解释纯概念(范畴)如何适用于直观对象的论证概要。下一步是详细展示每个纯概念是如何从相应的纯关系中推导出来的。这个推导过程很直接,因此康德认为没有必要详细阐述 [B128-9]。但为了尽可能清晰,我们将逐一分析。
从“关系”这一标题开始,如果存在直观 Y 使得 det(X, Y) 成为 κ 中的一个规定,那么直观 X 属于纯概念“实体”。同样,如果存在直观 Y 使得 det(Y, X) 成为 κ 中的一个规定,那么 X 属于纯概念“偶性”。
如果存在规定 d′ 使得 succ(d, d′) 属于 κ,那么规定 d 属于纯概念“原因” [A144/B183]。同样,如果存在规定 d′ 使得 succ(d′, d) 属于 κ,那么 d 属于纯概念“依赖”。
如果对于 D 中的每个 d 和 d′,sim(d, d′) 属于 κ,那么规定集合 D 属于纯概念“共同体” [A144/B183-4]。
接下来是“模态”这一标题:如果存在某个传感器读数序列,以及某个能够解释这些读数的理论 θ,使得 D 包含在 θ 的轨迹状态中,那么规定集合 D 属于纯概念“可能” [A144/B184]。
如果 D 包含在最能解释接收到的传感器读数的最佳理论轨迹状态中,那么 D 属于纯概念“现实”。
如果 D 包含在能够解释所有可能传感器序列的最佳理论的每个轨迹状态中,那么 D 属于纯概念“必然”。
最后是“质”这一标题:如果存在直观 Y 使得 Y < X,那么直观 X 属于纯概念“实在” [A168/B209]。
同样,如果不存在直观 Y 使得 Y < X,那么 X 属于纯概念“否定”。
因此,关于“权利根据”的问题(A84/B116)得到了回答。然而,需要注意的是,我被允许将纯粹概念应用于直观的对象是有条件的,即基于我的活动——尝试获得经验。因此,康德得出结论:范畴只被允许应用于经验的对象。
康德坚持认为范畴不是与生俱来的。纯粹的一元概念并不是以原始的一元谓词的形式“嵌入”在思想的语言中。唯一“嵌入”的是基本能力(感性、想象力、判断力以及判断的能力)以及第2.2节中的纯粹关系。范畴本身是后天获得的——它们是从具体的纯粹关系中推导出来的,当我们试图理解一个特定的感官序列时。但它们是最初被发现的,因为它们总是可以从任何感官序列中推导出来。因此,纯粹概念不是与生俱来的,而是最初被发现的(朗格内斯,1998)
3 实验
上述描述的认知架构已在感知引擎(APPERCEPTION ENGINE)中实现。该计算机系统在(Evans et al., 2021b)和(Evans et al., 2021a)中有详细描述。在本节中,我将详细描述一个实验。
3.1 感官输入
在本实验中,有两个光传感器,能够记录不同强度的信号。如果我们定期读取这两个传感器的信号,就会得到图2.4。其中,上一行显示了传感器读数的人类可读离散版本,揭示了一个简单的规律性模式。下一行显示了同一模式的模糊版本,每个传感器读数都被加入了随机噪声。正是这个模糊版本在本实验中被使用。然而,图2.4(b)中展示的感官输入,是传感器读数已经被分配到特定时间点之后的结果。在康德的理论中,这种时间分配并不是系统直接获得的,而是一个艰难的成就。在康德的理论中,感官输入以一系列单独的感官读数的形式呈现,而主体需要决定如何将不同的读数组合成客观时间的瞬间。因此,康德意义上的主体的实际输入如图2.5所示。在这里,主体被给予一系列单独的感官读数,并必须选择如何将它们组合成一系列同时性的读数。虽然图2.5展示了主观时间中的单独读数序列,但图2.6展示了将原始序列解析为瞬间的多种不同方式。图2.6的下一行展示了正确解析图2.5中序列的方式;这种正确的解析对应于图2.4(b)。
因此,输入是图2.5中展示的序列。在我们的实现中,连续的传感器读数首先被离散化为二进制向量。总序列(d1, ..., d50)是一个包含50个属性判断的列表。需要注意的是,读数并不是简单地在a和b之间交替。有时会有多个连续的a或b。主观序列记录了主体正在关注的项目序列(他一次只能关注一种感觉),主体可以在主观时间的任何时刻关注任何一个传感器。鉴于这个主观时间中的序列,我们必须通过使用同时性和连续性的关系将判断连接起来,以重建客观时间的瞬间。
3.2 模型
给定感官序列后,主体必须构建一种解释,以使序列变得有意义。这种解释包括:
1. 直观的综合。这包含一组判断(必须包括原始感官序列,但也可能包括涉及其他虚构直观的判断),通过纯粹关系sim(同时性)、succ(连续性)和inc(包含性)连接在一起。
2. 一组归摄。这是一组将对个别对象的直观映射到一般概念的映射。这种映射通过一个二进制神经网络实现。
3. 一组将概念连接在一起的判断。
我将依次介绍每一部分。
3.2.1 直观的综合
给定的序列(d1, ..., d50)是主观时间中的一系列单独判断。我们需要生成一个客观时间中的判断集合序列。对于每一对连续的判断dt和dt+1,它们可以是同时的,也可以是连续的。
在我们的例子中,这一选择规则给出了2⁴⁹种可能性。一旦提供了sim和succ关系,这将决定判断在客观时间中的位置。
3.2.2 归摄的集合
归摄将一个直观(一个二进制向量)映射到一个概念(符号)。我们通过一个由布尔权重参数化的二进制神经网络来实现判断力。
神经网络的输入是一个二进制向量,输出是一个长度为|P|的二进制向量(其中|P|是单元谓词的数量)。神经网络实现了一个多标签分类器,将二进制向量映射到2|P|。
3.2.3 判断的集合
康德的知性能力被实现为一个程序合成系统,它以感官信息流为输入,并生成一个理论(一组判断),该理论既解释了感官信息流,又满足各种统一性条件。具体细节可参见(Evans et al., 2021b)。
3.2.4 补充未被感知的细节
康德要求判断应由判断来支持,这一要求通过为每个谓词p添加一条选择规则来实现,该规则表明,如果对象X在时间T满足谓词p,那么在时间T会有一个特定的属性Attr被归属于X(其中Attr属于p)。
3.2.5 寻找最佳模型
当上述三个子系统(想象力、判断力和知性)被实现在一个系统中时,会找到许多不同的解释。为了在各种解释之间做出选择,我们使用以下偏好:
1. 在其他条件相同的情况下,我们更倾向于较短的理论,而不是较长的理论。
2. 我们更倾向于更具区分性的神经网络,这些网络将更少的直观归类到同一个概念中。
关于如何权衡和比较这两个期望目标的数学细节,可参见(Evans et al., 2021a)。
3.3 结果
感知引擎(APPERCEPTION ENGINE)找到的解释由一个元组(J, D, κ, υ, θ)组成,包括直观的综合、归摄的集合以及判断的集合。我们将依次考虑每一部分。
直观的综合κ。当面对图2.5中的感官序列时,引擎使用sim(同时性)、succ(连续性)和inc(包含性)这些纯粹关系生成一组连接κ。以下是一个摘录:
在这里,判断是包含三个元素的三元组:一个属性(一个长度为3的二进制向量,表示一种特定的灰色阴影)、一个对象(这里为a或b),以及一个主观时间中的索引(从1到15)。需要这个索引是为了确保在不同时间点共享相同对象和属性的两个判断仍然被视为不同的判断。
图2.7展示了如何通过连续性(succ)和同时性(sim)关系从主观时间中产生客观时间。
从属关系υ。感知引擎(APPERCEPTION ENGINE)构造了两个一元谓词p和q,并将二进制向量归摄到它们之下。二进制神经网络实现了一个多标签分类器,将二进制向量映射到{p, q}的子集。引擎生成的从属关系υ为:
图2.8展示了引擎生成的归摄关系。注意引入了一个虚构的对象c,它并不属于感官输入的部分。
判断的集合θ。除了直观的综合和归摄的集合之外,感知引擎(APPERCEPTION ENGINE)还生成了一个理论θ,其中包含一组判断,用以解释系统的动态行为。对于图2.5所描述的问题,生成的理论是θ = (ϕ, I, R, C),其中ϕ是一个类型签名,I是一组初始条件,R是一组条件句,C是一组约束条件。类型签名ϕ由类型T、对象O和谓词P组成,其中:
在这里,传感器a和b是作为感官输入的一部分给出的,但c是一个虚构的对象,由想象力构造而成。虚构的对象s1、s2和s3是空间的三个部分,由纯粹的直观构造而成。这三个空间都是空间整体sw的部分。
一元谓词p和q用于区分传感器的开启和关闭状态。in关系将传感器放置在空间中,而in²关系将空间放置在空间整体内。r关系用于定义一个具有环绕性质的一维空间。75注意,我们对“空间统一性”的要求相当最低限度:我们只是坚持存在某种包含结构将直观连接在一起。空间构造具有我们习惯的特定三维结构并不是本质的。只要直观被统一起来,任何空间结构都可以,如第3章所述。就康德关于直观的形式和形式直观的区分而言[B160n],r关系描述了直观的形式(对象之间的关系),而特定的空间代表形式直观。
需要注意的是,感官的给定对象(传感器a和b)并不是直接相互关联的。相反,它们是通过空间对象以及in和r关系间接关联的。
规则描述了一元属性p和q随时间的变化。第一条规则表明,在某一时间步满足q的对象将在下一个时间步满足p。第二条规则描述了q属性如何从一个传感器移动到其右侧的邻近传感器。
约束条件是为满足概念统一性(第2.3.4节)而构建的。第一条约束坚持每个传感器要么是p,要么是q,但不能同时是两者。第二条约束要求每个传感器必须恰好包含在一个空间区域内。
补充未被感知的细节。为了使概念具有可感性(第2.3.3节),引擎必须确保每个判断都有一个对应的判断。特别是,涉及虚构的未被感知对象c的判断必须由相应的判断来支持。这意味着在每个时间步中,如果p(c)(或q(c))为真,那么必须有一个属性判断det(c, α),将特定的属性α归属于c,其中c属于p(或q)。
满足这一条件意味着要在每个客观时间点想象归属于c的特定属性。满足这一条件的一组判断如图2.9所示。
因此,未被感知的对象c不仅仅被归摄到一个谓词之下,还参与了一个判断。尽管c是一个主体从未感知到的外部对象,但它被认知为满足特定的感知判断。我相信,这就是康德启发下的观点“感知是一种受控的幻觉”(Clark, 2013)背后的真相。
注意,第2.3.3节中的要求(7)坚持对象c必须参与某个判断,但当然并不坚持任何特定的判断。想象力可以自由地构造任何它喜欢的判断。
讨论。图2.10展示了整个实验,从原始输入到完整的输出,包括直观的综合、归摄的集合和一组判断。看到感知引擎能够从连续的嘈杂输入中识别出一个离散的可理解结构,令人欣慰。它从模糊的感官输入开始,在所有噪声中感知到一个涉及两个离散一元谓词p和q的底层系统,并设计了一个简单的理论来解释p和q如何随时间变化。
让我们停下来检查一下图2.10中的解释是否满足实现综合统一所需的各种条件(第2.4节):
- 判断通过连续性(succ)、同时性(sim)和包含性(inc)的关系连接在一起,形成了一个完全连接的图,如第2.2节所要求的那样。
- 第2.3.1节中的包含条件5(a)由图2.10中的初始条件I满足。在这里,sw是包含所有其他对象的空间整体,无论是直接还是间接包含。
- 在这个特定的例子中不需要 <关系。空关系显然满足条件5(b),即<是一个严格的部分序。< pan>
- 第2.3.1节中的要求6(a),即每个属性判断都由一个判断支持,由理论θ和归摄关系υ共同满足。例如,考虑给定序列中的第一个判断:det(a, [1, 0, 0]),将二进制向量[1, 0, 0](表示一种特定的灰色阴影)归属于对象a。根据υ,[1, 0, 0]对应于p,由于a是一个传感器类型的对象,这个判断由判断∃X:sensor, p(X)支持。
3.4 感知辨识与概念区分
将图2.10的解释与图2.11的替代性退化解释进行比较。两种解释都满足了统一性条件,但它们的满足方式截然不同。图2.10能够区分输入——将它们划分为两个类别,p和q——并构建了一个理论来解释p和q属性如何随时间相互作用。相比之下,图2.11未能区分输入向量之间的任何差异。由于图2.11更为粗糙且缺乏区分性,将所有输入向量都映射到p,而没有一个映射到q,因此它可以采用一个更简单的理论:如果一切始终是p,而从未是q,那么我们就不需要一个复杂的理论来解释对象如何在p和q之间转换。
在我们对康德综合统一理论的解读中,这种现象是普遍存在的。为了能够区分感官输入之间的细微差别,我们必须提供一个支持这种区别的理论,一个解释我们所区分的各种属性如何相互作用的理论。细微的感知辨别需要一个有条理的理论(一组概念和判断)来支撑感性层面上所做出的区分。直观无概念则盲。
有一种反复出现的神话认为,人类已经从一种前概念的恩典状态堕落了(Jaynes, 2000)。在某个神话般的早期,人类还没有被我们现在视为理所当然的概念工具所束缚,而且——正是因为没有被概念和判断所负担——他们能够以一种我们现代人只能梦寐以求的细腻生动性去感知世界的全部辉煌。就好像意识是一个有限的总量;因为我们现代的概念使用者在经验的概念方面浪费了一些意识,所以剩下用于感性方面的意识就变少了。相比之下,神话中的早期人类能够将他的全部意识都用于感性层面。因此,对他来说,在他的前概念恩典状态下,颜色更加鲜艳。
如果康德是对的,那么这种神话完全搞错了方向。意识并不是感性与知性之间的一种零和博弈,其中一方的收益必然意味着另一方的损失。相反,感性层面上的感知辨别需要来自知性的概念辨别。我们能够构建的理论越复杂,我们就能看得越清晰。
4 讨论
4.1 刻板性与自发性
有一种流行的康德形象,将他描绘成一个受规则束缚的自动机器,他的日常生活安排得如此紧密,以至于你可以用它来校准你的时钟。根据这种流行的形象,康德的哲学(无论是实践的还是理论的)和他不同寻常的平凡个人生活一样,都是刻板和受规则束缚的。
这种严重歪曲的描述中最不公平的是,它忽略了这样一个关键事实:对于康德来说,我所受的规则是我自己制定的。自发性和自我立法是康德哲学的核心,无论是实践哲学还是理论哲学。在他的实践哲学中,我可以自由地构建任何准则——只要它们满足范畴命令的普遍化条件。在他的理论哲学中,我可以自由地构建任何规则——只要它们满足统一性条件。当面对原始感官输入的流时,康德意义上的主体构建了一组直观之间的联系、一组将直观映射到概念的归摄,以及一组连接概念的判断。主体完全可以自由地构建任何一组直观之间的联系、任何一组归摄以及任何一组判断——只要整套内容共同满足统一性条件(第2.3.1节、第2.3.2节和第2.3.4节)。这些统一性条件并不是康德出于某种个人清教徒式偏好而坚持的不必要的额外要求——它们是实现构建者是你本人这一目标所绝对必需的最小条件。根据康德的观点,将感官输入解释为一个单一世界的连贯表象所需的条件,与感知那个世界的自我存在所需的条件是完全相同的。
与流行形象不同,康德对心灵的构想是一种非凡的自由。我不断地构建我随后将执行的程序。这种自发构建的唯一约束是必须有一个单一的自我在向外观察。在我们的计算机实现中,这种自发性以一种特定的方式表现出来:当被给予一个感官序列时,感知引擎会构建一个不断复杂化的解释序列,每个解释都满足康德的统一性条件。引擎必须以某种方式决定选择这些解释中的哪一个。
4.2 刻板性与历时性
维特根斯坦有时被解释为否认任何基于规则的认知理论的可能性。在《哲学研究》(Wittgenstein, 2009)中,维特根斯坦一次又一次地提醒我们关注规则失效的情况:
> 我说“那里有一把椅子”。如果我走过去打算搬它,而它突然从视野中消失了呢?——“所以那不是一把椅子,而是一种幻觉”。——但过了一会儿,我们又看到了它,并且能够触摸它,等等。——“所以椅子终究是在那里的,而它的消失只是一种幻觉”。——但如果过了一段时间它又消失了——或者看起来消失了呢?我们现在该说些什么?你是否为这种情形准备了规则——规则规定是否可以使用“椅子”这个词来涵盖这类事物?但我们是否在使用“椅子”这个词时忽略了这些规则?并且我们是否应该说,由于我们没有为这个词的每一种可能的用法都配备规则,所以我们并没有真正赋予它任何意义?(《哲学研究》,§80)
我们识别椅子的规则无法预见每一种情况,包括它们的持续出现和消失——但这并不意味着我们不能识别椅子。或者,再举另一个著名的例子,我们有关于地球上不同地方时间的规则。但现在假设有人说:
太阳上正好是下午5点。 (《哲学研究》,§351)
同样,我们确定时间的规则无法涵盖所有应用,有时会失效。这些规则并不包括我们将一天中的时间应用于太阳的情况。由于任何一组规则不可避免地是有限的和局部的,我们必须不断地即兴发挥并更新规则。
这一观点非常重要且正确,但与康德对认知主体的构想完全兼容。这样的主体不断地构建一套新的规则,以最好地解释其感官扰动。并不是说它构建了一套规则,一劳永逸,然后永远僵化且不假思索地应用它们。相反,规则的构建是一个持续不断的努力。
康德描述了一个持续构建和应用规则的过程,以理解感官刺激的洪流:
除了这种努力,或者说是朝向判断的倾向,不断地被肯定,又不断地在“现象的混乱”中面临瓦解的威胁之外,没有自我意识的统一,或“先验统觉的统一”。
(朗格内斯,1998,第394页)。
康德的统觉主体不断地构建规则,以便最好地理解感官刺激的洪流。如果他停止构建这些规则,他将不再是一个认知主体,而仅仅是一台机器。
在《什么是启蒙?》(康德,1784)中,康德强调认知主体永远不应满足于一套静态定义的规则,而必须始终修改现有规则并构建新规则。他强调,坚持任何一套静态定义的规则是一种自我奴役:
教条和公式,这些理性使用的机械工具,或者说是对其自然禀赋的误用,是永恒少数派的枷锁和锁链。
后来,他用“机器”一词来描述一个不再对其规则集开放修改的认知主体。他将启蒙定义为始终愿意对新规则集和改进后的规则集保持开放。他想象如果我们决定固定一套特定的规则,并禁止对该规则集进行任何未来的修改或补充,会发生什么。他认为这将对社会和自我本身都是灾难性的。
维特根斯坦的一些观点常常被解释为否认任何形式的基于规则的认知理论的可能性:
我们很容易想象人们在一个田野里通过玩球来娱乐自己,以开始各种现有的游戏,但玩了许多游戏却没有完成它们,期间还毫无目的地将球扔向空中,互相追逐带着球,或者互相投掷球以开玩笑,等等。然后有人说:整个时间里,他们都在玩一场球类游戏,并且每一次投掷都遵循明确的规则。 (《哲学研究》§83)
现在这里有一个关键的范围歧义。维特根斯坦是否仅仅是否认有一套规则能够在每一个时刻捕捉到玩球的行为?还是他提出了一个更强的主张,声称在玩球的过程中,有一些时刻是无法被任何一套规则所捕捉的?我相信较弱的主张更具说服力:我们通过应用规则来理解世界,但随着我们随着时间的推移,我们需要不断修改我们的规则。维特根斯坦的论述实际上继续如下:
难道没有这样的情况吗,我们在玩球的同时制定规则?甚至还有这样的情况,我们在玩球的过程中不断改变规则。
在这里,他并没有考虑存在无法用规则解释的活动的可能性——相反,他强调规则构建过程的历时性:在某一时刻有一套规则,在随后的时刻则有一套经过修改的规则。因此,维特根斯坦关于规则的论述不应被视为排除任何形式的基于规则的认知理论,而应被视为强调在新信息的光照下,始终对修订规则保持开放的重要性。正如T. S. 艾略特曾经观察到的:
因为模式在每一个瞬间都是新的,
而每一个瞬间都是对我们过往一切的全新且令人震惊的估价。
4.3 基本假设
感知引擎(APPERCEPTION ENGINE)在其当前形式中,以及下面描述的局限性,是项目早期做出的一些基本决策的结果,这些决策是对如何解释和实现康德思想的一些基本问题的回答:
1. 当康德说每一个判断的连续性都必须由一条因果规则来支持时,他的意思是(i)必须有一条主体所相信的因果规则?还是(ii)主体只需相信存在一条因果规则即可?
2. 当康德说判断就是规则时,他的意思是(i)由离散符号构成的明确规则?还是(ii)一些判断仅仅是隐含规则?
3. 康德在判断表中的判断有多强的表现力?他是否只允许(i)简单的肯定子句?还是也允许(ii)几何规则(在规则头部包含析取或存在量词)?
4. 鉴于知性涉及两种可分离的能力——将直观归摄到概念之下的能力,以及将概念组合成规则的能力——这两种能力应该如何实现?是否应该有(i)一个系统同时执行这两项功能,还是(ii)两个独立的系统,其中一个将输出传递给另一个?
感知引擎的设计是基于在每个决策点选择选项(i)做出的。我将依次尝试为每个决策提供理由。
4.3.1 连续性与因果规则
在《第二类比》中,康德写道:
因此,如果我们经验到某件事情发生了,那么我们总是预设某件其他的事情先于它发生,并且它是按照一条规则而发生的。[A195/B240]
现在,这一主张存在一个关键的范围歧义:它是否意味着(i)每当存在一个连续性时,主体就相信有一条规则支持这个连续性?还是意味着(ii)每当存在一个连续性时,主体相信存在某条规则支持这个连续性,即使主体不知道这条特定的规则是什么?
一些评论者倾向于第二种较弱的解释。例如,朗格内斯(Longuenesse)认为,我不需要已经形成一个因果判断就能感知一个连续性——我只需要承认我应该形成一个因果判断。对朗格内斯来说,感知一个连续性意味着致力于寻找一条因果规则——这并不意味着我已经找到了一条:
“一切发生的事情都预设了某件其他的事情,它按照一条规则而发生”这一说法并不意味着我们认识到这条规则,而是意味着我们被构造得要去寻找它,因为只有它的预设才允许我们认识到一个被赋予变化属性的持久物。(朗格内斯,1998,第366页)
包括迈克尔·弗里德曼(Friedman, 1992)在内的其他人则倾向于第一种更强的解释。
我没有足够的空间或时间来参与这场释义争议,但我想做一个观察。如果我们接受第一种更强的解释,那么对康德理论的任何实现都将成为一个可以用来预测未来状态、追溯过去状态以及填补缺失数据的系统。这种填补感官流空白的能力之所以存在,仅仅是因为主体实际上构建了规则来解释现象的连续性。如果我们采用了第二种较弱的解释,那么主体仅仅会相信存在某条规则——它不会被迫去找到这条规则,它会满足于知道这条规则存在于某处。这样的主体将无法预见未来或重建过去。
4.3.2 明确的规则还是隐含的规则
当康德说判断就是规则时,他的意思是判断是(i)由离散符号构成的明确规则,还是(ii)有些判断仅仅是隐含规则(例如,隐含在神经网络权重中的程序)?
第一种解释假设判断是使用思想语言中的离散符号形成的明确规则,这是布兰顿所称的规则主义(Brandom, 1994, p.18)的一种形式。第二种解释允许规则是普遍的(适用于某一类型的所有对象)、必然的(适用于所有情境),但却是隐含的:规则可能无法用自然语言或形式语言中的简洁句子来表达。为了具体说明第二种解释,可以考虑神经逻辑机(Dong et al., 2019)。这是一种神经网络,它模拟了肯定子句的正向推理,但不明确表示这些子句。神经逻辑机的“规则”隐含在神经网络的权重(一个大型浮点值张量)中,无法转化为简洁的人类可读规则。然而,这些规则是普遍的和必然的,适用于所有情境中的所有对象。
大多数评论者认为康德的规则是由离散符号组成的明确规则。我不想参与释义争论,而是想提供一个实际的理由,说明为什么在明确规则方面更倾向于第一种解释。感知引擎(APPERCEPTION ENGINE)的一个吸引人之处在于,该引擎发现的理论可以被阅读、理解和验证。例如,从Sokoban轨迹中学到的理论不仅正确,而且是可...
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.