大家好,我是船长。
概率论与统计学研究中充满了“可能”、“偶然”和“不确定性”。那么,数学追求的“绝对真实”,在概率论这片看似混沌的领域是否依然适用?长久以来,概率论因其与经验的紧密联系和对“随机性”的拥抱,被许多数学家视为“非正统”,甚至希尔伯特在1900年也将概率论视作物理学(而非数学)的一部分。直至今天,概率论都不能有效地纳入逻辑经验论和分析哲学的数学观。
而其实早在1933年,苏联数学家安德雷·柯尔莫哥洛夫就已经证明,概率论和其他数学分支一样,也是建立在一组公理之上的符号系统。1713年,瑞士数学家雅各布·伯努利给出了大数定理的数学证明。大数定理是指,随着抛硬币的次数增多,该随机事件(硬币某一面朝上或朝下的次数趋于相同)发生的“可能性”越来越大。用数学公式表示,就是它占总“可能性空间”的比例趋于1,即其概率接近于1——这是一个关于“可能性空间”收敛的、严格的数学定理,基于符号系统结构(数学)的真实性而非经验的真实性。
由此便可以探寻随机事件的真实根基:虽然随机过程不可预测,但“随机事件整体”的结构(如抛硬币所有可能结果的集合)、随机事件的结果(可通过受控观察确证)、以及对结果的测量(测度)都分别对应着普遍可重复受控实验的不同层面,因而都具有真实性。正是通过这三个层面与真实实验结构的牢固连接,概率论的公理系统得以建立并获得其作为科学真实符号系统的地位。
![]()
图:正态分布
破解概率之谜——大数定理与数学真实的边界
文/金观涛
大数定理:概率之谜
在数学领域,概率论和统计数学是一个与一般数学不同但又极为重要的领域。那么,本编第二章对于数学真实的分析,是否适用于概率论和统计数学呢?我们又该如何理解概率论和统计数学的真实性呢?
在相当长的时间中,数学家认为概率与来自《几何原本》的所有数学观念都不同,甚至于离开经验,概率论是否为真都无法判定。直至19世纪末,概率论仍不是一门严格的学科。1900年,德国数学家大卫·希尔伯特在法国举办的国际数学家大会上做了题为“数学问题”的著名讲演,他根据19世纪数学研究的成果与发展趋势总结了23个问题,其中第六个问题是用数学的方式实现物理学的公理化,而处在首位的便是概率论和力学的公理化。概率论可以和数理逻辑甚至是抽象代数那样,成为具有某种特定结构(真实)的纯符号系统吗?表面上看来,这是不可能的。即便希尔伯特在1900年也将概率论视作物理学(而非数学)的一部分。
因此,概率论对20世纪哲学(特别是数学哲学)一直构成巨大挑战。关于什么是概率,逻辑经验论和分析哲学存在两种看法。一种是将其视为经验研究,这方面的代表人物之一是德国哲学家汉斯·赖欣巴哈。他先将概率陈述视作“类”之间的关系,即“关于一个特定序列的一类元素的陈述之间的一般蕴涵关系”。之后,他以频率来定义概率,即“概率是在一个无限序列中频率的极限”。这种解释面临的最大问题在于,在经验世界中,任何序列都是有限的。在这种情况下,我们不可能通过对经验世界的观察获得有关“无限序列中频率的极限”的信息。另一种主流看法以美国分析哲学家鲁道夫·卡尔纳普为代表,其根据数学即逻辑的大前提,认为概率是符号系统符合经验的即“确证度”,故在认识论上亦属于逻辑范畴。卡尔纳普的观点存在两个绕不过去的困难。第一,根据逻辑经验论,只要符号系统符合(指涉)经验对象,它就获得经验的真实性。任何一个随机事件都可用一个符号串来表达,该符号串是符合经验的,故不存在符号串的确证度问题。为了建立符号系统的确证度,必须将概率论的研究对象限定在全称陈述,或那些不是直接指涉经验对象的符号系统。然而,一旦做出这一限定,概率论就只涉及如何从单称陈述得到全称陈述,即归纳逻辑的一部分,而实际上概率论的研究范围比归纳逻辑广泛得多。第二,确证度的计算必须基于等概率事件的存在,概率论不能保证这一点。故直至今天,概率论都不能有效地纳入逻辑经验论和分析哲学的数学观。
其实,正当布尔巴基学派把各门数学建立在集合论之上时,概率论的基础终于有了答案。1933年,苏联数学家安德雷·柯尔莫哥洛夫证明:概率论和其他数学分支一样,也是建立在一组公理之上的符号系统。我认为,概率论公理实为将对控制结果的不确定性(随机事件)研究纳入受控实验普遍可重复为真的结果。下面我以大数定理的发现来说明如何用普遍可重复的受控实验来研究随机事件(控制结果的不确定性)。
![]()
图注:以特定掷单个骰子的过程来展示大数定律
所谓大数定理,是指在实验不变的条件下,重复实验多次,随机事件的频率会接近它的概率。比如,我们抛一枚硬币,硬币落下后,某一面朝上是不确定的(即是随机事件),能确定的只是硬币某一面朝上或朝下的概率。所谓“朝上”或“朝下”的概率是指可能发生的事件(硬币某一面朝上或朝下)在总可能性空间中所占的比例。因为总共只有硬币某一面朝上或朝下两种可能,它们是相同的。这样,每一种占可能性空间的比例都是1/2,即某一面朝上和朝下的概率均为1/2。频率是指若干次实验后,随机事件发生数占实验总次数的比例。当我们抛硬币的次数足够多,达到上万次、几十万次甚至百万次时,就会发现硬币某一面朝上(或朝下)的次数约占实验总次数的1/2,也就是随机事件的频率似乎在“逼近”它的概率。
表面上看,“频率逼近概率”出于经验观察,故一开始大数定理被称为“大数定律”。定律何来用于指来自经验的法则,它和数学推出的定理是不同的。这样,概率论似乎类似于物理学,也建立在经验规律之上。然而,人们很快就发现将大数定理视为经验定律是不能成立的。原因在于,即便重复再多次实验,硬币某一面朝上(或朝下)的次数并不一定是实验总次数的一半。既然大数定理不是经验观察的结果,即当实验的总次数趋于无穷时,“频率一定逼近概率”在经验上并不成立,那它又是什么意思?
![]()
图:瑞士数学家雅各布·伯努利
直至1713年,瑞士数学家雅各布·伯努利才给出了大数定理的数学证明。该证明是数学的,不需要经验检验。从此以后,“大数定律”成为“大数定理”。伯努利的数学推理方式如下。还是以抛硬币为例,每次硬币正面朝上的概率为p(0
![]()
这里,伯努利根据排列组合从某一随机事件A的概率算出另一随机事件(A在n次重复实验中发生k次)的概率。由此,可以进一步用数学得出:当n趋于无穷时,随机事件A出现np次的概率会不断接近1。表面上看,“大数定律”是指我们在经验上观察到随机事件A的频率逼近它的概率,伯努利则指出这是不成立的,因为上述随机事件并一定发生(即不是真的)。但根据排列组合,可以算出随机事件频率逼近其概率的“概率”,计算证明,随着n趋向无穷大,随机事件频率逼近其概率的“概率”会越来越接近1。
准确地讲,μ是n次独立实验中随机事件A发生的次数,当随机事件A在每次实验中发生的概率为p时,所谓随机事件频率逼近其概率是指对任意正数ε,存在如下公式:
![]()
上述公式显示,大数定理是数学定理而非经验定律。也就是说,随着抛硬币的次数日益增多,硬币某一面朝上(或朝下)的次数趋于相同并不是真实的事件,而是一种“可能性”。大数定理是指,随着抛硬币的次数增多,该随机事件(硬币某一面朝上或朝下的次数趋于相同)发生的“可能性”越来越大。用数学公式表示,就是它占总“可能性空间”的比例趋于1,即其概率接近于1。由此可见,概率论推出的大数定理本身是一个概率上成立之陈述,它之所以为真,只是因为其发生的概率无限接近于1而已。
这一点可以用数学证明,基于如下两个前提。第一,抛硬币本身是一个无限可重复的实验,每一次硬币某一面不是朝上就是朝下,只有两种可能,这一点不会改变。这样,可以把每次实验可能性空间的大小定为1,由此可以得到n次实验的总可能性空间的大小为1的n次方。第二,根据这两起事件是等可能性的,我们可以算出每一个随机事件序列(它亦是随机事件)的概率。所谓随机事件序列的概率,是随机事件序列可能性占总可能性(可能性空间)的比例,该比例随着实验次数增多而趋近于1。大数定理的成立,基于符号系统结构(数学)的真实性而不是经验的真实性!
![]()
图:抛硬币
随机事件的符号表达及其真实性
让我们来分析大数定理为符号(数学)真实性的根据。本书第一编第二章指出,数学是普遍可重复受控实验的符号结构,规定数学各分支的公理实为受控实验各环节的细部结构,以及它们普遍可重复的符号表达。受控实验的普遍可重复是一种结构,其为真意味着该结构是真的,它保证具有该结构的符号系统也为真,这是数学作为纯符号系统为真的根据。显而易见,随机事件不满足普遍可重复性的要求。如果以受控实验(经验)普遍可重复为真实性标准,随机事件本身就不是真的,其符号表达当然亦无真实性可言。
然而,我们明明知道随机事件的存在,并可以用一个符号串来指涉它,说其不是真的,这和人们的直觉矛盾。问题出在什么地方呢?我仍用抛硬币为例来分析其真实性。在抛硬币实验中,就每次实验结果(硬币某一面朝上或朝下)而言,哪一种可能性实现是随机的,不具备普遍可重复性?我们之所以觉得每一次实验都为真,是因为该实验的结果(硬币某一面朝上或朝下)可以被一个普遍可重复的受控观察(或实验)证明。然而,这里被证明为真的是抛硬币的结果,而不是导致该结果的过程。
什么是导致随机事件结果的过程?它是指我们抛硬币的控制动作导致硬币某一面一定朝上(或朝下),它作为随机事件本身,不具备普遍可重复性。我们觉得其为真是看到该随机过程的结果即硬币某一面朝上(或朝下),它是可能性的实现。对于这一结果的真实性,基于硬币某一面朝上(或朝下)可以用一个普遍可重复的受控观察(或实验)来证明。我们认为随机事件是真实的,这是用其结果来代替过程带来的错觉,因为随机事件(可能性)实现后,它已经不是随机事件(可能性)了。
![]()
图:随机图
既然抛硬币的结果为真,那么规定结果的过程即随机事件本身难道不是真的吗?抛硬币有两种可能结果,即硬币某一面朝上或朝下。我们通常所说的抛硬币过程,是指这两种结果中必然有一种出现,而不是其中某一种一定出现。换言之,正因为我们已经把这两者中的任何一个发生视为抛硬币的过程,抛硬币的过程作为某种控制活动当然是真的。因为这时抛硬币已经不是随机事件,它是一个普遍可重复的受控实验!
通过上面的严格分析可以得出如下结论。首先,作为包含随机事件所有可能结果之“随机事件整体”对应着一个控制活动,它不是随机事件,因为这一控制活动是普遍可重复的,它必定是真的。我们可以用一个符号真实之公理来表达“随机事件整体”。其次,随机事件发生后,其结果对应着普遍可重复的受控观察或受控实验,故是真的。这促使随机事件的符号表达成为可能。为什么?因为随机过程和其结果一一对应,当我们用一个符号串指涉随机过程的结果时,它也对应着导致该结果的随机过程。最后,正因为随机事件的结果是真实的,我们可以分析各个结果对应的另一些受控观察和受控实验,研究它们之间的关系。如果这些关系是真实的,我们一定可以用另一组代表符号真实的公理表达它们,这就是随机事件的概率。这样,也就得到定义随机事件概率的公理。它和“随机事件整体”对应的控制行动的公理一样,亦是受控实验普遍可重复的符号表达。
由此可见,虽然随机事件本身不满足受控实验普遍可重复的要求,不能将其真实性表达为普遍可重复受控实验的符号结构,但它和普遍可重复的受控实验存在着如下三个割不断的联系。第一,随机事件整体对应着普遍可重复的受控实验。第二,随机过程的结果可以用普遍可重复的受控观察(实验)证明,我们用指涉其结果的符号串加上限定以准确表达随机事件,即用符号串指涉随机事件是可行的。第三,当随机事件的结果对应着测量时,测量也是普遍可重复的受控实验。这样随机事件本身虽不是真的(不对应着普遍可重复的受控实验),但其结果的测量是普遍可重复的。也就是说,只要随机事件符号集可测,其测量结果即“测度”是真的。
正因为随机事件上述三个和普遍可重复的受控实验相连接的部分都对应着真实的符号结构,我们可以将随机事件纳入科学真实的研究,用这些相连接的部分之符号表达建立一个纯粹的符号系统。该符号系统就是概率论的公理。它们和本编第二章数学系统满足的公理系统不尽相同,但同样是真实的。
本文系摘选自《真实与虚拟》一书第三章1-2节。为便于阅读,部分段落做了拆分和删减,推文标题为编者所拟,学术讨论请以原文为准。文中部分配图来源于网络,如有侵权请联系公众号后台删除。
![]()
《真实与虚拟》
扫描上方二维码可购买
内容编校:梦丹
内容整理:航琦
编发 审定:船长
声明
双体实验室出品 如需转载联系后台
欢迎转发朋友圈 一起探索人文科技
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.