网易首页 > 网易号 > 正文 申请入驻

本福特定律:为什么世界是乘法的

0
分享至

作者:[法] 米卡埃尔•洛奈

本文摘选自《数学的雨伞下:理解世界的乐趣》;人民邮电出版社授权发布

一、本福特定律

数学之旅有时始于平凡无奇的场所。

至于我们这段旅程的起点,我建议就定在街角的超市。你肯定知道某个离你家不远的超市。你在那里养成了自己的购物习惯。无论是大型购物中心还是乡间小卖部,都无关紧要,只要是能够找到满足日用之需的基础产品的超市就好。

你对超市里的氛围早已司空见惯。你已经来过这里上百次,甚至上千次。顺序排列的货架、金属台架、收银台扫描条形码时发出的规律声响,还有四处走动、无意识地抓起一瓶牛奶或几瓶罐头的顾客。但是今天,我们不是来购物的,而是来执行观察任务的。

这个地方隐藏着最引人入胜的数学宝藏之一。这么多年来,它一直都在你的眼前。它甚至没有丝毫的遮掩,你在此刻就能看到它。它是一个小小的反常之处。它是那些在你眼皮底下毫不起眼的细节之一,看似一无所用,却可能引得暗中窥探的观察者心生疑惑。拿出你的小本子或智能手机准备好做记录吧,我们的调查开始了。

看看货架上依次排列的价格标签。2.30 €、1.08 €、12.49 €、3.53 €……在我们一个接一个地快速扫过价格标签的时候,所有这些数似乎都是完全随机的。1.81 €、22.90 €、0.64 €……价格范围从几分到几十欧元。但我们要关注的不是细节。忘记小数点和小数吧。只看每个价格的首位有效数字,这是最重要的数字,它给出了近似值。

你看到一瓶标价为 1.54€的530克水果罐头,在你的本子上记为1。再走几步,一瓶标价为3.53€的24小时除臭剂,记为 3。一块标价为1.81€的250克奶酪,记为1。一口标价为45.90€的不粘锅,这个价格有两位数,但不要紧,我们只关注首位数字,记为4。一包标价为0.74 €的烤花生米,这个价格的首位有效数字是7。

我们就这样在超市里随意地走动了几分钟,记录的数字也越积越多。1 3 1 4 7 9 2 2 1 7 9 8 1 1 3 1 1 1 8 1 1 2 1 2 1 1 9 1 4 7 1 6 1 5 9 2 2 1 3 2 2 2 1 2 2 6……但随着记录的继续,一个小小的疑问出现了。你不觉得这串数字有什么不对头的地方吗?就好像其中存在着某种不平衡。这串数字主要由数字1和2组成,间或出现了几个3、4、5、6、7、8和9。仿佛我们在无意识的情况下自然而然地被最低价格所吸引。这里有问题。

那我们就向统计学家学习,严谨行事:从现在开始,谨防自己的偏见,采用一种系统性的方法。我们随机挑选几排货架,并把每排货架上所有产品的价格无一例外地记录下来。这是一项费事的工作,但你 必须做到心中有数。

一小时后,你的本子上记了整整几页的成串数字。是时候做个小结了。经过计算,结果毋庸置疑,其中呈现的趋势一目了然。你记录了一千多种产品的价格,其中将近三分之一的数是以1开头的!超过 四分之一的数以2开头,数越大,在记录中出现的次数越少。

图1.1是整理得到的首位数字的占比图。

这一次,我们无法再认为这是一种简单的随机效应,或是自己对产品有偏向性的选择了。我们必须承认,这是一个事实:超市里货品价格的首位数字分布不均衡——较小的数字在数量上具有显而易见的优势。

这种不均衡从何而来?这就是我想对你提出的问题。这些价格标签遵循了什么样的超市、商业或经济定律,才会呈现出这种奇怪的结果呢?为什么这些价格的首位数字会分布不均呢?数学难道不应该对所有的数字都一视同仁吗?数学应该是没有偏见、没有青睐,也没有最爱的。然而事实就摆在眼前,而且与我们的预想明显相反。在超市里,数学有它自己的“宠儿”,“宠儿”名叫1和2。

我们已经观察到了,也已经确认过了。现在,我们需要思考、分析和抽丝剥茧。我们的手中握有了事实,是时候展开调查并得出结论了。

1938 年 3 月,美国工程师和物理学家弗兰克·本福特(Frank Benford)发表了《反常数定律》(“The Law of Anomalous Numbers”)一文,他在这篇文章中分析了来自两万多个不同观察源的数字数据。在他的列表中,我们可以看到世界各地河流的长度、美国不同城市的人口、已知原子质量的测定值、新闻报纸上随机获取的数字,甚至还有数学常数。对于所有这些数据,本福特每次得到的观察结果都和我们的一样:首位数字分布不均衡。其中约有30%的数以1开头,18%的数以2开头,这一百分比持续下降,直到数字9,以9开头的数仅占5%(图1.2)。

本福特没有想到通过超市的价格标签去验证自己的统计结果。但我们不得不承认,他得到的结果与我们的结果出奇地相似——当然,在百分比上会有些微的变化,但就整体趋势而言,相似度高得令人惊讶。

本福特的研究表明,我们收集到的数据并非孤例。它们并非超市的运作方式所特有的,而是植根在一种更为广泛的趋势之中。1938年以后,很多科学家在越来越极端且越来越多样化的情况中观察到了相同的分布态势。

以人口学为例:在调查统计到的地球上的203个国家/地区中,有62个国家/地区(即30.5%)的人口的首位数字是1。首先是中国,拥有约14亿人口。我们还会发现,在这62个国家/地区中,墨西哥拥有约1.22亿人口,塞内加尔拥有约1300万人口,图瓦卢群岛拥有约10 800人口。相反,只有14个国家/地区(即6.9%)的人口数量是以数字9开头的。

你更喜欢天文学吗?在绕太阳公转的八大行星中,有四颗行星的赤道直径是以1开头的。木星直径约为142 984千米,土星直径约为120 536千米,地球直径约为12 756千米,金星直径约为12 104千米。太阳本身的直径约为1 392 000 千米。如果用这九个天体的样本数据还不足以得出一种可靠的趋势,那么就再加上矮星、卫星、小行星和彗星,你将总是得到同一个观察结果:数字1占据绝对优势。

一旦我们开始对此加以关注,实例就会接踵而来。取一张来自任 意情境的数字列表,分析这些数的首位数字,你一定会发现:本福特的数字分布总是一而再,再而三地出现。这一统计定律远非一种例外,它看起来完全是浑然天成、无处不在的。矛盾的是,我们在直觉上认 为本该更为合理的均衡分布,在世界上似乎根本不存在。

在这个层面上,超市里的观察结果就完全谈不上有什么奇异之处了。我们刚刚揭晓的是一条名副其实的定律,这条定律不仅支配着人类活动的很多领域,而且还在自然最为隐秘的结构中支配着自然本身。理解这条定律,就是理解关于我们的世界及其运转方式的某些深层的东西。

这条定律的影响之大,能让我们在毫无意识的情况下不断地复现它。给超市货品定价的人不一定会互相商量,他们中的大多数人也从未听说过弗兰克·本福特。但是,他们却仿佛在某种超越了他们的力量的支配下,不知不觉地遵从了本福特定律。各国人口、河流长度和行星直径的数值也是一样。

1938 年,弗兰克·本福特把这种分布命名为“反常数定律”。但是,这条定律无处不在,以“反常”命名听来并不适合。“反常”只是主观的判断,它只在那些对此感到讶异的人眼中才存在。相反,大自然似乎觉得这条定律实在是再普通不过。定律只有在不为我们所了解 时才会是“反常”的。而我们正打算去了解它。

那么,该朝哪个方向出发呢?我们的思路该沿着哪条轨迹去揭开反常的面纱,并让奥秘变成显而易见之事呢?本福特定律理解起来并不复杂,但解释起来几句话说不清楚。这条定律背后的数学原理简单而深刻。我们面对的不是一道忽然间顿悟并惊呼“啊,原来如此,我明白了!”就能得出答案的谜题。需 要改变的是我们对数字的理解和计数方式。如果说本福特定律在我们看来并非一目了然,那是因为我们的思维方式不对头。我们必须 学会从不同的角度去看待自以为已经很了解的事物,我们必须审视自己。

走进弗兰克·本福特刚刚为我们打开的世界游逛一圈,等你从中出来的时候不可能还是原来的样子。本福特定律改变了你。一旦你理解了它,你就再也不会以同样的方式思考了。

如果你有一台旧计算机,它因为多年的频繁使用而变得破旧,那么你可能会注意到键盘上键帽的破旧程度并不完全相同。E 键和空格键通常老化得更厉害,不像 $ 键或 ù 键,经过多年的使用之后看起来依然很新。

这一点儿也不奇怪。有些键是最常用的键,对应法语中最常出现的字母。在一份没有特殊风格的普通文本中,E 占去了所用字母中的15.87%,约为仅占 0.24% 的字母 Y 的 66 倍。我们可以在售卖备用部件的网店买到单个的替换键帽。你会毫不意外地看到,销售量最高的替换键帽是 E 键,A 键和 N 键紧随其后。

这种使用不均的现象存在于不同的领域之中。弹吉他的人会看到,琴弦因自己弹奏曲目中和弦使用频率的高低而出现不同程度的磨损。通往较高楼层的电梯按钮通常会磨损得更厉害,因为一楼或二楼的住户会更常选择走楼梯。绝大多数四色圆珠笔在被丢弃的时候,绿色和红色的笔芯仍然是满的——蓝色和黑色最先用完。

出于同一效应,过去几个世纪的科学家发现,他们所用对数表的最前面几页,无一例外要比最后几页磨损得更快。换言之,以 1、2 或 3开头的数被查找的频率要高于以 7、8 或 9 开头的数,而科学家们对小的数并没有任何有意识的偏好,这就好像是大自然亲自在给予科学家去研究的数中造就了这种不平衡。

这一观察结果本该引起科学家的注意,但很可惜,他们中的大多数人并不认为这种现象值得研究。倘若不去寻找显而易见之事,人们就会很容易看不到它。在三个世纪里,本福特定律实际上就摆在世界各地科学家们的眼前,但没有一个人看到它。

直到 19 世纪末,一只羞怯的手才开始揭开这张神秘的面纱。1881 年 12 月,加拿大裔美国天文学家和数学家西蒙·纽科姆(Simon Newcomb)发表了一篇题为《关于不同数字在自然数中使用频率的记录》(“Note on the Frequency of Use of the Differents Digits inNatural Numbers”)的文章。这篇发表在《美国数学杂志》(AmericanJournal Of Mathematics)上的文章只有短短两页。纽科姆注意到他所用对数表页面磨损程度的不均,于是出于好奇提出了前几个数的分布问题,并用几行字做出了解答。

可惜的是,他的发现几乎无人问津。

必须承认,这种现象背后的数学原理非常简单,而且不太值得专家的关注。然而,重要的不是计算,而是这些计算告诉我们的有关这个世界的信息。1881 年,似乎没人意识到,西蒙·纽科姆的发现如同把聚光灯照在宇宙背后转动的一个巨大齿轮上。直到五十多年后,弗兰克·本福特才意识到这一发现的博大之处,并为它撰写了一篇二十来页的文章。

尽管篇幅很短,但纽科姆的文章很有启发性,值得我们为它停留片刻。文章的结论很简单:世间的数是均匀分布的,而且是从乘法角度来看的均匀分布!

因此,在一张源自任意一种自然现象的数据列表中,介于 1 和 2 之间的数会和介于 2 和 4 之间以及介于 4 和 8 之间的数一样多(图 1.22)。这种现象仅仅是因为数与数的距离在乘法上是相等的,即从一个数到其 2 倍的数的区间。自然而然地,以 1 或 2 开头的数就会比以 7、8或 9 开头的数要多。

显然,如果数中的首位数字看起来分布不均,那是因为我们没有去看应该看的信息:均匀分布的是这些数的对数。看看你在超市里记录的价格清单、太阳系行星的直径,或是世界上河流的长度,然后找到它们的对数。你会发现以 1、2、3、4、5、6、7、8 或 9 开头的数同样多。纳皮尔的对数成功地转换了数的乘法分布,并将这种规律引入加法之中。

基于这一观察结果,西蒙·纽科姆计算出首位数字应当具有的理论分布。幸甚,幸甚!这种理论分布与弗兰克·本福特在五十年后发现的真实分布奇迹般地吻合了(图 1.23)。在理论与具体实验的结果相符时,科学家会感到异常高兴。现在我们可以确信自己清楚地了解了发生的事情。

只剩下最后一个问题了。是的,这个世界青睐乘法,但为什么?为什么现实似乎在所有的情况下都偏爱这种分布呢?同样地,答案并不存在于大自然中,而是存在于人类对大自然的观察偏差之中。鉴于本福特定律所具有的普遍性,它没有任何理由要取决于我们看待它的方式。

例如,法国的地理学家以公里为单位丈量河流,而英国的地理学家则以英里为单位丈量河流。因此,根据你的所在地是位于英吉利海峡的这一边还是那一边,尼罗河的长度要么是 6650 公里(以 6 开头),要么是 4130 英里(以 4 开头)。而世界上所有的河流,其长度的首位数字都会根据所采用的计量单位是法式的还是英式的而发生改变。有人可能会认为,这种计量单位的改变会颠覆首位数字的整体分布,让英国学者使用对数表的方式不同于法国学者的使用方式。但情况并非如此。公里和英里都是人类的发明,而大自然并不在乎我们使用哪种计量单位去测量它。从法国或英国的角度去看,每一条被分别丈量的河流,其长度不会有相同的首位数字,但如果我们制定出世界上河流长度的完整列表,则首位数字的总体分布应当会保持不变。

换言之,本福特定律应该是不变的。就像美索不达米亚式乘法的结果,就算没有零和小数点也依然会保持不变;就像字母 E 在一个足够长的文本中所占的比例始终会是大约 15%,无论文本的内容为何。无论我们使用什么方法去测量自然和收集数据,首位数字的分布都会保持不变。

如果你打算在世界不同国家的超市里进行统计的话,你会发现,本福特定律不会在乎你是以欧元、人民币、美元还是第纳尔来计算。无论使用哪种货币,这条定律都不会发生变化。

计量单位的改变,无论是把公里转换成英里,还是把欧元转换成第纳尔,或是其他的单位转换,都是一种乘法。一条河流的长度是另一条河流的两倍,无论采用哪种计量单位,这个长度的两倍都不会改变。一种价格比其他产品贵三倍的奶酪,无论使用哪种货币,它的价格始终都贵三倍。计量单位改变了,乘法的差距不变。因此,在任意数据列表中,我们都会发现介于 1 和 2、2 和 4 或 4 和 8 之间的数比例是相同的。所以,我们需要关注的是这种乘法的差距。

这就是为什么世界是乘法的。这就是为什么对数标度如此适切。这就是为什么我们的数字系统会不断误导我们的直觉。而这也是为什么本福特定律会是真实、美丽而又放之四海皆准的。

在随后的几年中,本福特定律在各处都得到了具体的应用。

美国经济学家哈尔·瓦里安(Hal Varian)在 1972 年提出用本福特定律来检测舞弊。原理很简单:当舞弊者把一份数据列表篡改成利于自己的时候,他们会露出马脚。也就是说,他们伪造的数据会有不同的首位数字分布。尤其是,伪造的数据会更频繁地以 5 或 6 开头,这与本福特定律不符。这或许是因为舞弊者倾向于认为,相较于以 1 或 9开头的数,一个中等大小的数看起来不会那么可疑,或是更正常。尽管如此,这种偏差仍会导致首位数字中的 5 和 6 远远多于应有的数量。这种偏差的幅度可以用来估算潜在舞弊者的数量。例如,这种方法被用来追踪税务申报中的统计异常,或发现选举时操纵选票的行为。但我们必须承认:如果排除几种不同的应用,本福特定律在我们的日常生活中并没有重大的影响。知道超市货品的价格遵循这一定律很有趣,但其实没有太大用处;知道各国的人口、世界上的河流或天空中的天体都遵循这一定律,也没有太大用处。“没用处”究竟是好是坏,由你来定夺。

但是,我们因好奇而踏足的这条道路上充满了惊喜。当然了,出于纯粹

的智力挑战,出于体验数学的形式之美,出于让我们的思维变得多姿多彩,不带任何期待地去理解一件事,未必不会让人获得极大的满足。然而,即便是最无用的事情,有时也会暗藏意料之外的宝藏。可不要低估了这些定理。

或许有一天,在你完全没有想到的那一刻,“有用之处”会不期而至。它们会像成熟而甜美的果实那样,自然而然地落入你的手中。

作者:[法] 米卡埃尔•洛奈(Mickaël Launay) 译者:欧瑜

惊讶!是思考的起点;

数学,是理解世界本质与万物关联的工具!

以数学为起点,以思考为快乐!

法国数学学会“达朗贝尔奖”得主科普名作。

数学,是理解世界本质与万物关联的工具,它能制造两个指南针:一个叫“实用”,一个叫“优雅”。不懂得数学的意义,就无法真正学习和理解数学。

科学家为什么那么聪明?因为他们有非凡的思考方法。

以数学为工具,以思考为快乐;培养自己的思考力、观察力,成为真正的思考者。

6月份中标信息:

2、

4、

5、

6、

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
老戏骨离世!66岁抗癌失败,演员妻子忙着拍戏,最后一面都没见到

老戏骨离世!66岁抗癌失败,演员妻子忙着拍戏,最后一面都没见到

综艺拼盘汇
2024-06-15 04:27:27
“我是烈士后代!你们不能判我死刑!”这个被告人为何如此叫嚣?

“我是烈士后代!你们不能判我死刑!”这个被告人为何如此叫嚣?

洞鉴历史
2024-06-15 12:55:02
为什么“父亲节”变得如此低调呢?

为什么“父亲节”变得如此低调呢?

叒女紫121
2024-06-15 17:02:11
伊朗突然轰炸以色列,意外炸碎一国面具,巴勒斯坦最大仇人出现!

伊朗突然轰炸以色列,意外炸碎一国面具,巴勒斯坦最大仇人出现!

绝对军评
2024-06-15 05:54:02
别让登哥看见!锡安的成人女星炮友室外跑步 臀部大得畸形!

别让登哥看见!锡安的成人女星炮友室外跑步 臀部大得畸形!

直播吧
2024-06-15 15:29:34
女主播爆料行业内幕,大量女主播都有价格,周淑怡确实值百万

女主播爆料行业内幕,大量女主播都有价格,周淑怡确实值百万

新游戏大妹子
2024-06-14 11:43:32
欧洲杯B组积分榜:西班牙领跑死亡之组,意大利第二克罗地亚垫底

欧洲杯B组积分榜:西班牙领跑死亡之组,意大利第二克罗地亚垫底

直播吧
2024-06-16 05:09:10
中国国民党副主席连胜文:在台湾,多数人不支持“台独”

中国国民党副主席连胜文:在台湾,多数人不支持“台独”

新京报
2024-06-16 07:28:10
我1973年参军去西安,火车上首长将我换到西宁,哪知因此改变命运

我1973年参军去西安,火车上首长将我换到西宁,哪知因此改变命运

青年的背包
2024-06-16 09:01:09
国产TOYOTA普拉多开启“大批量”交付,新增“拉花”版,颜值更高

国产TOYOTA普拉多开启“大批量”交付,新增“拉花”版,颜值更高

看看娱乐与体育
2024-06-16 11:24:05
不婚族万茜:从不炒作,嫁普通丈夫,40岁高龄为小丈夫生孩子

不婚族万茜:从不炒作,嫁普通丈夫,40岁高龄为小丈夫生孩子

谈娱新语
2024-06-15 22:11:33
2023年国家自然科学基金评审专家名单汇总

2023年国家自然科学基金评审专家名单汇总

高分子科学前沿
2024-06-16 07:53:29
乌兹别克斯坦夫人给韩国夫人上了一堂出访课,这次遇到了强对手!

乌兹别克斯坦夫人给韩国夫人上了一堂出访课,这次遇到了强对手!

小毅讲历史
2024-06-15 19:11:33
申城今日炎热依旧,预计最高气温达33℃!下周一连串雨“上线”

申城今日炎热依旧,预计最高气温达33℃!下周一连串雨“上线”

周到上海
2024-06-16 09:22:04
儿子高考前去世,母亲一同火化了儿子的手机,几日后竟意外接通!

儿子高考前去世,母亲一同火化了儿子的手机,几日后竟意外接通!

华人星光
2024-06-15 16:19:40
皮耶罗与德国主持人开玩笑:我为自己在06年的进球感到抱歉

皮耶罗与德国主持人开玩笑:我为自己在06年的进球感到抱歉

懂球帝
2024-06-16 10:08:13
31岁!英超最年轻少帅正式上任:2年前刚退役!2年后卖给切尔西?

31岁!英超最年轻少帅正式上任:2年前刚退役!2年后卖给切尔西?

风过乡
2024-06-16 09:12:31
中央连开9次会议商讨,华国锋主席职位去留问题,陈云提议让贤

中央连开9次会议商讨,华国锋主席职位去留问题,陈云提议让贤

博古文史
2024-06-16 11:30:03
日兰开通即成日兰兰,一家欢喜一家忧,连云港的失落感再度提升

日兰开通即成日兰兰,一家欢喜一家忧,连云港的失落感再度提升

道行天下
2024-06-15 17:29:11
过“紧日子”的地方政府,已经把手伸进老百姓的口袋里去了

过“紧日子”的地方政府,已经把手伸进老百姓的口袋里去了

浮事记
2024-06-03 11:48:21
2024-06-16 15:10:44
CMKT咨询圈
CMKT咨询圈
汇集一流智库,推动产业进步
3517文章数 14346关注度
往期回顾 全部

科技要闻

iPhone 16会杀死大模型APP吗?

头条要闻

牛弹琴:梅洛尼和马克龙吵了一架 晚宴上眼神可"杀人"

头条要闻

牛弹琴:梅洛尼和马克龙吵了一架 晚宴上眼神可"杀人"

体育要闻

没人永远年轻 但青春如此无敌还是离谱了些

娱乐要闻

上影节红毯:倪妮好松弛,娜扎吸睛

财经要闻

打断妻子多根肋骨 上市公司创始人被公诉

汽车要闻

售17.68万-21.68万元 极狐阿尔法S5正式上市

态度原创

手机
数码
健康
亲子
公开课

手机要闻

父亲节送礼不纠结,华为畅享 70系列值得重点考虑,实用性拉满

数码要闻

优派 XG323-4K-OLED-2 显示器预告:原生 10bit、全功能 Type-C

晚餐不吃or吃七分饱,哪种更减肥?

亲子要闻

幼儿园给孩子办“集体婚礼”,为何遭非议   新京报快评

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版