网易首页 > 网易号 > 正文 申请入驻

本科生推翻姚期智40年前的猜想,哈希表的平均查询时间竟与填满程度无关

0
分享至

来源:选自量子杂志

作者:Steve Nadis

编译:机器之心

1985 年,著名计算机科学家、图灵奖得主姚期智提出了一个与哈希表有关的猜想。现在,40 年过去了,一名本科生却成功推翻了这个猜想。而这项成就却源自一个始于 2021 年秋的故事。

量子杂志近日报道了这个故事,机器之心编译了该文章以飨读者。

原文地址:

https://www.quantamagazine.org/undergraduate-upends-a-40-year-old-data-science-conjecture-20250210/

2021 年秋季的某天,罗格斯大学的一位本科生 Andrew Krapivin 遇到了一篇论文,而这篇论文将改变他的一生。不过那时候,Krapivin 倒没有多想。两年之后,当他终于有空细读这篇论文时(他说当时只是为了好玩),他还没意识到:他的工作将让人重新审视计算机科学领域一种被广泛使用的工具。

这篇论文题为「Tiny Pointers」,即微型指针。这是一种类似箭头的东西,指向的是计算机内存中的一段信息或一个元素。Krapivin 很快就发现了一种有望进一步降低指针内存使用量的方法。但首先,他需要一种更好的方法来组织指针指向的数据。

  • 论文标题:Tiny Pointers

  • 论文地址:https://arxiv.org/pdf/2111.12800

他的方法是使用一种常用于存储数据的方法,即哈希表(hash table)。在探索研究的过程中,Krapivin 最终发现了一种新的哈希表。并且这种新哈希表的工作速度更快 —— 用更少的时间和步数便能找到指定元素。

不过,Krapivin 之前的教授 Martín Farach-Colton 起初对这个新设计深感怀疑,毕竟哈希表似乎早已被人研究透了,很难再取得新进展。

但直觉上的看法并不一定总是对的。为了确认这个新设计的有效性,Farach-Colton 邀请了卡内基梅隆大学的 William Kuszmaul 检查 Krapivin 的新发明。

Kuszmaul 深感振奋。他记得自己当时对 Krapivin 说:「你不只是想出了一个很酷的哈希表,你实际上彻底推翻了一个已有 40 年的猜想!」

Andrew Krapivin 颠覆了人们对哈希表的普遍看法 —— 即便他一开始并没有这样的打算。哈希表是计算机科学中被研究得最透彻的工具之一。

本科生推翻存在 40 年的猜想

Krapivin 推翻的是著名计算机科学家、图灵奖得主姚期智在 1985 年提出的一项研究。

他们的研究过程是这样的。1 月份,剑桥大学研究生 Krapivin、任职于纽约大学的 Farach-Colton 以及 Kuszmaul 共同发表了一篇文章。

这篇文章重新探讨了开放寻址哈希表(open-addressed hash table)的最优搜索复杂度,以便在检索时能以尽可能少的探测次数找到元素。文章提出了两种新的哈希表插入策略 —— 弹性哈希(elastic hashing)和漏斗哈希(funnel hashing),并证明了,即使不随时间重新排列元素,也可以构建一种哈希表,其预期的搜索复杂度(无论是摊销复杂度还是最坏情况)远超以往认为可能的水平。

  • 论文标题:Optimal Bounds for Open Addressing Without Reordering

  • 论文地址:https://arxiv.org/pdf/2501.02305

在论文摘要部分,他们强调了这项研究推翻了姚期智在其开创性论文《Uniform Hashing is Optimal》中留下的核心猜想,并给出了相关的下界证明。

众所周知,哈希表在计算领域已变得无处不在,主要在于其简单性和易用性。它通过将数据映射到一个固定大小的数组中,从而实现快速的插入、删除和查询操作。哈希表的核心思想是利用哈希函数(Hash Function)将数据的键(Key)转换为数组的索引(Index),从而快速定位数据存储的位置。

最早的哈希表可以追溯到 20 世纪 50 年代初,自那时起,计算机科学家一直在研究和使用它们。研究人员希望弄清楚这些操作的速度极限。例如,新的搜索或插入可能有多快?

Martín Farach-Colton 帮助 Krapivin 证明了新哈希表与一个长期存在的猜想相矛盾

答案通常取决于在哈希表中找到一个空位所需的时间。而这通常又取决于哈希表的填充程度。

填充程度可以用百分比表示,比如 50% 或 90%,但在研究中,哈希表往往接近完全填满。

为了更精确地描述这种高填充状态,研究者们可能会使用一个整数(记作 x)来表示哈希表接近 100% 满的程度。如果 x 是 100,那么哈希表是 99% 满的;如果 x 是 1,000,那么哈希表是 99.9% 满的。

这种衡量填充程度的方法为评估执行查询或插入等操作所需的时间提供了一种便捷的方式。

此前,研究人员得出这样一个结论,对于某些常见的哈希表,执行最坏情况下插入操作所需的预期时间与 x 成正比。Kuszmaul 表示:「如果你的哈希表是 99% 满的,那么你需要查看大约 100 个不同的位置才能找到一个空闲槽位,这种情况是合理的。」

著名计算机科学家姚期智在这篇论文中提出,在具有特定属性的哈希表中,查找单个元素或空位的最佳方法是随机地遍历潜在的位置 —— 这种方法被称为均匀探测(uniform probing)。他还指出,在最坏的情况下(即寻找最后一个空闲位置时),你无法做得比 x 更好。

  • 论文标题:Uniform Hashing Is Optimal

  • 论文地址:

https://dl.acm.org/doi/pdf/10.1145/3828.3836

40 年来,大多数计算机科学家都认为姚期智的猜想是正确的。

Krapivin 没有囿于传统的想法,原因很简单:他不知道这个传统的想法。他说:「我在不知道姚期智猜想的情况下做到了这一点。」这让 Tapline 联合创始人兼 CEO 不禁在 上感叹说:「无知也是一种福气。」

Krapivin 在微型指针方面进行的探索最终得到了一种新的哈希表 —— 一种不依赖于均匀探测的哈希表。

对于这种新的哈希表,最坏情况查询和插入所需的时间与 (log x)² 成正比 —— 比 x 快得多。这个结果直接与姚期智的猜想相矛盾。Farach-Colton 和 Kuszmaul 帮助 Krapivin 证明了 (log x)² 是姚期智所写的常见哈希表类别的最佳、不可超越的界限。

卡内基梅隆大学的 Guy Blelloch 赞道:「这个结果非常美妙,因为它重新审视并解决了这样一个经典问题。」

滑铁卢大学的 Sepehr Assadi 表示:「他们不仅证否了 [姚期智猜想],还找到了该问题的最佳答案。我们原本可能还要再等 40 年才能知道这个正确答案。」

Krapivin 在剑桥大学的国王学院桥上。他的新哈希表可以超出研究者预料的速度更快地查找和存储数据。

除了证否姚期智的猜想外,这篇论文还包含许多更惊人的结果。这与一个相关但略有不同的情况有关:1985 年,姚期智不仅研究了查询的最坏情况时间,还研究了所有可能查询的平均时间。他证明:具有某些属性的哈希表(包括被标记为「贪婪」的哈希表,这意味着新元素必须放在第一个可用位置)的平均时间永远不会比 log x 好。

Farach-Colton、Krapivin 和 Kuszmaul 想看看对于非贪婪哈希表,这个限制是否同样适用。

最终,他们表明这个限制不适用。证明过程很简单,他们提供了一个反例,即一个平均查询时间远远好于 log x 的非贪婪哈希表。事实上,它根本与 x 无关。

Farach-Colton 说:「你会得到一个数值,而这个数值就是一个常量,与哈希表的填满程度没有关系。」也就是说,无论这个哈希表的填满程度如何,平均查询时间都是一个常量。

这一事实大出人们意料 —— 甚至连这几位作者自己也没有想到。

Conway 说,该团队得到的结果可能不会带来任何直接的应用,但这并不重要。「更好地理解这些类型的数据结构很重要。你不知道这样的结果何时会造就一些东西,从而让你创造更好的实践。」

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

截止到12月25日 ”未来知识库”精选的100部前沿科技趋势报告

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
靴子落地! 孙永红被查,半年内黄岛区连续两任书记被查

靴子落地! 孙永红被查,半年内黄岛区连续两任书记被查

元芳有看法
2025-09-14 11:59:12
瞬间天黑!合肥突降暴雨!暴雨降温或即将抵达安徽

瞬间天黑!合肥突降暴雨!暴雨降温或即将抵达安徽

鲁中晨报
2025-09-14 15:32:06
令韩国人震惊的中国酸奶世界…

令韩国人震惊的中国酸奶世界…

奋斗在韩国
2025-09-13 19:06:56
王楚钦4-0张禹珍晋级决赛!韩媒:惨烈完败,无法逾越乒坛长城

王楚钦4-0张禹珍晋级决赛!韩媒:惨烈完败,无法逾越乒坛长城

颜小白的篮球梦
2025-09-14 16:04:00
谁还说我水!英超射手榜:约克雷斯4场3球,与哈兰德并列第一

谁还说我水!英超射手榜:约克雷斯4场3球,与哈兰德并列第一

直播吧
2025-09-13 21:41:09
在大陆骗吃骗喝,在台湾搞“暗独”,“两面人”夏立言决定不演了

在大陆骗吃骗喝,在台湾搞“暗独”,“两面人”夏立言决定不演了

南宗历史
2025-09-13 21:34:22
西班牙王室莱蒂齐亚王后与国王丈夫闹离婚,11亿元天价离婚分手费

西班牙王室莱蒂齐亚王后与国王丈夫闹离婚,11亿元天价离婚分手费

译言
2025-09-14 15:27:10
微软推出突破性实时翻译 API,143 个地区 76 种语言实时交流

微软推出突破性实时翻译 API,143 个地区 76 种语言实时交流

IT之家
2025-09-13 21:08:17
事关波兰领空无人机事件!美国务卿:“不可接受”!特朗普:“可能是失误”!中国代表:各方保持克制

事关波兰领空无人机事件!美国务卿:“不可接受”!特朗普:“可能是失误”!中国代表:各方保持克制

每日经济新闻
2025-09-14 07:27:53
秋天,不要买这4种蔬菜,没营养还会伤身体,菜贩子自己都不吃!

秋天,不要买这4种蔬菜,没营养还会伤身体,菜贩子自己都不吃!

阿龙美食记
2025-09-11 14:52:30
原来这么多疾病都与晚餐有关!医生:一定要改掉这几个晚餐坏习惯

原来这么多疾病都与晚餐有关!医生:一定要改掉这几个晚餐坏习惯

男女那点事儿儿
2025-09-14 16:21:12
中方迟迟未点头,韩国不惜“走后门”,希望中国不要驳了老友面子

中方迟迟未点头,韩国不惜“走后门”,希望中国不要驳了老友面子

张学昆看世界
2025-09-14 17:35:34
朱雨玲:已报警

朱雨玲:已报警

新京报
2025-09-14 10:23:29
预制菜“国标”讨论会参加者:当时争论焦点就是什么标准算预制菜,还讨论了“简单复热、复杂复热”

预制菜“国标”讨论会参加者:当时争论焦点就是什么标准算预制菜,还讨论了“简单复热、复杂复热”

红星新闻
2025-09-13 22:51:09
于朦胧坠楼最新,近期行程曝光,多位大佬硬刚讨真相,果然不简单

于朦胧坠楼最新,近期行程曝光,多位大佬硬刚讨真相,果然不简单

山河月明史
2025-09-14 16:12:55
下一个乌克兰出现?美防长扬言:中国敢动手,美国就下场!

下一个乌克兰出现?美防长扬言:中国敢动手,美国就下场!

健身狂人
2025-09-14 14:33:49
包养情人无数,娶初中同学女儿为妻,玩老婆闺蜜,嗜色如命的富豪

包养情人无数,娶初中同学女儿为妻,玩老婆闺蜜,嗜色如命的富豪

负面黑洞
2025-09-11 16:19:05
日本街头真实调查:2025年的日本普通人都有多少存款?

日本街头真实调查:2025年的日本普通人都有多少存款?

日本物语
2025-09-13 20:43:45
记者:申花今天下午前往亚冠客场,仅阿马杜、李可等几名伤员缺席

记者:申花今天下午前往亚冠客场,仅阿马杜、李可等几名伤员缺席

直播吧
2025-09-14 13:31:06
郭秀云坦言:她们拍三级片是为了生活,我是感兴趣,顺便气钱小豪

郭秀云坦言:她们拍三级片是为了生活,我是感兴趣,顺便气钱小豪

洲洲影视娱评
2025-09-12 18:51:34
2025-09-14 18:39:00
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4185文章数 37276关注度
往期回顾 全部

科技要闻

L3级车型要来了!辅助驾驶迎重大利好

头条要闻

俄国防部:俄军在演习中发射"锆石"高超音速巡航导弹

头条要闻

俄国防部:俄军在演习中发射"锆石"高超音速巡航导弹

体育要闻

3次遭争议判罚!皇马向FIFA投诉西甲裁判

娱乐要闻

彪悍那英,大女人与旧妻子

财经要闻

西贝贾国龙,“错”得离谱

汽车要闻

混动狂潮 835马力V12 阿斯顿·马丁的最后浪漫

态度原创

手机
教育
时尚
游戏
亲子

手机要闻

魅族 22 搭载 Flyme AIOS 2,全新 AI 按键支持快捷功能一键启动

教育要闻

初中数学竞赛题解根式方程,利用换元法将复杂问题简单化!

衣服“买精不买多”,日常准备这几款单品,简单舒适又大方

《宝可梦ZA》确认与HOME连接 不与过往系列互通!

亲子要闻

38.5%儿童肺炎“元凶”是肺炎球菌,专家呼吁强化疫苗预防

无障碍浏览 进入关怀版