来源:市场资讯
(来源:图灵人工智能)
您想知道的人工智能干货,第一时间送达
![]()
![]()
“查尔斯·巴赫曼(Charles W. Bachman, 1924-2017)是网状数据库之父,1973年图灵奖得主,美国计算机科学家。他开发了世界上第一个数据库管理系统——集成数据存储(IDS),奠定了现代数据管理技术的基础。”
01. 人物介绍
![]()
(图片来源:AI生成)
每一片浩瀚的海洋,都曾是一滴孤独的水。
在人工智能可以写诗、作画、与人交谈、诊断疾病、编写代码的这个时代,我们习惯仰望那些站在聚光灯下的算法天才——辛顿、杨立昆、本吉奥。他们的名字被反复传颂,他们的论文被无数次引用,他们的面孔出现在杂志封面上。
却很少有人想起——在数据还没有成为“海”之前,是谁先挖出了第一道沟渠,让水可以流动、汇聚、彼此找到。
查尔斯·巴赫曼,就是一个修岸的人。
他不张扬,不喧哗,甚至刻意避开镁光灯。他没有在顶级会议做过主旨演讲,没有创办过市值千亿的公司,没有在社交媒体上与同行论战。他只是安静地坐在上个世纪的机房里,听着磁带机嗡嗡的转动声,闻着打孔纸带特有的油墨味,然后用一种近乎固执的温柔,为后来所有的智能,铺好了第一张可以躺卧的床。
他相信一件事:数据是有生命的。它们应该被看见、被连接、被尊重。
这个故事,关于一个机械工程师,如何用一生,把世界从“孤岛”连成“大陆”。
如果你愿意,请慢下来。泡一杯茶,找一个舒服的姿势。这是一个需要慢慢听的故事。
一、在堪萨斯的风里长大
1924年12月11日,美国堪萨斯州,曼哈顿——不是纽约那个曼哈顿,是一个安静的、被麦田包围的小城。
一个男孩出生了。
那年,卡尔文·柯立芝还是美国总统,爵士乐正在芝加哥的酒吧里悄悄萌芽,电视还没有被发明出来,人们刚刚开始用电灯照亮夜晚,收音机还是需要戴上耳机才能听见的稀罕玩意儿。
小查尔斯·巴赫曼来到这个世界的时候,还没有“计算机”这个词。甚至连“电子”都还只是一个物理课本上的抽象概念。
他的童年,是在开阔的平原上度过的。
堪萨斯的风很大,大到能把帽子吹跑,大到麦田会像海浪一样起伏。天很低,云跑得很快,地平线在四面八方向外延伸,好像永远走不到尽头。
他后来在回忆录里写道:
“在堪萨斯长大,你会明白一件事:万物之间都有看不见的联系。风连着云,云连着雨,雨连着土地,土地连着麦子,麦子连着餐桌上的面包。没有任何东西是真正孤独的。”
这种直觉——万物相连的直觉——像一颗种子,埋进了他年幼的心里。
巴赫曼的父亲是一位工程师,母亲是一位教师。家里不算富裕,但书架从来不空。他从小就喜欢拆东西——拆闹钟,拆收音机,拆一切能拆开的东西。不是为了破坏,而是想看看里面是怎么连接的:齿轮咬合齿轮,电线连接电线,每一个零件都有自己的位置,每一个位置都有自己的意义。
他后来常说:
“一个闹钟和一套数据库,本质上没有区别——都是关于‘连接’的艺术。”
高中毕业后,他先去了密歇根州立大学,读机械工程。那是工业时代最后的荣光——钢铁、齿轮、传动轴、内燃机,一切都实实在在,一切都可以被触摸、被测量、被信任。
然后战争来了。
第二次世界大战期间,巴赫曼加入了美国陆军。他没有被派往前线,而是被分配到一个防空炮兵部队,负责维护火炮的瞄准系统。那是一份枯燥而精密的工作——你需要让一个几十吨重的庞然大物,精准地指向天空中的一个小点。
他在那里学会了两件事:
第一,精度就是生命。差一度,就可能打不中;打不中,就可能有人死去。
第二,系统思维。一个瞄准系统,不是瞄准镜的事,而是齿轮、液压、光学、人力、天气、地形的总和。你不能只看一部分。
战争结束后,他回到了学校。
但这一次,他没有只学工程。他去了宾夕法尼亚大学读机械工程硕士,然后又去了沃顿商学院——拿到了MBA学位。
这是一个奇怪的知识组合。工程教他“怎么造”,商科教他“为了谁”。
他后来解释过:
“如果不懂商业,你就不知道数据为什么重要。数据不是为了存在而存在的——数据是为了回答一个问题:我的生意到底怎么样了?”
1950年,巴赫曼毕业了。
那一年,世界上的计算机屈指可数,每一台都像一堵墙那么大。没有人听说过“软件”,没有人听说过“数据库”,甚至“程序员”这个职业,都还在襁褓之中。
但他已经隐隐约约感觉到了什么。
他说不上来,只是一种子弹即将出膛前的震颤。
二、当数据还是孤岛
1960年代初,巴赫曼加入了通用电气公司。
那时候的通用电气,是世界最强大的企业之一。它造发电机,造冰箱,造喷气发动机,造核反应堆。它拥有庞大的供应链、庞大的销售网络、庞大的财务系统——每一个环节都在产生数据,但每一个环节的数据,都像一座孤岛。
生产部门有一个文件柜,里面装满了零件清单。采购部门有另一个文件柜,里面装满了供应商信息。销售部门有第三个文件柜,里面装满了客户订单。仓库有第四个,里面装满了库存记录。
这些文件柜之间,没有电话,没有信件,没有沟通。
一个订单从销售部到生产部到仓库到运输部,每一步都需要人工抄写、人工传递、人工核对。一个数字抄错了,整批货就送错了。一个名称写反了,客户就收不到账单。
通用电气请巴赫曼来,是为了解决一个很现实的问题:让这些文件柜,能够彼此说话。
巴赫曼走进了机房。
那是一个巨大的、没有窗户的房间。地板上铺着防静电的橡胶垫,空调全天候运转,声音很大,大到人们必须提高嗓门才能听见彼此。计算机——IBM 1401系列——占据了整整一面墙,磁带驱动器像一排沉默的卫兵,闪烁着绿色的指示灯。
巴赫曼看着这些昂贵的机器,陷入了一种奇特的沉思。
当时的计算机是怎么处理数据的?
是这样的:
你需要先把数据写在打孔卡片上。每一张卡片存储80个字符,像一句很短的句子。然后你把一叠卡片放进读卡器,读卡器把它们一张一张吞进去,转换成电信号。计算机处理完之后,再把结果打在另一叠卡片上。如果你想用这批数据做另一件事——比如从“计算工资”变成“生成报表”——你得把卡片重新整理一遍,重新输入一遍。
数据是线性的,是顺序的,是一次性的。
就像一个只有单行道的城市——你想去另一个地方,必须回到原点,重新出发。
巴赫曼觉得不对劲。
他在笔记本上画了一条线,然后在线上画了一个分支,又在分支上画了另一个分支。他想:为什么不能直接过去呢?为什么一定要绕回来呢?
他站起来,走到白板前,画了一张图。
这张图,后来会被叫做——网状数据模型。
三、修第一条路的人
![]()
(图片来源:AI生成)
1963年,巴赫曼做出了一个决定:他要自己写一个系统。
没有预算,没有团队,没有正式的立项。他只是在完成本职工作之余,一个人写代码。那时候写代码不像现在——没有集成开发环境,没有代码补全,没有在线文档。你坐在一台电传打字机前,用纸带打孔,然后把纸带送进计算机,等它运行,然后等它出错,然后找错,然后重新打孔。
一遍,一遍,又一遍。
他在构建一个东西,他把它叫做集成数据存储——Integrated Data Store,简称IDS。
这是人类历史上第一个数据库管理系统。
不是“一个数据库”,而是“一个管理数据库的系统”。它可以让不同的程序,同时访问同一份数据,而不会互相干扰。它可以让数据持久地存在,而不是随着程序的结束而消失。它可以在数据之间建立“指针”——就像一个箭头,从一条记录指向另一条记录。
巴赫曼这样描述他的想法:
“想象你在一片森林里,每一棵树都是一条数据。你想从这棵树走到那棵树。在旧的系统里,你必须回到森林的入口,重新开始。但在IDS里,你可以直接从一棵树走向另一棵树——只要你记得路。”
他把这种行走,叫做导航。
多么诗意的词啊。在那个年代,程序员还只是在“处理数据”、“操作数据”、“管理数据”——冰冷的、工具性的词汇。而巴赫曼说:不,你是在航行。数据是一片海,你是船长,指针是你的罗盘,记录是你的岛屿。
他还在IDS里实现了两个革命性的功能:
第一,并发控制。两个人可以同时修改同一份数据,系统会自动协调,不会让一个人把另一个人的工作覆盖掉。这在今天看来理所当然,但在1963年,这是一个大胆的创新。
第二,故障恢复。如果系统在运行中途崩溃了——当时这种事经常发生——IDS可以在重启后恢复到崩溃前的状态,不会丢失数据。这就像给数据买了一份保险。
1964年,IDS正式在通用电气内部投入使用。它运行的第一个应用,是通用电气的武器系统部门——制造导弹和轰炸机的那个部门。数据量巨大,关系复杂,稍有差错就是灾难,IDS扛住了。
消息开始在行业内流传。通用电气的竞争对手派来探子,想知道这个神秘的“IDS”到底是什么。学术圈也开始有人关注——一个叫巴赫曼的工程师,在工业界做了一个大学里都没做出来的东西。
但巴赫曼没有停下来庆祝。他知道,IDS只是一个开始。
四、让世界看见那张网
1960年代末,巴赫曼离开了通用电气,加入了霍尼韦尔信息公司。
在那里,他继续完善他的数据库理念。他开发了IDS的改进版——IDS/2,加入了更多企业级功能:更好的安全性、更高效的查询、更灵活的导航方式。
但更重要的是,他开始推动一件事:标准化。
巴赫曼意识到,如果每个公司都用自己的数据库系统,数据就无法在组织之间流动。通用电气的数据格式和霍尼韦尔的不一样,霍尼韦尔的和IBM的不一样——数据仍然是孤岛,只不过这一次,孤岛变大了而已。
他加入了CODASYL——数据系统语言会议。这是一个由美国国防部资助的标准化组织,最早是为了开发COBOL编程语言而成立的。
在CODASYL内部,巴赫曼牵头成立了一个新的委员会:数据库任务组——Data Base Task Group,简称DBTG。
这个任务组的目标是:制定一个所有人都能遵守的数据库标准。
那几年,巴赫曼几乎每个月都要飞往华盛顿,参加CODASYL的会议。会议很枯燥——动辄十几个小时,讨论的都是技术细节:指针的长度应该是多少?记录的格式应该怎么定义?数据描述语言应该用什么样的语法?
但巴赫曼从不厌倦。
他后来回忆说:
“标准化不是最性感的工作。但它是最重要的工作之一。你修一条路,如果宽度不一样,火车就开不过去。数据库也是一样。”
1971年,DBTG发布了它的最终报告——史称DBTG报告。
这份报告提出了一个影响深远的三层架构:
外部层:用户看到的视图。不同的用户,看到不同的数据切片。
概念层:数据的整体逻辑结构。所有数据在哪里,它们之间什么关系。
内部层:数据在硬盘上的实际存储方式。
这个架构的伟大之处在于:它把“数据是什么”和“数据存在哪里”分开了。
这意味着,你可以改变数据的存储方式——比如换一块更快的硬盘——而不需要修改你的应用程序。反过来,你也可以改变应用程序的查询方式,而不需要搬动硬盘上的数据。
这就是所谓的数据独立性。
今天,每一个数据库系统——Oracle、MySQL、PostgreSQL、MongoDB、甚至Excel——都在不同程度上遵循着这个架构。只是很少有人知道,这个架构的源头,是1971年的一份政府报告,和巴赫曼无数个失眠的夜晚。
五、巴赫曼图——给数据画一张星图
![]()
(图片来源:AI生成)
除了IDS和DBTG报告,巴赫曼还有一个流传更广的遗产:巴赫曼图。
这是一种极其简单的图。你只需要两种元素:
方框:代表一种数据类型——比如“客户”、“订单”、“产品”。
箭头:代表数据类型之间的关系——比如“一个客户可以有多个订单”,“一个订单对应一个产品”。
就这么简单。
但简单的东西,往往最有力量。
巴赫曼图让程序员、分析师、管理者之间,有了一个共同的“语言”。你不需要懂技术,你只需要看得懂方框和箭头,就能理解一个系统的数据结构。
一个管理者看到巴赫曼图,会说:“哦,原来我们的客户和订单是这样连接的。”
一个程序员看到巴赫曼图,会说:“哦,原来我需要在代码里这样写查询。”
一个数据分析师看到巴赫曼图,会说:“哦,原来我可以从客户出发,找到所有订单,然后找到订单里的所有产品——我可以回答‘买了A产品的客户还买了什么’这个问题了。”
巴赫曼图还有一个隐藏的美学意义:它让看不见的东西变得可见。
数据是隐形的。你没办法“看见”一条数据,就像你没办法“看见”一个想法。但巴赫曼图把这些隐形的连接,画在了纸上。像一个天文学家把散落在夜空中的星星,连成了星座。
巴赫曼本人非常喜欢画图。
他的同事回忆说,巴赫曼在开会的时候,从不做笔记。他在白板上画图。问题越复杂,他画得越起劲。箭头、方框、分支、循环——像一幅抽象画。
有一次,一个年轻的程序员问他:“巴赫曼先生,你为什么这么喜欢画图?”
他想了想,说:
“因为语言会骗人。文字会模糊。但一张好图,就像一把尺子——你可以指着它说:‘这里是对的,那里是错的。’”
六、哥白尼式的转身
![]()
(图片来源:AI生成)
1973年,一个电话打到了巴赫曼的办公室。
电话那头说:“巴赫曼先生,您获得了今年的图灵奖。”
图灵奖——计算机界的最高荣誉。相当于这个领域的诺贝尔奖。巴赫曼是第四位图灵奖得主。在他之前,只有艾伦·珀利斯、莫里斯·威尔克斯和约翰·麦卡锡获得过这一殊荣。
巴赫曼在电话里沉默了几秒钟。
然后他说:“谢谢。但我还有很多工作没做完。”
这就是他。谦逊,克制,永远觉得最好的作品是“下一个”。
那一年的图灵奖颁奖典礼,在ACM年会上举行。巴赫曼走上讲台,面对着台下上千名计算机科学家、工程师、学生、记者。
他的演讲题目是:《程序员作为导航员》。
他没有讲技术细节——那些留给论文就好。他讲了一个关于世界观的比喻。
他说:我们正在经历一场哥白尼式的革命。
哥白尼做了什么?他把世界的中心,从地球移到了太阳。地球不再是一切的中心,而只是一颗绕着太阳转的行星。这是一个深刻的视角转换——看似只是换了一个参照系,实际上改变了整个文明的思维方式。
巴赫曼说,计算机领域也在经历类似的视角转换。
过去,一切都是围着计算机转的。数据是程序的附庸——程序来了,数据被读取;程序走了,数据被遗忘。数据没有自己的位置,没有自己的尊严,没有自己的生命。它们只是程序的燃料,烧完了就没了。
但巴赫曼说:不是这样的。
数据才是中心。程序——无论多么聪明、多么复杂的程序——都应该围着数据转,而不是反过来。
这意味着什么?
意味着当你设计一个系统的时候,你首先要问的不是“这个程序怎么写”,而是“这些数据是什么、它们之间有什么关系”。
意味着数据不是用完就扔的一次性用品,而是需要被长期保存、精心维护、持续管理的资产。
意味着数据有自己的生命周期——它们出生、成长、关联、衰老、归档、消亡——就像有生命的东西一样。
巴赫曼在演讲中说:
“我们正在从一个以过程为中心的世界,走向一个以数据为中心的世界。这不仅仅是技术的变化,这是世界观的变化。”
台下响起了掌声。
这段话,在今天听起来可能平平无奇。因为我们已经生活在以数据为中心的世界里——大数据、数据驱动、数据资产、数据中台,这些词我们已经听腻了。
但在1973年,这是一个振聋发聩的宣言。
那一年,大多数程序员还在用汇编语言写代码,大多数公司还在用文件柜存数据,大多数大学甚至还没有开设“数据库”这门课。
而巴赫曼已经看见了三十年后的世界。
七、与关系模型的君子之争
![]()
(图片来源:AI生成)
在数据库的历史上,有一场著名的辩论。
一方是巴赫曼,网状模型的捍卫者。另一方是埃德加·科德,关系模型的发明者。
科德是IBM的研究员,一个英国人,数学背景深厚。1970年,他在《ACM通讯》上发表了一篇里程碑式的论文——《大型共享数据库的关系模型》。在这篇论文里,科德提出了一个激进的想法:
不要指针,不要导航,不要程序员来决定“怎么走”。
用户只需要告诉计算机“我要什么”——用一套数学化的查询语言,比如SQL。至于怎么去找这些数据、走哪条路最快,那是计算机自己需要解决的问题。
这就像你打一辆出租车。你不需要告诉司机“左转、右转、直行、再左转”,你只需要说“我要去机场”,司机会自己选择路线。
科德的模型,优雅、简洁、数学上干净。它基于集合论和谓词逻辑——两个经过几百年检验的数学分支。
但巴赫曼不同意。
他说:科德的模型在理论上很美,但在实践中太慢了。
1970年代的计算机,内存小得可怜,CPU慢得可笑。科德的“关系查询”需要计算机扫描整张表、做集合运算——在当时的硬件条件下,一个查询可能要跑几个小时。而巴赫曼的网状模型,通过预先定义好的指针,可以直接“跳”到需要的数据——几秒钟就够了。
两个人的辩论,持续了整个1970年代。
他们在学术会议上交锋,在期刊上互相回应,在行业标准委员会里互相说服。科德说巴赫曼的模型太复杂、太难用、太依赖程序员的个人能力。巴赫曼说科德的模型太慢、太浪费、太不切实际。
但值得注意的是:这是一场君子之争。
两个人从未恶语相向。他们尊重彼此,欣赏彼此,甚至在公开场合互相称赞过对方的工作。科德承认巴赫曼的网状模型是“第一个真正的数据库系统”;巴赫曼承认科德的关系模型是“一个优雅的理论突破”。
后来,历史做出了选择。
1980年代,关系数据库开始商业化——Oracle、DB2、SQL Server、Ingres——它们都用了科德的关系模型和SQL语言。到1990年代,网状数据库基本退出了主流市场。
从市场的角度看,科德赢了。
但行业里的人都明白:现代关系数据库系统中许多核心功能,其思想源头都可以追溯到巴赫曼的网状模型。
复杂的查询优化器——本质上是在把关系查询翻译成某种“导航路径”,就像巴赫曼的程序员手动做的那样。
事务管理和ACID特性——巴赫曼的IDS早就实现了。
参照完整性约束——确保一个记录指向的另一个记录确实存在——这是网状模型指针系统的自然延伸。
甚至连今天最热门的图数据库——Neo4j、Amazon Neptune、JanusGraph——它们在骨子里都是网状模型的后代。节点就是记录,关系就是指针,遍历就是导航。
巴赫曼没有赢,但他也没有输。
他只是用一种更朴素的方式,进入了每一个数据库的血液里。
2003年,有人问巴赫曼:“你后悔吗?后悔没有坚持把网状模型变成行业标准?”
他想了一会儿,说:
“不后悔。科德是对的——关系模型更简单、更易用。我只是希望人们记住:简单的东西,往往建立在复杂的东西之上。没有我们这些修路的,后来的开车的人,哪来的路呢?”
八、人工智能到来之前
现在,让我们把目光转向这篇文章的核心——巴赫曼与人工智能的隐秘关联。
巴赫曼的职业生涯,与人工智能的第一波浪潮大致重合。
1950年代到1970年代,是符号主义AI的黄金时代。科学家们相信:智能的本质是符号操作——你给计算机足够多的规则和事实,它就能推理出新的知识。
这些“事实”是什么?是数据。
这些“规则”是什么?也是数据。
无论是早期的逻辑推理程序(如纽厄尔和西蒙的“逻辑理论家”),还是后来的专家系统(如费根鲍姆的DENDRAL),它们都需要一个地方来存储事实和规则——一个库,一个仓库,一个数据库。
而当时世界上最好的数据库,就是巴赫曼的IDS和它的后继者。
你可能不知道的是,第一个被用于人工智能项目的数据库管理系统,就是巴赫曼的IDS。
1970年代中期,斯坦福大学的MYCIN专家系统——一个可以诊断血液感染的著名AI程序——就运行在一个类网状数据库上。虽然MYCIN没有直接用IDS,但它的数据组织方式,完全遵循了巴赫曼DBTG报告中的规范。
巴赫曼本人对人工智能的态度,既不是狂热,也不是排斥。他是一种温和的旁观者。
他曾经在一次访谈中说:
“人工智能很有趣。但在我看来,与其试图让机器‘思考’,不如先让它们‘记住’。一个没有记忆的智能,就像一条没有水的河。你可以叫它任何名字,但它不是河。”
这句话,后来被很多人引用。
它道出了一个朴素的真理:智能离不开记忆,记忆离不开数据,数据离不开管理。
你可以训练世界上最大的神经网络,给它最先进的GPU,最聪明的算法——但如果你的数据是乱的、脏的、彼此矛盾、无处可寻,你的模型什么也学不到。
巴赫曼提供的,恰恰是数据管理的“底层操作系统”。
他不是那个在聚光灯下教机器“思考”的人。他是那个在无人注意的地下室里,替所有机器打好“地基”的人。
九、当数据成为燃料
快进到今天。
人工智能——特别是深度学习——已经改变了世界。而它的核心,是一个简单的公式:
更多的数据 + 更大的模型 + 更强的算力 = 更好的智能。
这个公式的每一个因子,都和数据库技术有关。
更多的数据:你需要一个地方来存储TB级甚至PB级的数据。你需要知道数据在哪里、怎么读取、怎么备份、怎么恢复。这是数据库的基本功能。
更大的模型:模型本身也是数据——几亿、几十亿、几千亿个参数,每一个参数都是一个数字。这些数字被存储在什么地方?被怎么组织?被怎么并行读取?这些问题,都可以追溯到巴赫曼时代的数据库设计原则。
更强的算力:算力只有在数据被高效地喂给GPU时才有用。如果你的数据加载速度跟不上计算速度,再强的GPU也得闲置。而数据加载的效率,取决于底层数据管理系统——取决于索引、取决于缓存、取决于存储布局——所有这些,巴赫曼在1960年代就已经思考过。
你可能觉得我把巴赫曼拔得太高了。
但请你想想:今天的AI数据管道,本质上是在做一件什么事?
它是在把非结构化的数据——文字、图片、声音、视频——转化成结构化的数据——向量、嵌入、特征、标签。然后把这些结构化数据,存放到某种数据库里。然后在需要的时候,快速地把它们找出来。
这个过程,就是巴赫曼所说的导航。
只不过,今天的导航员不再是人类程序员,而是算法本身。模型学会了在数据空间中自己找到路——就像AlphaGo在棋盘上找到胜率最高的落子一样。
但路本身,是巴赫曼和后来者们修好的。
没有路,就没有导航。
十、沉默的晚年,不灭的灯
![]()
(图片来源:AI生成)
1980年代,巴赫曼渐渐淡出了数据库的主流舞台。
不是因为他被淘汰了,而是因为他主动选择了退场。他说:
“一个领域成熟之后,需要的就不是先驱了,而是工程师和商人。我已经完成了我的使命。”
他没有停留在过去的荣光里。
60岁的时候,他做了一件让很多人惊讶的事:他离开了数据库领域,转向了一个全新的方向——开放系统互连(OSI)。
这是网络通信的标准,和数据库没有直接关系。他在OSI标准化工作中又投入了十几年,推动不同厂商的计算机能够相互通信。
有人问他:你都功成名就了,为什么还要从头学起?
他说:
“因为好奇心不是一次性的。它是一辈子的事。”
退休之后,他搬到了缅因州,住在海边。
那里有灯塔,有礁石,有潮起潮落。他每天早上起来散步,看海鸥,看渔船,看雾从海面上慢慢升起来。下午在书房里读书——不是计算机书,而是历史、哲学、诗歌。晚上和妻子一起做饭,然后坐在门廊上看星星。
他偶尔接受采访,说话很慢,声音很低,像一个在讲睡前故事的老人。
有人问他:“巴赫曼先生,你觉得自己最大的成就是什么?”
他想了一会儿。
没有说IDS,没有说DBTG,没有说图灵奖。
他说:
“我让数据不再孤独。”
就这么一句话。
采访者愣了一下。然后慢慢收起笔记本,没有再追问。
因为这句话,已经回答了所有的问题。
十一、最后的告别
2017年7月13日,查尔斯·巴赫曼在缅因州的家中安详离世。
九十三岁。
他走的那天,缅因州的海很蓝,风很轻,灯塔依旧亮着。
他走的时候,人工智能已经能下围棋、能开汽车、能翻译一百种语言、能诊断早期癌症。那些他年轻时无法想象的智能,正从数据的海洋里,一点一点浮现出来。
ChatGPT还要再过五年才会诞生,GPT-4还要再过六年,Sora还要再过七年。
但所有这一切的底层——那些被存储在云服务器上的PB级数据、那些被精心组织的数据表、那些被快速导航的查询——它们的祖先,都可以追溯到1963年的那个冬天,在通用电气的实验室里,巴赫曼写下第一行代码的那一刻。
他大概会笑一笑。
像一个在退潮后的沙滩上,默默修好堤坝的老人。浪来了,又退。浪来了,又退。他不知道将来会游过来什么样的鱼,但他知道——水不会跑了。
堤坝在,岸在,数据就不会流浪。
十二、尾声
![]()
(图片来源:AI生成)
巴赫曼去世后,ACM(美国计算机协会)发表了一份悼词。
悼词的最后一段是这样写的:
“查尔斯·巴赫曼不属于任何一个流行词汇。他不属于‘人工智能’,不属于‘大数据’,不属于‘云计算’。但他属于这一切的底层。他是地基,是岸,是那个在你出生之前就已经把路修好的人。我们走在上面,从不觉得颠簸——因为他的工作,做得太好了。”
我想,这大概是对他最准确的评价。
他不是那个在聚光灯下接受欢呼的人。他的名字不会出现在教科书的海报上,不会出现在科技媒体的头条里,不会出现在年轻人的T恤上。
但他一直在那里。
在每一行SQL语句的背后,在每一个数据库索引的结构里,在每一次数据查询的路径规划中。
像一个沉默的守夜人。
灯不亮,但你一直在光里。
尾声之后:给每一位读到这里的你
如果你觉得这个故事有点远,没关系。
下次当你对着手机说“嘿 Siri”的时候,下次当你看到AI生成的文字的时候,下次当你的导航软件避开拥堵路段的时候,下次当你收到一条精准的商品推荐的时候,下次当你的银行识别出异常交易并冻结账户的时候——
你不一定要想起查尔斯·巴赫曼这个名字。
你甚至不需要知道IDS是什么、DBTG报告是什么、网状模型是什么。
但你或许可以想起一件事:
在这一切发生之前,在人工智能还是一个遥远的梦的时候,有一个人,用了半辈子的时间,替所有的数据,修好了第一条可以通行的路。
他不在算法里,不在芯片里,不在任何一行你读得懂的代码里。
他在那些代码的底层,在那些看不见的关联里,在每一张数据表的结构深处,在每一次数据的迁徙与重逢中。
像一个沉默的守夜人。
灯不亮,但你一直在光里。
“在数据还未成海时,他便修好了岸。在智能还未醒来时,他便点亮了灯。他不写诗,但他的代码让数据有了韵律。他不航海,但他的罗盘让程序员不再迷路。
献给查尔斯·巴赫曼——那个让数据不再孤独的人,那个在数字荒原上种下第一棵树的人,那个我们每天都在使用、却很少想起的人。”
02. 我的思考与感受
读完巴赫曼的故事,我忽然意识到一件事:我们这代人,习惯了享用技术的果实,却很少去看一看树根。
每一次对着手机说话、每一次看到AI生成的诗句、每一次导航精准地避开拥堵——我们赞叹算法的精妙,惊叹算力的澎湃,却几乎从不会想起:在这一切的最底层,有一个叫巴赫曼的人,在六十年前就替所有的数据,修好了第一条可以通行的路。
他让我感动的地方在于,他做了一件“不性感”的事。
数据库管理——听起来多么枯燥啊。没有炫酷的界面,没有激动人心的演示,没有“让机器思考”的宏大叙事。它只是在处理一些琐碎的、底层的、看不见的问题:数据怎么存?怎么找?怎么不丢?怎么不打架?
但正是这些“不性感”的问题,构成了智能的地基。
巴赫曼像那个在教堂底下砌石头的人。没有人会抬头看他,没有人会为他鼓掌,但如果没有他砌的那些石头,穹顶再漂亮,也会塌。
他让我重新理解了“伟大”这个词。
伟大,不一定是站在聚光灯下接受万众欢呼。伟大,也可以是安静地坐在机房里,听着磁带机嗡嗡的响声,一行一行地写代码,把一个没有人觉得是问题的问题——数据太孤独了——当成自己一生的事业。
他修好了岸,然后浪就来了。
人工智能是浪,大数据是浪,云计算是浪。浪花越涌越高,越涌越绚烂。但岸,还是那个岸。
巴赫曼走的时候,人工智能已经能下棋、能画画、能写诗。他不知道ChatGPT,不知道GPT-4,不知道Sora。但他知道一件事:数据不再孤独了。
这就够了。
我想,这就是一种温柔又高级的人生——不是被所有人记住,而是被所有人使用。你叫不出他的名字,但你每天都在他修好的路上行走。
这大概是最安静的伟大。
03. 本期提问
如果人工智能有一天真的拥有了自我意识,当它回望自己的来处——那些算法、那些模型、那些芯片——它会记得,在一切的起点,是一个叫查尔斯·巴赫曼的人,先让它学会了如何记住这个世界吗?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.