![]()
“我们淘宝现在都开始盈利了,为什么2010年还要买小型机?
十多年前,阿里巴巴首席架构师王坚博士这么不经意的一问,像一颗投入湖面的石子,在时任淘宝技术保障部负责人刘振飞心中激起了千层浪。彼时,他刚接过一份预算,其中一项是花费800万采购一台IBM小型机。这在当时的技术圈看来是“标配”,甚至还是颇有性价比的明智之选。
当时,正值中国互联网经济如宇宙膨胀般迅猛增长,淘宝的交易量与数据量正经历指数级攀升。王坚之问的背后是必须要做的产业抉择:如果支撑业务的核心系统--数据库,没有掌握在自己的手中,那么不论是对阿里,还是对中国互联网经济而言,都要面临长期受制于海外巨头的战略风险。
王坚之问就像一把刀子,划开了温室大棚的棚顶,拉开了中国互联网史上波澜壮阔的“去IOE”战役的序幕,也无意间,为中国数据库乃至整个基础软件的自主创新之路,写下了生动的注脚。
时光流转,亲历了国产数据库生死突围的刘振飞,作为北京科技大学的校友站在2025年全国大学生计算机系统能力大赛的现场,看着台上台下充满活力的师弟师妹们,那段激情燃烧的峥嵘岁月,想必会再次涌上心头。
只是这一次,战场已从企业机房转移到了校园赛场
十支队伍会师决赛
北邮夺魁
近日,2025年全国大学生计算机系统能力大赛暨第五届OceanBase数据库大赛在北京科技大学落幕。本届赛事吸引全国高校的1223支队伍、2620名学生参赛。
正如系统能力培养研究专家组成员计卫星教授所指出的,大赛的核心价值在于用 “真实产业问题”牵引教学。这场比赛没有“纸上谈兵”,赛场即战场。
进入到决赛阶段,选手们面对的是与互联网大厂研发团队同等级别的挑战。选手将基于Apache 2.0开源的AI原生混搜数据库OceanBase seekdb,完成两大赛题:一是在有限的硬件资源(8核16G)下,对开源的AI原生数据库OceanBase Seakdb进行内核级调优,目标是让“全文检索+过滤”的混合查询快到极致,同时保证高精度(召回率≥0.95)。二是用自己优化后的数据库,现场搭建一个多模态RAG系统。它不仅要用大模型回答问题,更需要像人一样,具备“思考”与精准检索信息的能力,直击当前AI应用中答案可追溯性与可信度的核心痛点。
在决赛现场,数据猿记者见证了十支队伍的答辩过程。
来自中国数据库领域的专家学者教授和产业界技术专家组成的评委团,与选手展开了技术含量很高的“交锋”。评委们的提问往往直指要害,毫不留情:“当并发请求激增时,你的缓存策略如何避免雪崩?”“你的索引合并算法,在数据持续写入的场景下,性能拐点在哪里?”
能坚持到决赛的队伍,都有着不俗的实力。他们不仅能够沉稳应对这些专业问题,还能偶尔提出让人眼前一亮的创新思路,引得评委频频点头。最终,来自北邮的「编程高手」队凭借其在数据库内核优化与AI应用开发两个维度的综合卓越表现,夺得冠军,并捧回了10万元真金白银的奖金。
![]()
据了解,本届大赛特设人才激励机制:特等奖、一等奖、二等奖及三等奖获得者可获OceanBase招聘“绿色通道”,免线上笔试和初面,直通终面。公开信息显示,自2021年以来,已有160余位学生通过校招加入OceanBase,其中20余人通过OceanBase数据库大赛绿色通道入职,实现了从赛场到产业的“无缝衔接”。
数据库从“记账本”向
“数据赋能平台”演进
在这场竞赛中我们还看到了更深层的东西,华东师范大学数据学院教授、CCF数据库专委会主任周傲英的阐述,为这场竞赛注入了更深层的哲学思辨。
他揭示了人们对数据的认知有了一个深刻转变:数据的意义不仅在于它的大和小,它已经成为生产要素,超越技术的范畴,成为经济、社会的范畴。中国人传统上理解数据,重在“以数为据”,作为决策和问责的依据。既然是依据,原则自然是“越少越好,够用即可”,否则就会陷入“过度留痕”的形式主义。然而,当数据在当今时代被明确为关键“生产要素”时,逻辑发生了根本性的逆转——数据变成了“越多越好”,因为其潜在的价值与创新可能性几乎与规模成正比。
“这一转变,彻底重构了数据库的使命。”周傲英指出。数据库不再仅仅是用于“存钱取钱记账”的核心业务记录系统,它必须演进为能够释放数据要素价值的“数据赋能平台”。这场认知革命,正是大数据和AI浪潮带给数据库领域最根本的冲击。
数据库的发展历程是典型的应用驱动创新:从实际问题出发,构建系统,形成抽象,再升华为理论,从而实现业务、技术与理论三者的协同演进。周傲英回忆,当年大数据概念出现时,数据库领域许多学者和从业者起初是排斥甚至愤怒的,认为从抽象的层次来看这是一种倒退。经过一段时间的反思,他们才逐渐意识到问题所在:过去数据库领域总试图用一个系统解决所有问题,而实际上,不同的应用场景需要不同的系统支撑。
“我们依然在做抽象,但不再追求‘一刀切’,而是针对一类应用,构建最适合它的系统。这或许正是大数据时代给我们上的最重要的一课。”
伴随着认知的革新,数据库技术本身也经历了一场深刻的形态演进。周傲英乐观的认为,数据库在未来将扮演更加重要的角色,其关键在于互联网和人工质量带来的应用大爆发。为应对海量数据与高并发,分布式数据库应运而生;为追求极致的处理速度,并行数据库不断演进;为保证业务不间断,高可用数据库持续发展;为满足实时决策需求,实时数据处理系统蓬勃兴起。这些都不是凭空产生的,而是应用需求与技术能力相互推动、共同进步的结果。
云计算的普及,进一步从底层改变了数据库的部署和使用方式。数据库不再仅仅是独立部署的软件,越来越多的系统设计之初就是基于云原生的。云原生数据库或数据平台的核心使命,正是将数据库技术大众化——通过云服务的方式,降低使用门槛,让每个人、每个组织都能便捷地获取和使用数据能力。这标志着数据库从一个由专业DBA掌控的“高级工具”,真正成为了普适化的基础设施。
他表示,展望前路,中国数据库乃至整个基础软件的发展,必须秉持彻底开放的理念:构建开放的架构,以开源的方式协同推进,并始终保持开明的心态。我们决不能固守过去的任何成功范式,被传统数据库时代的辉煌所束缚。在经历了大数据与AI的剧烈冲击与洗礼后,更应以最大的开放姿态,拥抱这个技术范式迭变的时代。
对此,刘振飞深有共鸣。
一场技术自主自强的接力赛
刘振飞在现场,回顾了阿里巴巴去IOE那段激动人心的历史细节。这些故事今天听起来,依然令人振奋。
他回忆,到了2013年,“去IOE”已经从王坚之问成为了技术团队的共识。那年最关键的任务,是把支付宝的传统商业数据库给替换掉。6月份,第一台小型机正式下线,团队还去机房搞了个小小的仪式。说到这,刘振飞还提到了一个有趣的细节,“有意思的是,负责这件事的很多同学,都很年轻。但正是有了阿里的这个业务战场练手,他们才有机会成长为真正的技术骨干。”
这件事对团队和公司产生了极大的振奋。支付宝当时还发了一条微博作为纪念:“再见,亲爱的小型机”。产业的蝴蝶效应自此开始产生,没多久,IBM中国就传出裁员的消息了。
现在回头看,“去IOE”能做成,有几个关键因素:
一是业务倒逼。当时,淘宝和支付宝的业务量每年翻着倍涨,传统架构根本扛不住,成本也受不了。这是最现实的驱动力。
二是技术信仰。相比较技术能力,更大的挑战在于改变人的观念。在几乎处于空白的领域,有敢于超越国外最先进技术的勇气,是需要一定的信仰支撑的。
三是用时间换空间。不要一开始就动核心交易系统,从边缘业务做起,做出标杆,树立信心,再逐步推进。
四是时代给了机会。那几年,PC服务器性能快速提升,SSD硬盘开始普及,开源生态日渐成熟,让我们有了“换道”的可能性。
五是双11这个“练兵场”。每年双11的流量洪峰,逼着技术系统快速迭代。2010年,淘宝一秒只能处理400笔订单,支付宝一秒处理200笔;到了2018年,这个数字变成了几十万笔。没有自主技术,根本不可能实现。
![]()
“去年我看到Oracle创始人拉里·埃里森的一次采访,他说:‘我们不能让中国培养出比美国还多的工程师。’”刘振飞坦言,“这句话听起来带有竞争色彩,但反而让我更坚信,我们这条路走对了。真正的技术自主,不是关起门来搞发明,而是在中国这片拥有世界上最复杂、最宏大应用场景的土地上,解决真实世界提出的难题,并在过程中锤炼出一支能打硬仗的队伍。”
他最后引用了恩格斯说过一句话:社会一旦有技术上的需要,这种需要就会比十所大学更能把科学推向前进。
从王坚那句石破天惊的叩问,到如今上万名大学生的技术竞赛。数据库自主自强的这条路,始于强烈而真实的应用需求,兴于开放协同的开源生态,成于一代代技术人的接续奋斗。而这场发生在校园与产业之间的接力,正是这条路上最富活力、也最具希望的风景。
就像今天这场竞赛,从校园到产业的距离,其实并不远。那些在数据库自主创新道路上,刻下丰碑的人,很多也都是刚褪去校园的稚嫩,在时代需求和产业革命的历史机遇下,走上了前台。
大会现场,评委们严格发问的场景,恍惚间让人产生一些联想。有时候,改变历史的,可能就是一个正确的问题,在正确的时间,被正确的人提了出来。
从未来回看今天,决赛现场的一些发问,也许已经在某些同学心中激荡起了涟漪。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.