网易首页 > 网易号 > 正文 申请入驻

数据库年度报告:回望 2021

0
分享至

  来源 | 公众号:Bytebase

  作者|Andy Pavlo

  数据库产业经历了爆发式增长的一年。在这一年里,数据库产业后浪推前浪,厂商围绕性能测试结果展开角逐,更有一轮又一轮额度惊人的融资。同时,在经历了一系列并购、破产和退出之后,我们也不得不同一些熟悉的数据库告别。

  年关将至,在正式进入2022年之前,这些事件也值得我们做一次盘点、总结与反思。以下是部分要点事件。关于它们在数据库领域的意义,我做的一些思考。

  PostgreSQL 的统治力

  开发者的习惯已经转变,PostgreSQL 成了新应用的首选。它可靠性高,功能丰富且依然在持续完善中。2010年,PostgreSQL 的开发团队转而采用了更为激进的发布策略,每年进行一次大的版本更新 (感谢 Tomas Vondra )。当然 PostgreSQL 还是开源项目。

  如今很多系统都把 兼容 PostgreSQL 作为差异化竞争力。这种兼容性是通过支持 PostgreSQL 的 SQL 方言 ( DuckDB ),传输协议 ( QuestDB , HyPer ),或者整个 Server 层前端 ( Amazon Aurora , YugaByte , Yellowbrick ) 来实现的。重量级玩家也已经入局。十月,谷歌宣布 在 Cloud Spanner 中兼容 PostgreSQL 。同样是在十月,Amazon 宣布了 Babelfish 的功能,它可以转换 SQL Server 的查询,用于 Aurora PostgreSQL。

  DB-Engines 排行榜 是衡量数据库流行度的标尺。这份排行不是十全十美的,评分也带有主观色彩。但它评选出的前十名还是基本合理的。排行榜显示,截止到2021年12月,PostgreSQL 在最受欢迎的数据库中仍旧位列第四,排在 Oracle 、MySQL 和 MSSQL 之后。不过,在过去一年里它与 MSSQL 之间的差距已经缩小了。

  另一个值得思考的点是 PostgreSQL 在线上社区中被提及的频次。这为我们提供了另一种视角,让我们窥见当人们讨论数据库时他们究竟在讨论什么。我下载了2021年度 Reddit 中 Database 板块 上的所有评论,并清点了各个数据库名称在其中出现的频次 (当然我是用 PostgreSQL 做这项工作的)。我从我的 Database of Databases 中交叉引用了我了解的所有数据库的列表,对缩写做了清洗(例如, Postgres → PostgreSQL, Mongo → MongoDB, ES → Elasticsearch),最后计算出了十个最常被提及的 DBMS:

  当然这张排名表没那么科学,因为我没有对这些评论做情感分析。然而,它确实清晰地展现出,在过去一年里,相较于其他数据库,PostgreSQL 被人们提及的频次要更多。经常有开发者发帖询问该选择哪一个 DBMS 来开发新应用。社区成员对此的回答几乎总是 PostgreSQL。

  Andy 观点

  先要说明,一个关系型数据库成为待开发应用的首选是件好事。这说明 Tedd Codd 的关系模型自上世纪七十年代长盛不衰。其次,PostgreSQL 是个伟大的数据库系统。当然,和其他所有 DBMS 一样,它也有各种已知和未知的问题。但 PostgreSQL 已经赢得了如此之多的注意,人们也在其上灌注了许多精力。在这两点的加持下,它只会发展地越来越好。

  性能测试乱战

  这一年,各个数据库厂商对性能测试结果的热爱没有丝毫消退。从上个世纪八十年代起,它们就试图证明自己的数据库系统要快于竞争对手的产品。 TPC 就是在这一背景下建立的。它为数据库间的比较提供了一个客观公允的平台。 但在过去十年间,TPC 的影响力逐渐消退 ,普及度渐渐下降。于是如今,我们又被卷入了新一轮的数据库性能测试大战中。

  这一年,围绕性能测试结果展开了三场激烈争斗。

  Databricks vs.Snowflake

  Databricks 宣布他们的新 Photon SQL 引擎 在100TB TPC-DS 上创下了新的世界纪录 。Snowflake 随即回击,声称自己的数据库要 二倍于这个速度 ,而且 Databricks 没有正确运行 Snowflake。 Databricks 予以反击 ,宣称他们的 SQL 引擎有着最佳的执行效率,性价比也高于 Snowflake。

  Rockset vs.Apache Druid vs.ClickHouse

  ClickHouse 跳了进来 ,表示自己在成本效率上完胜 Druid 和 Rockset。但先别急: 作为回应,Imply 对 Druid 的新版本进行了一系列测试,并宣告了胜利。 Rockset 插进来 ,声称自家产品在实时分析方面的表现要优于另外两家。

  ClickHouse vs.TimescaleDB

  Timescale 嗅到了血腥气,下场参战 。他们发布了自己的性能测试结果,逮到机会指出了 ClickHouse 技术上存在的弱点。有关第三方性能测试的讨论 成了 Hacker News 的热门 。

  Andy 观点

  在先前的性能测试争夺战里,数据库社区已是血流漂杵 。我承认 我也曾热衷于此 。但在争吵中我失去了很多朋友。有一次,我甚至因为乱七八糟的性能测试结果和女朋友分了手。年岁渐长之后,我可以说这一切都不值得。现如今,要在不同的系统之间做对比变得更加困难。因为云 DBMS 有许多可变的部分和可调节的选项。所以,要断定表现差异背后的真实原因通常会很困难。真实场景下的应用也不仅仅是在一遍又一遍地执行同一条指令。录入、变换和清洗数据时的用户体验和干巴巴的性能测试结果同等重要。正如我 在此文中和采访者谈论 Databricks 的性能测试结果 时说的那样,只有老古董才会在意 TPC 官方数据。

  大数据,大投资

  从2020年下半年开始,额度超过1亿美元的融资轮数一直在平稳增长。2020年共有327次这种大额融资。这占据了近半风险投资总交易额。在2021年1月,一亿美元以上的 风投轮数已经过百 。

  2021年,许多投资都流向了数据库公司。在事务型数据库领域,CockroachDB 领跑募资大赛。CockroachDB 开年即进行了一轮 1.6亿美元的融资 ,并 在2021年12月募资高达2.78亿美元 ,为这一年画上句号。Yugabyte 则完成了 1.88亿美元的C轮融资 。作为 Vitess 的托管版本,PlanetScale 开启了 2000万美元的B轮融资 。NoSQL 的拥趸,相对较老的 DataStax 也 在一轮风投中为他的 Cassandra 生意募集到了3760万美元 。

  这些数字已经很让人印象深刻了,然而分析型数据库的市场甚至要更加火热。2021年9月,TileDB 完成了一轮融资, 未透露具体金额 。Vectorized.io 为他们兼容 Kafka 的流式平台 募集到了1500万美元 。StarTree 也走到台前,宣布完成了一轮 2400万美元的融资 ,用以商业化 Apache Pinot。matviews-on-steroids DBMS Materialize 宣布他们 在C轮融资中募集到了6000万美元 。Imply 为基于 Apache Druid 的数据库服务 筹集到了7000万美元 。SingleStore 在2021年 募集到了8000万美元 ,这让他们离 IPO 又近了一步。这一年伊始,Starburst Data 为 Trino 系统(前身是 PrestoSQL) 募集了1亿美元 。另一家走到台前的 DBMS 创业公司 Firebolt 宣布他们为自己基于 ClickHouse 分支的新型云数据仓库 募集到了1.27亿美元 。ClickHouse 募集到了惊人的2.5亿美元 ,用以围绕该系统建立一家新公司,同时也取得了对 Yandex 名下 ClickHouse 这一名称的使用权。

  但今年,当之无愧的融资冠军要属 Databricks。它以在2021年8月 高达16亿美元的融资额 力压群雄。

  Andy 观点

  我们正处在数据库的黄金时代。如今我们有许许多多优秀的选择。投资人正在数据库领域的创业公司中寻求下一个 Snowflake 式的 IPO。这些公司的融资额要远超先前的数据库创业公司。举例来说, 直到D轮融资,Snowflake 的单轮融资额才达到了1亿美元 。此时距它初创已经过去了五年。而 Starburst 在成立的三年内便完成了一轮1亿美元的融资。当然影响融资的因素有很多。比如说,在脱离 TeraData 出来创业之前,Starburst 的团队就已在 Presto 上躬耕多年。但在我看来,现如今有更多的资金正在涌向这一领域。

  纪念堂

  很遗憾,在过去的一年里,我们不得不向几位老朋友说再见。

  ServiceNow 收购了 Swarm64

  这个公司最初的产品是一款 FPGA 加速器,用以在 PostgreSQL 上运行分析任务。之后,他们转向了单纯的软件加速器,为 PostgreSQL 提供插件。但他们缺乏持续发展的动力,尤其是相比其他资金充裕的云数据仓库。在被 ServiceNow 收购后,Swarm64 的产品前景仍不明朗。

  Splice Machine 破产了

  Splice 推行的是一个混合型 DBMS。它结合了针对事务型任务的 HBase 和针对分析的 Spark SQL。他们更进一步推出了服务于操作型/实时机器学习应用的平台。然而,由于专门的 OLTP 和 OLAP 系统的统治地位,这样一个多位一体的混合系统没能在数据库市场开辟出一条道路。

  私募公司收购 Cloudera

  过去五年,MapReduce 和 Hadoop 技术渐渐为潮流所抛弃。因此,Cloudera 也同样失去了在云数据仓库市场发展的动力。 Impala 和 Kudu 的初代工程师团队大多都已经离开公司,尽管这些项目依旧在持续开发并迭代新版本。它的当前股价已经低于2018年 IPO 时的发行价。它的新投资人是否有能力扭转公司局面还有待观望。

  Andy 观点

  看到数据库项目和公司走上下坡路总归让人伤心,但这就是数据库产业内部的厮杀博弈。开源也许能让一款 DBMS 在母公司消失之后也能继续存在,但事实并不总是如此。由于数据库本身的复杂性,它必须要有全职员工进行维护,修正 bug 并添加新功能。不是说把破产 DBMS 的源代码权限和控制交到 Apache 基金会 和 CNCF 这样的开源软件基金会手中,这个项目就会奇迹般复活了。举例来说, 公司破产 后, RethinkDB 被捐赠给了 Linux 基金会 。但从 Github 的各项表现看,它已经死透了(基本没有提交,PR也不并入)。有类似遭遇的还有 DeepDB:它的母公司在倒闭后为它 创立了自己的非盈利基金会 ,但没有人再去维护这个项目了。在下一年里,预计还会有更多的数据库公司因无力与大型云服务商和之前提到的众多资金充裕的创业公司抗衡而走上下坡路。

  野火烧不尽

  对很多人来说,疫情期间是段艰难的时光。在听到了这么多坏消息后,突然有个振奋人心的故事总能让人倍感欣慰。众所周知,甲骨文联合创始人 Larry Ellison 近几年的运气一路下滑。2015年的时候,他气运还不错,那时他是 世界上第五富有的人 。然而人生起起伏伏。到了2018年,Larry 在富豪排行榜上已经 跌到了第十位 。

  但在2021年12月,一切都变了。Larry Ellison 的身家超过了谷歌联合创始人 Larry Page 和 Sergey Brin,重回世界第五富的位置。2021年12月,在公布了超预期的公司收入后,甲骨文的股价经历了过去二十年来的单日第二高涨幅,Larry Ellison 当天挣到了一百六十亿美元 。媒体将这归功于投资人高涨的信心。他们相信甲骨文向云端转变的策略起效了。

  Andy 观点

  我和 Larry 相识已久 。不管对于数据库社区,还是对于全体人类来说,这都是件好事。运气不好滑到世界第十富的时候他可能有点伤心。但我很高兴能看到他走出低谷,重新回到应有的位置上去。

  除了家人,数据库是我生命中最重要的事情。

  我们期望能够引领崭新的一年。数据库是一个有着高度韧性和创新性的行业,我们很高兴能成为其中的一份子。

  END

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陈思诚的《唐探1900》定档了,演员阵容强大,票房剑指60亿

陈思诚的《唐探1900》定档了,演员阵容强大,票房剑指60亿

影视原说a
2024-11-09 10:44:17
中国曾一口气制裁特朗普38名高官,如他们再获任命,中方如何应对

中国曾一口气制裁特朗普38名高官,如他们再获任命,中方如何应对

基斯默默
2024-11-11 00:30:47
希拉里的萝莉岛“挑战”:小李子如何接招,结果竟成“油腻大叔”

希拉里的萝莉岛“挑战”:小李子如何接招,结果竟成“油腻大叔”

欧美八卦圈
2024-10-30 08:30:03
伦纳德宣布缺席余下赛程,哈登及队友深感失望,鲍尔默强硬表态

伦纳德宣布缺席余下赛程,哈登及队友深感失望,鲍尔默强硬表态

福宝谈育
2024-11-10 19:14:55
歼-35A惊艳亮相,性能已完全碾压美军F-35

歼-35A惊艳亮相,性能已完全碾压美军F-35

头条爆料007
2024-11-10 13:51:00
封锁失败?大批武器运抵台湾,国防部说出8个字,对台称呼已变

封锁失败?大批武器运抵台湾,国防部说出8个字,对台称呼已变

世界战事论
2024-11-10 21:06:30
谁应该对姜萍的退学、搬家负责?

谁应该对姜萍的退学、搬家负责?

剑鸣涛声
2024-11-08 11:10:29
俄罗斯军队在库尔斯克地区获重大胜利。

俄罗斯军队在库尔斯克地区获重大胜利。

世界探索者发现
2024-11-10 21:12:39
詹俊:主力阵容完整的话枪手谁都不怕;切尔西破密防办法不多

詹俊:主力阵容完整的话枪手谁都不怕;切尔西破密防办法不多

懂球帝
2024-11-11 02:56:06
林诗栋做到了!单人守全区夺冠,王楚钦五味杂陈,赛后他拥抱王皓

林诗栋做到了!单人守全区夺冠,王楚钦五味杂陈,赛后他拥抱王皓

嘴炮体坛
2024-11-10 23:12:08
谁在造神大谷翔平?

谁在造神大谷翔平?

体育大生意
2024-11-10 10:04:17
主动撤回被查!中信证券摊上事,两名保代保荐项目惨了...

主动撤回被查!中信证券摊上事,两名保代保荐项目惨了...

金石随笔
2024-11-10 00:26:26
合同将取消,内马尔下家3选1,大巴黎冷门,豪门或出手抢签

合同将取消,内马尔下家3选1,大巴黎冷门,豪门或出手抢签

东球弟
2024-11-10 11:02:25
神似河北彩花 偶像歌手 新人「未步奈奈」

神似河北彩花 偶像歌手 新人「未步奈奈」

生活大关注
2024-11-11 02:22:53
61岁韦唯:住纽约豪宅,熬死家暴自己的外国前夫,儿子让她很痛苦

61岁韦唯:住纽约豪宅,熬死家暴自己的外国前夫,儿子让她很痛苦

简读视觉
2024-11-09 17:31:29
突发!这家公司被ST,明日停牌一天!

突发!这家公司被ST,明日停牌一天!

证券时报e公司
2024-11-10 17:36:11
2000亿!中产“鞋王”跌落神坛,沦为奥莱打折品,网友:智商税

2000亿!中产“鞋王”跌落神坛,沦为奥莱打折品,网友:智商税

财经八卦
2024-11-03 18:40:57
重磅消息!证监会:最新发布6大利好!周一:A股必大涨?

重磅消息!证监会:最新发布6大利好!周一:A股必大涨?

云姐财说
2024-11-10 08:59:31
足协压轴禁足令曝光!暗示申花将被处罚,今年错过冠军恐再等多年

足协压轴禁足令曝光!暗示申花将被处罚,今年错过冠军恐再等多年

小金体坛大视野
2024-11-10 19:56:58
美媒:特朗普胜选,乌克兰被迫面对“残酷现实”

美媒:特朗普胜选,乌克兰被迫面对“残酷现实”

参考消息
2024-11-10 13:47:13
2024-11-11 03:42:44
开源中国
开源中国
每天为开发者推送最新技术资讯
6582文章数 34153关注度
往期回顾 全部

科技要闻

"台积电答应美方要求,急于向特朗普证明"

头条要闻

"中国人民的老朋友"时隔7年再次访华 有特殊安排

头条要闻

"中国人民的老朋友"时隔7年再次访华 有特殊安排

体育要闻

骑士11连胜 昔日吃饼男成加强版追梦?

娱乐要闻

叶珂道歉退网!

财经要闻

6万亿后 还将有更多增量财政政策出台

汽车要闻

起售价33.98万 腾势Z9于11月15日广州车展上市

态度原创

艺术
房产
健康
数码
军事航空

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

房产要闻

11.11 超燃购房礼来袭,海口海上大平层,掀桌子了!

花18万治疗阿尔茨海默病,值不值?

数码要闻

M4 Pro芯片MacBook Pro体验:不仅性能进步,而且「性价比」最高

军事要闻

全球首款双座五代战机歼-20S模型亮相 美国曾放弃研发

无障碍浏览 进入关怀版