Nextdoor用8年时间，把1个数据库拆成了7层架构|主库|服务器|应用层|版本化|postgresql

Nextdoor用8年时间，把1个数据库拆成了7层架构

2026-04-07 23:59:19　来源: 固件更新中

北京举报

分享至

2011年，Nextdoor上线时只有1台PostgreSQL服务器。8年后，这套系统演变成了7层架构，连接池、读副本、版本化缓存、后台对账器层层堆叠。这不是炫技，是每次性能提升后，数据一致性逼出来的债。

「Every performance gain introduces a new requirement for data integrity.」Nextdoor工程师在复盘时这句话，道出了分布式系统的铁律。你跑得越快，摔得越疼的风险就越高。

第一阶段：单机的甜蜜与诅咒

创业初期，单机PostgreSQL是标准答案。管理简单，生态成熟，事务支持完善。Nextdoor用一台服务器扛下了所有帖子、评论和社区更新。

但PostgreSQL的进程模型成了隐形天花板。每个连接对应一个独立进程，5000个并发请求就要创建5000个进程。内存和CPU被进程调度本身吃掉，服务器花在上下文切换上的时间超过了执行查询。

垂直扩容（Vertical Scaling）很快触顶——你可以买更大的机器，但连接数的硬上限不会消失。

团队第一次架构调整：引入PgBouncer连接池。这个轻量级中间件把5000个应用连接复用成几百个实际数据库连接，进程开销骤降。但新问题来了：连接池打破了事务的连续性，长事务被切碎，应用层开始出现诡异的数据不一致。

第二阶段：读写分离的幻觉

读多写少的场景，行业通用解法是主从复制。Nextdoor部署了多个读副本（Read Replicas），把查询流量分散出去。

复制延迟（Replication Lag）成了噩梦。用户在主库发帖，刷新页面时请求打到从库，帖子"消失"了。邻居们在评论区吵成一团，「我刚发的寻狗启事呢？」

团队尝试过强制关键读走主库，但这又挤占了主库的宝贵连接。他们给查询加版本号标记，让应用层能识别"足够新鲜"的数据。代码复杂度指数级上升，工程师开始怀念单机的简单。

第三阶段：缓存是把双刃剑

2015年前后，Nextdoor引入Memcached缓解数据库压力。缓存命中时响应飞快，但缓存失效策略成了新的智力游戏。

他们设计了版本化缓存（Versioned Cache）：每条数据带一个逻辑版本号，更新时版本号递增，旧版本自动废弃。这比简单的TTL（生存时间）精确，但实现了一套完整的"缓存-数据库"对账机制。

后台对账器（Background Reconciler）开始全天候运行，比对缓存和数据库的状态差异。这套系统能自动修复不一致，但修复本身又产生延迟窗口。Nextdoor的工程师发现，自己不是在写业务代码，是在写保证业务代码不出错的代码。

第四阶段：分片的代价

用户突破千万级，单表数据量让查询优化器投降。Nextdoor启动了分片（Sharding）改造，按地理位置把邻居数据分布到多个数据库实例。

分片键的选择花了三个月争论。按用户ID？按社区ID？最终选了后者——邻居关系天然地理聚集，跨分片查询最少。但跨社区的用户怎么办？工程师实现了应用层的"联邦查询"，把多个分片结果合并。这本质上是在数据库外面又写了一个查询引擎。

事务边界被切碎。原本一个PostgreSQL事务能搞定的操作，现在需要Saga模式协调多个分片。补偿逻辑、幂等设计、最终一致性，这些概念从论文走进了每日站会。

第五阶段：7层架构的成型

到2019年，Nextdoor的数据库栈长成了这样：应用层 → 智能路由层 → 连接池层 → 缓存层 → 主从复制层 → 分片层 → 存储层。每层都在解决上一层创造的问题。

连接池解决连接数限制，但牺牲了事务语义；读副本解决读压力，但引入了复制延迟；缓存解决热点查询，但需要版本控制和对账；分片解决存储上限，但肢解了事务边界。

「这不是架构设计，是债务重组。」一位参与改造的工程师后来回忆。每次优化都是一笔贷款，利息是系统复杂度。

给后来者的教训

Nextdoor的演进路径几乎可以被预测。任何从单机起步的社交产品，只要活得够久，都会经历类似的阶梯：连接池 → 读写分离 → 缓存层 → 分片 → 多活架构。

真正的决策点在于：你在哪一级阶梯上开始为下一级付利息？是提前设计版本化缓存的埋点，还是等用户投诉后再救火？

Nextdoor团队的选择偏务实——问题驱动，而非蓝图驱动。这让他们的架构有清晰的业务痕迹，而非教科书式的完美分层。代价是工程师需要理解7层之间的微妙交互，新人 onboarding 周期以月计算。

2023年，Nextdoor开始探索将部分工作负载迁移到云原生数据库服务。不是因为这7层架构失败了，而是维护它的成本已经超过了云服务的溢价。这或许是所有自建基础设施的终局：你证明了问题可解，然后把解法托管给更专业的团队。

但那个版本化缓存的设计被保留了下来——它太贴合Nextdoor的业务特性，通用云服务反而给不了这种精细控制。技术债还清了，但定制化资产留下了。

如果你今天从零开始做一个邻里社交产品，会跳过这些阶梯直接上Serverless数据库吗？还是认为亲手踩一遍坑，才能长出真正的工程判断力？

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

Nextdoor用8年时间，把1个数据库拆成了7层架构

第一阶段：单机的甜蜜与诅咒

第二阶段：读写分离的幻觉

第三阶段：缓存是把双刃剑

第四阶段：分片的代价

第五阶段：7层架构的成型

给后来者的教训

满嘴谎言！OpenAI奥特曼黑料大起底

特朗普称美方正就伊朗战争进行“激烈谈判”

特朗普称美方正就伊朗战争进行“激烈谈判”

霸气！赵心童：斯诺克的未来定属于中国 20年后50%选手都是中国人

女首富陈丽华离世 被曝生前已分好遗产

10万亿财政转移支付，被谁拿走了？

不止是大 极狐首款MPV问道V9静态体验

态度原创

6岁女孩确诊性早熟！医生：小心这些“营养品”和“餐具”

120元和120分钟，哪个更奢侈？

荣耀WIN2系列曝光：10000mAh电池+2nm芯片，续航性能双巅峰！

李苦禅这简简几笔，能让你欢快一整天

女首富陈丽华离世被曝生前已分好遗产

不止是大极狐首款MPV问道V9静态体验