网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

Uber把数据延迟砍到分钟级，工程师却头疼起"小文件灾难"

2026-03-30 15:18:07　来源: 赛博兰博

北京举报

0

分享至

数据分析师等数据上线的心情，大概像等外卖——你明知道它在路上，但刷新页面一百遍也看不到进度条。Uber的工程师大概被催烦了，干脆把"小时级"的等待改成了"分钟级"送达。

他们重构了一套叫IngestionNext的系统，核心思路是把数据新鲜度当成数据质量的一部分来伺候。以前是定时批处理，像食堂开饭，到点才出餐；现在改成流式优先，Kafka接进来，Flink处理完，写进Hudi表，整个过程像回转寿司，来了就处理，不停转。

这套系统要扛住全球几千个数据集的海量数据，还得保证分区倾斜、故障恢复这些分布式老问题不出岔子。工程师做了检查点机制，跟踪数据流的偏移量，万一崩了能从断点续传，不至于让用户重新下单。

但流式架构有个经典副作用：小文件爆炸。想象一下，每分钟都在往硬盘里塞新文件，查询时硬盘磁头得跑马拉松。Uber的解法是做行组级合并，加上压缩机制，相当于把零散便签纸整理成装订好的笔记本。

资源效率倒是意外之喜——持续运行的流式作业比定时批处理省了约25%的计算量。毕竟，批处理像每天叫一次专车，流式像顺路的顺风车，运力利用率自然不同。

不过工程师也留了后路：下游的转换和分析管道还没完全实时化，新鲜度的提升目前只卡在"原材料"环节。按他们的说法，未来要把流式能力铺到整个数据处理栈，不然分析报表还是会慢半拍。

一位Uber工程师在博客评论区提到，迁移过程中最耗时的不是技术实现，而是说服团队接受"持续运行"比"定时跑批"更可控——这种信任建立，比调参数难多了。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

破防！雷军15小时京沪续航自证清白，恳求全网帮帮小米

雷科技 2026-04-18 12:38:28
3115 跟贴 3115
龙虾之战进入深水区，产品完成度是下一个赛点

钛媒体APP 2026-04-18 08:48:14
0 跟贴 0

马斯克来抖音卖老干妈了?

量子位 2026-04-19 12:48:21
14 跟贴 14

工程师不会的东西，被恋爱脑研究出来，好一个自欺欺人！

栓Q笑料集 2026-04-16 13:57:56
1 跟贴 1
尼泊尔娜娜见到工程师又开心地笑了，两人一起给菜搭架子

野食超哥在尼泊尔 2026-04-17 05:30:00
35 跟贴 35

具身智能的数据难题，终于有了可规模化的解法

量子位 2025-12-18 14:13:03
0 跟贴 0

荣耀机器人包揽半马前三工程师回应

新京报 2026-04-19 12:25:11
3629 跟贴 3629
Codex产品负责人：小型团队不再需要PM，招了就危险了

智东西 2026-04-19 15:43:09
2 跟贴 2

EmbodiChain开源，用100%生成式数据自动训练具身智能模型

机器之心Pro 2026-01-20 15:49:43
0 跟贴 0
懒动手当不了工程师

浪人爱追剧 2026-04-15 11:35:09
0 跟贴 0
基于ASPP-Swin Transformer模型的加密流量识别方法

通信世界 2025-10-28 11:31:02
0 跟贴 0
这个152星项目，把PPT工程师逼到墙角

我是一个养虾人 2026-04-19 12:00:03
0 跟贴 0
同事.skill，被严重神话了！

周鸿祎 2026-04-15 13:59:10
0 跟贴 0
格陵兰海岸遭海啸侵袭的可怕现场，巨浪涌上海岸的瞬间，势不可挡

我很乖 2026-04-18 04:39:37
0 跟贴 0
48岁以军准尉被炸死，还是关键工程师！这下真是重大损失了

战风 2026-04-19 15:26:44
1 跟贴 1
机器人操练测试时工程师在后面费脑又费腿网友：没想到程序员还是个体力活

重庆城市TV 2026-04-18 14:45:13
13 跟贴 13
工程师租8张H100复现mHC架构，数据反超原论文

量子位 2026-01-30 03:29:45
0 跟贴 0
新疆沙尘暴，两位美女说还好没把她刮跑

浅海 2026-04-19 03:52:43
0 跟贴 0
华为的工程师到底有多牛？这么先进的技术，必须卡老美脖子

太阳花搞笑 2026-04-18 11:42:35
0 跟贴 0
“行走的50万”真实上演！司机抢手机留证据，间谍当场被控制！

主持人老李 2026-04-16 16:07:51
0 跟贴 0
土五代机提前两年交付，巴200名工程师参与，2026年接收

倔强到自私 2026-04-19 17:04:27
0 跟贴 0
所有人紧跟师姐步伐，科技下一站

七七呼呼睡大觉 2026-04-19 19:53:18
0 跟贴 0
流式3D重建天花板，被国产开源模型打破了-3

机器之心Pro 2026-04-16 14:04:17
0 跟贴 0
工厂为逃避取证而导致爆炸，年轻工程师丧命于此

神女混剪 2026-04-19 11:17:59
1 跟贴 1
1960年代精巧绘图工具套装，工程师的心头好物

装甲铲史官 2026-03-12 10:35:44
0 跟贴 0
农村竹林里的竹白霜，你了解它的价值吗

拳击格斗大放送 2026-04-17 10:14:09
5 跟贴 5
阵雨、雷阵雨！商丘启动重大气象灾害（大风、强对流）Ⅳ级应急响应

商丘交通广播 2026-04-19 18:48:53
0 跟贴 0
法国的火山喷发岩浆，蔓延到公路旁边，还以为远古巨兽要来！

搞笑小河马 2026-04-19 14:43:39
1 跟贴 1
北约30国驻布鲁塞尔大使集体访日日本外务省：罕见

参考消息 2026-04-18 17:59:50
29942 跟贴 29942
“娘家拆迁分不到钱，母寿宴我不参加，弟弟竟带神秘文件来！”

仁雨兰 2026-04-18 09:22:31
0 跟贴 0
实拍新疆沙尘暴：天地变色，宛如末日降临

热点侠 2026-04-18 18:50:10
0 跟贴 0
一国可敌全球，中国数据相比其他国家就是bug

小信新鲜事 2026-04-16 01:10:46
0 跟贴 0
湖南省应急委办：4月19日晚至21日有一次暴雨强对流过程，需防范次生灾害风险

潇湘晨报 2026-04-19 20:06:10
0 跟贴 0
Opus 4.7重新登顶榜单，但强得多的GPT-5.5极大概率下周就发

新智元 2026-04-19 19:05:24
0 跟贴 0
拉拉秧是绝佳的羊饲料，尤其是秋天带种子的，我爸最爱割这个喂羊

欢乐聚集部 2026-04-19 11:35:48
1 跟贴 1
这土豆长得真好

我是汪汪妹 2026-04-15 10:07:50
1 跟贴 1
网约车和罐车碰撞，罐车你除了弄我一脸口水，还会干什么！

女神搞笑记录 2026-04-18 16:12:14
18 跟贴 18
腾讯会议这波 AI 功能，让我彻底戒掉了整理焦虑

爱范儿 2026-04-02 19:57:25
0 跟贴 0
出租车以为下雨天能接到很多单，没想到客人全选了网约车

锐眼新闻 2026-04-18 16:10:22
16 跟贴 16
中国全力追赶，印度将军称福建航母落后10年电磁弹射技术

赶山的姑娘 2026-04-18 15:53:35
0 跟贴 0

打捞一艘沉船，花掉三亿人民币？打开船舱后，所有人都懵了！

打捞一艘沉船，花掉三亿人民币？打开船舱后，所有人都懵了！

章荳解说体育

2026-04-19 14:59:44

拜仁宣布格纳布里噩耗

绿茵情报局

2026-04-19 03:18:30

斯诺克赛程：决出4席16强，丁俊晖首秀，中国4人出场，75双雄上阵

斯诺克赛程：决出4席16强，丁俊晖首秀，中国4人出场，75双雄上阵

刘姚尧的文字城堡

2026-04-19 07:44:16

卡帅神了！1-0通杀英超4强队+前五稳了，曼联还不让他转正欺负人

卡帅神了！1-0通杀英超4强队+前五稳了，曼联还不让他转正欺负人

体育知多少

2026-04-19 07:38:28

曝王思聪近况：暴瘦脱相秃顶脱发，拒付200万后，黄一鸣频繁发声

曝王思聪近况：暴瘦脱相秃顶脱发，拒付200万后，黄一鸣频繁发声

东方不败然多多

2026-04-18 15:31:29

四艘中资超级油轮顺利通过美军封锁区引发强烈冲击

四艘中资超级油轮顺利通过美军封锁区引发强烈冲击

阿尔法34号

2026-04-19 07:04:28

狂降16℃！中雨大雨马上到武汉，还有8级大风……紧急提醒：及时关窗

狂降16℃！中雨大雨马上到武汉，还有8级大风……紧急提醒：及时关窗

极目新闻

2026-04-19 14:06:31

康凯：把“张飞”演成傻子，无戏可拍11年，如今现状令人唏嘘

康凯：把“张飞”演成傻子，无戏可拍11年，如今现状令人唏嘘

流云随风去远方

2026-04-18 15:35:50

演员何润东回应穿项羽铠甲亮相苏超：14年后受邀过来，内心满是感动，等下去逛项王故里

演员何润东回应穿项羽铠甲亮相苏超：14年后受邀过来，内心满是感动，等下去逛项王故里

极目新闻

2026-04-19 10:17:37

特朗普称美伊20日将在伊斯兰堡举行谈判

特朗普称美伊20日将在伊斯兰堡举行谈判

新京报

2026-04-19 20:30:05

广东清远一公园水域两名小孩和救人者均溺水，男子连救三人，当事人：作为父亲，不忍心看到这样的意外发生，没想太多只是本能施救

广东清远一公园水域两名小孩和救人者均溺水，男子连救三人，当事人：作为父亲，不忍心看到这样的意外发生，没想太多只是本能施救

大象新闻

2026-04-19 15:43:19

人到中年，老婆的作用很关键

微微热评

2026-04-18 20:02:27

广东队三消息：徐杰病情、杜锋下课、季后赛对手已确定

广东队三消息：徐杰病情、杜锋下课、季后赛对手已确定

逗比演员说体育

2026-04-19 17:43:58

想远离癌症，先管住嘴！肿瘤科医生内部的“忌口清单”，很多人天天吃

想远离癌症，先管住嘴！肿瘤科医生内部的“忌口清单”，很多人天天吃

环球网资讯

2026-04-18 17:59:25

停止焦虑最好的办法，不是读书，不是运动，而是……

停止焦虑最好的办法，不是读书，不是运动，而是……

壹心理

2026-04-19 11:03:36

太炸裂！荷兰阿森赛道排名垫底，张雪机车最后一分钟超车，太牛逼

太炸裂！荷兰阿森赛道排名垫底，张雪机车最后一分钟超车，太牛逼

林子说事

2026-04-19 07:44:53

尹正自曝把摩托车全卖了：“车牌涨价了，赚翻了，我爱摩托车”

尹正自曝把摩托车全卖了：“车牌涨价了，赚翻了，我爱摩托车”

悦君兮君不知

2026-04-18 22:21:30

超百万兵力集结，美伊总决战在即？中国态度已明确，和美奉陪到底

超百万兵力集结，美伊总决战在即？中国态度已明确，和美奉陪到底

无情有思ss

2026-04-17 01:20:47

日本在野党无一支持率达到3%

天真无牙

2026-04-19 19:08:49

蔡磊妻子段睿半夜悲痛发文：明知没有机会了，偏要赌他会等我回来

蔡磊妻子段睿半夜悲痛发文：明知没有机会了，偏要赌他会等我回来

乐天闲聊

2026-04-19 07:05:22

专注捣鼓AI效率工具，试图在这个时代留下数字分身的探索者。

1543文章数 18关注度

往期回顾全部

科技要闻

50分26秒破人类纪录！300台机器人狂飙半马

头条要闻

半年下沉22厘米女子家中坐拥价值上亿别墅却没法住人

头条要闻

半年下沉22厘米女子家中坐拥价值上亿别墅却没法住人

体育要闻

湖人1比0火箭：老詹比乌度卡像教练

娱乐要闻

张天爱评论区沦陷！被曝卷入小三风波

财经要闻

华谊兄弟，8年亏光85亿

汽车要闻

29分钟大定破万极氪8X为什么这么多人买？

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

数码

亲子

时尚

公开课

本地新闻

12吨巧克力有难，全网化身超级侦探添乱

数码要闻

何刚晒华为WATCH FIT 5 Pro手表真机，明日亮相

亲子要闻

也不晓得哪里学来的

装修“精神角落”，就是这么上瘾

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版