网易首页 > 网易号 > 正文 申请入驻

谷歌工程师把内存延迟砍了93%,代价是系统得"精神分裂"

0
分享至


200纳秒的停顿,在现代CPU眼里等于1000个周期无所事事。这不是什么新发现——DRAM的刷新瓶颈从1960年代就存在,半个多世纪没人彻底解决。直到一个YouTube博主兼谷歌安全研究员决定动手。

LaurieWired的方案叫TailSlayer,核心逻辑简单粗暴:同一份内存请求发两次,赌至少有一次能绕过刷新周期。

这种"对冲式访问"听着像赌徒的数学,实测却能把最坏情况延迟从200纳秒压到14纳秒——93%的降幅。代价?你的内存带宽直接腰斩,CPU缓存被暴力冲刷,整个系统进入一种"明知浪费算力但不得不浪费"的偏执状态。

为什么DRAM非要刷新

DRAM的存储单元本质上是微型电容,漏电速度按设计就是快的。不持续充电,数据几毫秒就蒸发。所以刷新周期以微秒为单位循环,每秒数百次,比你眨眼频率高三个数量级。

刷新和内存访问不同步。CPU请求数据时,恰好撞上电容充电的概率不高,但绝非为零。一旦撞上,请求排队等刷新完成——这就是"尾延迟"(tail latency)的来源,那些让实时系统崩溃的极端情况。

普通用户无感知。浏览器多等0.2微秒?视频渲染卡一帧?现代系统的缓存层级、预取算法、乱序执行早就把这类抖动抹平了。但高频交易、自动驾驶决策、工业控制这些场景,单次延迟 spike 可能意味着真金白银或人身安全。

LaurieWired在视频里没明说动机,只提了一句「it was interesting」。熟悉她频道的人都知道,这位前微软安全工程师的"有趣"标准,通常是普通人眼中的"偏执"。

预测刷新?硬件根本不给接口

她的第一版思路很直接:算出刷新周期,提前避开。

但DRAM控制器是黑箱。刷新间隔由内存条上的温度传感器动态调整,高温时加密、低温时放宽,没有标准寄存器暴露这个信息。操作系统只能看到"内存子系统",看不到电容的充电时间表。

她试过侧信道攻击——通过精确计时内存访问,反推刷新规律。理论上可行,实际噪音太大。现代CPU的缓存、分支预测、中断处理都在干扰时间测量,信号淹没在噪声里。

「You can't synchronize with what you can't see,」她在视频里摊手。这句话的潜台词是:如果硬件不合作,软件层面的优化天花板肉眼可见。

对冲策略:用浪费换确定性

TailSlayer的转向发生在她放弃"预测"之后。既然不知道刷新何时发生,那就让两次请求的时间差大于最坏情况刷新周期——通常64微秒。数学上,两次都撞上的概率平方级下降。

实现方式粗暴:同一份数据发两个读请求,先到者胜出,后到者丢弃。内存带宽直接翻倍消耗,但延迟分布的尾部被切掉了。

实测数据来自她自写的微基准测试。单线程顺序读取,最坏情况延迟从约200纳秒降至14纳秒。作为对照,平均延迟从80纳秒涨到120纳秒——对冲的开销摊在每一次访问上,但极端情况被锁死。

她用了个类比:「就像寄两份快递到同一地址,选先到的那个。运费翻倍,但你能向客户承诺'绝不超过X天'。」

这个承诺的价值,取决于你的业务是否为延迟方差买单。

代价清单:不只是带宽

带宽翻倍是最显性的成本。更隐蔽的是缓存污染。

现代CPU的预取器假设访问模式有规律,会主动加载"接下来可能需要"的数据。TailSlayer的双发请求打乱了这个假设——预取器看到两次相同的内存地址,逻辑混乱,要么重复预取,要么误判为随机访问而关闭优化。

她在Intel Core i9-13900K上测试,L3缓存命中率从94%跌至71%。部分工作负载因此反而变慢,即使尾延迟改善了。

另一个问题是写操作的复杂性。读请求可以"先发先至",写请求必须保证顺序一致性。她的原型目前只处理读,写的对冲需要更重的同步机制,可能抵消延迟收益。

功耗数字她没测,但不难估算:内存控制器活跃度翻倍,DRAM颗粒持续高负载,整机功耗上浮15-20%是合理推测。对于数据中心,这直接换算成电费账单和散热压力。

谁真的需要这个

高频交易是典型场景。某头部量化基金的内部技术文档曾泄露过一个数字:延迟每降低1微秒,年化收益提升约0.3%。TailSlayer的200纳秒优化换算进去,理论上是可量化的利润。

但他们会用吗?大概率不会。对冲基金的基础设施预算允许定制FPGA、专用网卡、甚至微波塔——在硬件层面解决,比软件对冲更干净。TailSlayer的价值在于"现有服务器可部署",而非"最优解"。

自动驾驶的实时感知栈是另一个候选。激光雷达点云处理有硬实时约束,偶尔的单帧延迟可以接受,但连续两帧延迟可能触发安全系统的降级模式。TailSlayer的"最坏情况保证"在这里有语义价值。

云厂商的虚拟化场景更微妙。AWS、Azure的多租户环境里,一个虚拟机的内存抖动可能穿透到邻居。TailSlayer的隔离性收益能否抵消资源开销,需要大规模生产验证——目前只是学术好奇。

LaurieWired自己承认,这个项目「probably not useful for most people」。她的目标受众很明确:那些已经在用Rust写内核模块、手动绑CPU核心、禁用所有节能状态的极端优化者。

硬件厂商会跟进吗

DRAM标准组织JEDEC的历史态度是:刷新是物理限制,不是架构缺陷。DDR5引入了部分刷新模式,允许高温时只刷新部分bank,但本质仍是"尽量不影响访问",而非"彻底消除抖动"。

有厂商尝试过嵌入式DRAM(eDRAM),把电容做在CPU封装内,缩短刷新周期到纳秒级。Intel的Haswell GT3e核显用过,成本太高,后续产品线放弃。

更激进的方案是摒弃电容,用磁阻(MRAM)或铁电(FeRAM)替代。这些技术无需刷新,但密度和成本距离主流内存还有数量级差距。实验室到晶圆厂的距离,通常以十年计。

所以TailSlayer的窗口期可能意外地久。在硬件变革到来之前,软件层面的对冲是少数可落地的选项之一——前提是用户接受它的代价结构。

她开源了原型代码,GitHub仓库的README写着一行警告:「This will probably break your system in creative ways.」典型的安全研究员冷幽默。

截至视频发布,仓库收获3400星标,Issue区充斥着各种架构的崩溃报告。有人成功在ARM服务器复现,有人在AMD Ryzen上触发内存校验错误。社区正在帮她完善兼容性矩阵,尽管她明确说没精力维护。

这个项目的真正遗产,可能是重新点燃了对DRAM刷新机制的讨论。Linux内核邮件列表里,有开发者提议暴露刷新周期的近似值到用户空间,让对冲策略更精确。Linus Torvalds的回复很简短:「Patches welcome, but show me the numbers.」

如果操作系统开始原生支持刷新感知调度,TailSlayer的"浪费式对冲"或许能被更聪明的策略替代——比如预测性预取、或动态调整请求间隔。但那条路需要硬件配合,而硬件厂商的优先级列表里,"尾延迟敏感型小众用户"的排名从来不高。

LaurieWired在视频结尾展示了一个监控面板:对冲成功率随时间波动,在96%到99.7%之间。那0.3%的失效,是两次请求都撞上刷新的倒霉时刻——数学上的必然,工程上的妥协。

「你不可能消灭所有不确定性,」她说,「但可以把它压缩到业务能容忍的盒子里。」

那个盒子现在开源了,带刺,有使用门槛,且明确不承诺任何保修。问题是:你的场景值得为它牺牲一半内存带宽吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
惊呼绳子“没拴紧没拴紧”,女子景区“探险”时高空坠落;女子是否抢救过来,四川华蓥相关部门称会发通报

惊呼绳子“没拴紧没拴紧”,女子景区“探险”时高空坠落;女子是否抢救过来,四川华蓥相关部门称会发通报

大风新闻
2026-05-05 17:39:06
33.1分封神!詹姆斯又拿季后赛第一!

33.1分封神!詹姆斯又拿季后赛第一!

柚子说球
2026-05-05 18:38:33
湖南浏阳烟花厂爆炸事故已致26人死亡61人受伤,“发布会现场,全体起立,向遇难人员默哀”

湖南浏阳烟花厂爆炸事故已致26人死亡61人受伤,“发布会现场,全体起立,向遇难人员默哀”

都市快报橙柿互动
2026-05-05 13:48:29
美国人的历史课本,是怎样写中国的?仅有20页,记载了6个中国人

美国人的历史课本,是怎样写中国的?仅有20页,记载了6个中国人

抽象派大师
2026-05-03 00:24:53
浏阳烟花爆竹企业爆炸事故现场救援有序进行,幸存伤者讲述事发时情况

浏阳烟花爆竹企业爆炸事故现场救援有序进行,幸存伤者讲述事发时情况

潇湘晨报
2026-05-05 15:32:12
博主教逻辑学竟被网友举报,说“居心叵测”

博主教逻辑学竟被网友举报,说“居心叵测”

葱哥说
2026-05-04 22:43:36
连滚带爬!赖清德连夜返回台岛,斯威士兰把事做绝了

连滚带爬!赖清德连夜返回台岛,斯威士兰把事做绝了

阿龙聊军事
2026-05-05 10:53:11
美军中央司令部:在霍尔木兹海峡已经击沉6艘试图阻挠商船航行的伊朗小型船只

美军中央司令部:在霍尔木兹海峡已经击沉6艘试图阻挠商船航行的伊朗小型船只

鲁中晨报
2026-05-05 09:38:03
她是吴宜泽姐姐,血脉压制从小揪弟弟耳朵,长得漂亮是机车爱好者

她是吴宜泽姐姐,血脉压制从小揪弟弟耳朵,长得漂亮是机车爱好者

以茶带书
2026-05-05 16:57:12
停牌!300069,筹划重大资产重组

停牌!300069,筹划重大资产重组

中国基金报
2026-05-05 16:37:44
浏阳烟花厂爆炸事故已致26死61伤 烟花厂工人从爆炸现场爬出 多处受伤

浏阳烟花厂爆炸事故已致26死61伤 烟花厂工人从爆炸现场爬出 多处受伤

闪电新闻
2026-05-05 17:10:16
肖磊:刚刚,穆斯林世界第一大“叛徒”诞生了

肖磊:刚刚,穆斯林世界第一大“叛徒”诞生了

肖磊看世界
2026-05-05 16:21:09
给狗撸串的小仙女隐藏账号,老板销毁上百斤肉,含泪恳求大家原谅

给狗撸串的小仙女隐藏账号,老板销毁上百斤肉,含泪恳求大家原谅

映射生活的身影
2026-05-04 16:50:36
FIFA彻底急了!原来除了央视,还有这么多国家不给世界杯买单了!

FIFA彻底急了!原来除了央视,还有这么多国家不给世界杯买单了!

小娱乐悠悠
2026-05-05 10:36:39
我见过最懒的人是我堂姐,34岁北京大学博士,年薪40万,生活随性

我见过最懒的人是我堂姐,34岁北京大学博士,年薪40万,生活随性

健身狂人
2026-05-05 14:22:31
美空军加油机飞越波斯湾时发出紧急代码7700,请求立即降落

美空军加油机飞越波斯湾时发出紧急代码7700,请求立即降落

上观新闻
2026-05-05 16:24:05
好奶就是“真鲜活” 三元70年赢在长期主义

好奶就是“真鲜活” 三元70年赢在长期主义

铑财
2026-05-01 10:23:31
明明隔夜酒一查一个准,为啥交警上午几乎不查车,内行人道出实情

明明隔夜酒一查一个准,为啥交警上午几乎不查车,内行人道出实情

老特有话说
2026-05-05 15:20:11
河北邢台“一家五口被害案”凶手已被执行死刑,家属:独自在5位家人坟前告慰,伤痛永远无法消失

河北邢台“一家五口被害案”凶手已被执行死刑,家属:独自在5位家人坟前告慰,伤痛永远无法消失

极目新闻
2026-05-05 14:33:25
谷爱凌穿“会吐泡泡”的高定裙子亮相Met Gala,裙子上有1.5万颗玻璃泡泡,制作耗时2550小时

谷爱凌穿“会吐泡泡”的高定裙子亮相Met Gala,裙子上有1.5万颗玻璃泡泡,制作耗时2550小时

鲁中晨报
2026-05-05 16:26:17
2026-05-05 19:16:49
我是一个粉刷匠2
我是一个粉刷匠2
有态度网友ytd
2135文章数 29关注度
往期回顾 全部

科技要闻

传苹果考虑让英特尔、三星代工设备处理器

头条要闻

伊朗发射导弹袭击美军舰船和商船及阿联酋 特朗普表态

头条要闻

伊朗发射导弹袭击美军舰船和商船及阿联酋 特朗普表态

体育要闻

全世界都等着看他笑话,他带国米拿下冠军

娱乐要闻

英皇25周年演唱会 张敬轩被救护车拉走

财经要闻

浏阳烟花往事

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

时尚
游戏
本地
数码
公开课

夏天最经典的银色,贵气十足!

日本玩家疯抢!Steam手柄开售即售罄 官网临时关闭

本地新闻

用青花瓷的方式,打开西溪湿地

数码要闻

技嘉推出“MO34WQC36”34英寸带鱼屏显示器,6699元

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版