网易首页 > 网易号 > 正文 申请入驻

IBM开源模型被Rust重写后:速度翻2.8倍,内存砍到脚脖子

0
分享至


一份200页的财报PDF丢给AI,它把"第三季度营收"和页脚的小字备注搅成一团。你的RAG系统检索出来的内容,上下文是乱的,表格是碎的,连标题层级都分不清——这不是模型笨,是文档解析在拖后腿。

IBM今年开源的Docling解决了结构识别问题,能区分17种文档元素。但Python的原生实现让它在生产环境里像个吃内存的胖子。有团队用Rust把它整个重构了一遍,速度提到2.8倍,内存 footprint 压到原来的一小截。

从"能跑"到"能扛":生产环境的隐形门槛

Docling的RT-DETR v2模型(内部代号Heron)确实能打。标题、段落、表格、图表、页眉页脚、甚至脚注和题注,17类元素分得清清楚楚。开源协议是Apache-2.0,IBM这波没得黑。

但模型只是冰山一角。Docling本身是Python库,深度学习推理的标配生态。模型加载要时间,处理是单线程顺序跑,内存占用随文档复杂度线性膨胀。跑一篇论文没问题,跑一万份合同?你的流水线会卡在GIL(全局解释器锁)和Python的内存管理上。

更麻烦的是异构栈。如果你的核心服务用Go或Rust写的,插一个Python模块进去,等于在赛车引擎里塞了个家用发电机。容器镜像体积、冷启动延迟、依赖冲突,全是坑。

Kreuzberg团队的选择很直接:把Docling的模型抠出来, embedding 进Rust-native的流水线。不是 fork 代码改一改,是重写整个执行引擎——推理运行时、文本提取层、页面处理策略、表格重建管道,全换。

结果:同样的模型,不同的肉身。2.8倍速度,内存砍到"一小部分"(他们原话是a fraction,没给具体数字,但暗示是量级差异)。

ONNX Runtime:甩掉Python的GIL枷锁

关键切换在推理层。Docling原版用PyTorch,Kreuzberg换成了ONNX Runtime。这步操作砍掉了Python依赖,消灭了GIL竞争,内存管理交给Rust的所有权系统。


ONNX Runtime不是新东西,但用对地方才值钱。RT-DETR v2本身是个目标检测模型,输入页面图像,输出元素边界框和类别。ONNX的图优化能把模型算子 fuse 成更高效的执行计划,Rust端再配个线程池,多页并行处理。

Python的PyTorch在这类任务上有两个原罪:一是GIL让多线程变成伪并行,二是Tensor内存释放依赖垃圾回收,大文档容易OOM。Rust的所有权模型让内存生命周期显式可控,页面处理完立即释放,不拖泥带水。

团队没透露具体优化细节,但给了一个线索:他们的 pipeline 是"fully streaming"的。推测是页级流式处理,而不是整文档载入内存。这对百页以上的PDF是质变——你不需要等整个文件解析完,第一页的结构化数据先出来,下游系统先跑起来。

文本层重建:模型不管的脏活

布局模型只告诉你"这里有张表,边界坐标是(x1,y1,x2,y2)"。但表格里的文字怎么提取?单元格怎么对齐?跨页表格怎么拼接?这些是Docling原版的隐藏工作量,也是Kreuzberg重写的大头。

PDF的文本存储是个历史包袱。字符按绘制顺序存,不是阅读顺序。两栏布局的PDF,底层可能是"左栏第一行→右栏第一行→左栏第二行→右栏第二行"的乱序。更糟的是,有些PDF把表格画成一堆绝对定位的文本框,没有表格语义。

Kreuzberg的做法是分层:先用Docling的模型定位表格区域,再在区域内做文本提取和结构重建。文本层用了另一个Rust库(推测是pdf-extract或自研),把绘制指令还原成阅读顺序。表格重建则是个启发式算法,根据对齐线、间距、字体变化推断行列关系。

这部分没有开源模型可抄,全是工程脏活。团队的说法是"rebuilt from scratch",暗示Docling原版的表格处理逻辑被整个替换。

速度从哪来:三个杠杆的乘积效应

2.8倍不是单点优化,是三个杠杆的叠加:


杠杆一:运行时效率。ONNX Runtime的算子优化 + Rust的无GC内存管理,让单页推理更快、更稳。Python的PyTorch在这类CPU密集型任务上本就不是最优解。

杠杆二:并行架构。Rust的线程池可以真正并行处理多页,不受GIL限制。配合流式处理,CPU利用率能拉满。

杠杆三:内存策略。页级流式 + 显式内存释放,让内存占用和文档页数脱钩。处理1000页的文件,峰值内存和处理10页差不多。

团队特别强调"for production pipelines"——这不是实验室 benchmark,是扛过真实流量的数字。Docling原版在原型阶段够用了,但批量处理时的内存曲线和延迟抖动,是Kreuzberg想要抹平的东西。

开源生态的另一种玩法

这件事的微妙之处在于关系定位。Kreuzberg团队反复表态:Docling是great project,尊重IBM团队,模型是Apache-2.0的,我们用得光明正大。

这不是fork之后分道扬镳,是"模型层兼容,引擎层替换"的架构。对IBM来说,模型被更多项目采用是生态胜利;对Kreuzberg来说,借力成熟模型省去训练成本,专注工程优化。双赢,但前提是双方都认这个边界。

类似的模式在开源AIinfra里越来越常见。Llama.cpp用C++重写Llama的推理,Ollama再包一层;vLLM把PagedAttention塞进PyTorch的缝隙里。核心模型是公共品,执行引擎是竞争点。

Docling的Heron模型本身也在迭代。Kreuzberg的集成从v4.5.0开始,后续模型更新可以无缝跟进——只要ONNX格式兼容。这给他们留了一条后路,不用绑死在一个版本上。

一个值得追问的细节:Kreuzberg没公布内存占用的绝对数字,只说"a fraction"。是1/10还是1/3?处理100页PDF的P99延迟是多少?这些数字会决定它能不能真的挤进大厂的生产流水线,还是只在小团队里口碑相传。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美高层曾提议:中国可以用1万多亿美债,从美国手中"赎回"台湾

美高层曾提议:中国可以用1万多亿美债,从美国手中"赎回"台湾

快乐彼岸
2026-04-09 18:35:16
不吵不闹却最富!2026年这3个生肖用实力说话,悄悄崛起财富暴增

不吵不闹却最富!2026年这3个生肖用实力说话,悄悄崛起财富暴增

毅谈生肖
2026-04-12 11:16:10
蓝光光盘不死!仅剩最后一颗独苗:专供日本

蓝光光盘不死!仅剩最后一颗独苗:专供日本

快科技
2026-04-12 16:35:46
现役巨星60分次数:杜兰特0次,库里2次,哈登4次,还有一人更狠

现役巨星60分次数:杜兰特0次,库里2次,哈登4次,还有一人更狠

大西体育
2026-04-12 22:58:59
劝告邱毅:不要在错误的道路越走越远

劝告邱毅:不要在错误的道路越走越远

论事的老枢
2026-03-31 14:45:09
杜汶泽在台北直播,没人点赞,也没新戏拍,他现在到底靠啥活着?

杜汶泽在台北直播,没人点赞,也没新戏拍,他现在到底靠啥活着?

科学发掘
2026-04-12 16:49:28
马筱梅带汪宝回北京,张兰没反应,汪小菲称母亲张总,关系微妙

马筱梅带汪宝回北京,张兰没反应,汪小菲称母亲张总,关系微妙

枫尘余往逝
2026-04-11 23:52:17
英国官员说英美关系紧张

英国官员说英美关系紧张

界面新闻
2026-04-12 16:02:24
中国长安汽车赵非:今年全球预计7000万用户选购燃油车

中国长安汽车赵非:今年全球预计7000万用户选购燃油车

新京报
2026-04-11 14:58:04
李亚鹏心疼张雪拍卖奖杯:已找朋友拍下送回去

李亚鹏心疼张雪拍卖奖杯:已找朋友拍下送回去

快科技
2026-04-10 11:26:09
苹果配陈皮太厉害!老中医用一辈子,省钱又实用

苹果配陈皮太厉害!老中医用一辈子,省钱又实用

开心美食白科
2026-04-08 21:25:15
专家分析得出:一旦核战爆发,中国3个地方可躲灾难,一定要知道

专家分析得出:一旦核战爆发,中国3个地方可躲灾难,一定要知道

文史达观
2024-06-14 21:35:17
杨怡晒女儿庆生照,6岁小珍珠漂亮似公主,一家四口都是高颜值

杨怡晒女儿庆生照,6岁小珍珠漂亮似公主,一家四口都是高颜值

螃蟹吃瓜摊
2026-04-12 20:35:13
《冰湖重生》播出竟让《楚乔传》再次翻红,赵丽颖、窦骁太权威了

《冰湖重生》播出竟让《楚乔传》再次翻红,赵丽颖、窦骁太权威了

南浔杨柳
2026-04-12 23:50:00
毫无底线!骑士8大主力全轮休,哈登躺平蓄力,憋着劲硬刚凯尔特人!

毫无底线!骑士8大主力全轮休,哈登躺平蓄力,憋着劲硬刚凯尔特人!

隐于山海
2026-04-12 21:36:56
石宇奇7次征战亚锦赛首度夺冠,世界排名将重回第一

石宇奇7次征战亚锦赛首度夺冠,世界排名将重回第一

北青网-北京青年报
2026-04-12 20:52:13
没军人气质别演旅长,看了观众对王阳的评价,陈道明的话有人信了

没军人气质别演旅长,看了观众对王阳的评价,陈道明的话有人信了

陈述影视
2026-04-11 00:09:56
广东男篮胜广厦,李克一针见血说出广东强大之处,广东有机会冲冠

广东男篮胜广厦,李克一针见血说出广东强大之处,广东有机会冲冠

小七七体育解说
2026-04-12 22:44:43
亚马尔将社媒头像换成詹姆斯照片,后者帮骑士在16年逆转夺冠

亚马尔将社媒头像换成詹姆斯照片,后者帮骑士在16年逆转夺冠

懂球帝
2026-04-13 00:02:41
大幅降薪不可避免?美媒预测詹姆斯未来:若不回归湖人将加盟勇士

大幅降薪不可避免?美媒预测詹姆斯未来:若不回归湖人将加盟勇士

罗说NBA
2026-04-12 23:31:15
2026-04-13 01:15:00
字节漫游指南
字节漫游指南
有态度网友ytd
1537文章数 21关注度
往期回顾 全部

科技要闻

理想称遭恶意拉踩,东风日产:尊重同行

头条要闻

特朗普:将封锁任何试图进出霍尔木兹海峡的船只

头条要闻

特朗普:将封锁任何试图进出霍尔木兹海峡的船只

体育要闻

创造历史!五大联赛首位女性主教练诞生

娱乐要闻

赌王女儿何超蕸病逝,常年和乳癌斗争

财经要闻

美伊谈判破裂的三大症结

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

亲子
教育
艺术
数码
公开课

亲子要闻

“晚上疼得睡不着”!8岁女童双眼、身上被灼伤!警惕这东西,不少人家里有

教育要闻

小班教学,9月开校,树德派校长!这所中学,正在招老师

艺术要闻

揭开她笔下女人的神秘面纱,豪放洒脱的魅力令人惊叹!

数码要闻

苹果版套娃 买台Mac Pro回家:打开一看里面还藏着一台Mac Pro

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版