网易首页 > 网易号 > 正文 申请入驻

IBM押注15,552个老程序,98.78%活了

0
分享至


2200亿行代码正在死去,但没人敢拔插头。

这个数字来自行业估算——全球仍有2200亿行COBOL在生产环境运行。银行核心系统、保险理赔引擎、政府社保数据库,它们支撑着每天数万亿美元的流转。问题是,写这些代码的人大多退休了,而年轻人宁愿送外卖也不愿学一门1959年发明的语言。

上周,一家叫AGUELLID CODE的公司扔出一份测试报告:他们用自家引擎处理了15,552个真实世界的COBOL程序,98.78%生成了能通过Python语法检验的输出。最关键的一行备注:Zero LLMs involved(零大语言模型参与)。

15,552个程序,从哪来

测试集不是实验室捏出来的。

AGUELLID CODE团队从131个开源仓库里扒了15,552份源代码,覆盖五大洲:挪威、法国、巴西、印度、日本、美国。来源包括GitHub、HuggingFace、CBT Tape、GnuCOBOL官方库,以及IBM的公开仓库。方言跨度同样夸张——商业COBOL、GnuCOBOL扩展、TypeCOBOL、大型机专用变体,全部扔进同一个漏斗。

「没有筛选偏见,没有精选样本,能找到的全要了。」这是他们在技术博客里的原话。

版本迭代的数据对比更直观。v5.6引擎处理14,508个文件,成功率96.84%,失败488个。三个月后v5.8e版本扩容到15,552个文件(新增1,044个),成功率跳到98.78%,失败数压到190个。净增益:1,342个文件从「无法处理」变成「有效输出」。

在原始v5.7参考语料上,他们甚至测出过99.25%——289个失败案例里,180个在一次调试 session 中被修复。

这里有个关键细节:他们对「有效」的定义极其苛刻。

不是人工审阅「看起来差不多就行」,不是字符串比对,不是风格检查。他们用Python标准库的ast.parse()做判定——生成代码必须能被解析成抽象语法树,触发SyntaxError即判死刑。二进制结果,零解释空间,人类 reviewer 无权 override,模型也没法靠幻觉蒙混过关。

「这是最严格的语法正确性定义。」团队写道。

190个失败案例,卡在什么地方

剩下的1.22%不是随机噪声,而是被精确分类的硬骨头。

TypeCOBOL方言占约60个——多级限定符、REPLACE伪指令、类型化表达式,这些扩展从未进入任何COBOL标准文档。GnuCOBOL专属扩展约40个,涉及GUI、位运算组合、面向对象特性、SCREEN SECTION。非标准COBOL约30个,包括WebSocket实现、Brainfuck解释器、.NET GUI绑定——听起来像恶作剧,但确实是真实存在的生产代码。

STRING/UNSTRING语句的深度嵌套约25个,多分隔符复杂场景让解析器头疼。大型机专属边缘案例约35个,CICS内联命令、复杂EXEC SQL、嵌套COPYBOOK,这些构造 sitting at the outer boundary of what any standard COBOL parser is expected to handle(坐在任何标准COBOL解析器预期处理能力的外边界上)。

团队的原话很直接:「这些不是解析bug,是解析器从未理解过的东西,sanitizer 无法修复它从未见过的东西。」

但他们知道每一块骨头在哪,正在逐个啃。

不用AI,是卖点还是硬伤

AGUELLID CODE反复强调「零LLM」,在当下的技术语境里,这几乎是一种反潮流的姿态。

他们的技术路线确实迥异于主流的「AI代码生成」叙事。引擎不直接翻译COBOL到Python,而是先把COBOL转成语义中间表示(semantic intermediate representation),再生成行为等价的Python——不是逐行对应,而是行为逐行为对应。没有神经网络,没有提示工程,没有采样随机性。相同输入永远产生相同输出,逻辑可追溯,过程可审计。

「在银行、保险、政府系统里,『模型觉得自己对了』不是可接受的解释。」

这句话击中了金融级软件迁移的命门。2023年摩根大通的一份内部备忘录泄露,显示其COBOL现代化项目因AI生成代码的不可解释性而暂停试点——监管合规部门无法接受「黑箱决策」进入核心账务系统。AGUELLID CODE的确定性输出,某种程度上是为这种恐惧开的药方。

但硬币另一面是灵活性代价。纯规则引擎的扩展成本极高,每新增一种COBOL方言变体,都需要工程师手写解析规则。对比之下,LLM-based方案在处理「从未见过的语法结构」时,往往能通过上下文推理给出合理猜测。190个失败案例的分类清单,某种程度上暴露了规则引擎的天花板。

IBM的选择耐人寻味。他们既是AGUELLID CODE的公开合作方(SAM1概念验证的505行代码由IBM提供),也是自家Watson Code Assistant的推手——后者正是基于大模型的COBOL现代化工具。两种路线并行押注,不把鸡蛋放一个篮子。

2200亿行代码,谁来接盘

COBOL现代化的市场 urgency 被低估了二十年,现在真的火烧眉毛。

美国社会保障局(SSA)2023年向国会提交的报告显示,其核心系统依赖的6000万行COBOL中,42%的原始作者已去世或无法联系。SSA每年花费1.4亿美元维持这些系统运转,但招聘COBOL工程师的难度「呈指数级上升」。类似困境遍布全球:日本三菱UFJ银行2022年因COBOL系统故障导致1200万笔交易延迟,罚款金额超过系统现代化预算的三倍。

AGUELLID CODE的测试规模是个信号。15,552个程序不是学术 toy problem,而是接近真实世界复杂度的压力测试。98.78%的成功率意味着,理论上已有工具可以批量处理遗留代码库,而不需要逐行人工重写——后者的时间成本通常是前者的40到60倍。

但「语法有效」不等于「生产可用」。ast.parse()通过只保证代码能跑,不保证逻辑等价。COBOL的COMP-3压缩十进制、嵌入式SQL预编译、CICS事务语义,这些运行时行为的精确复现才是硬骨头。AGUELLID CODE的博客承认,当前验证聚焦「语法正确性」,语义等价性测试正在开发中。

另一个悬而未决的问题是性能。COBOL在IBM Z系列大型机上的执行效率经过六十年优化,同等业务逻辑用Python跑在x86集群上,延迟和吞吐能否达标?团队没有公布基准测试数据,但评论区已有读者追问:「生成的Python代码,在同等硬件成本下能撑住生产负载吗?」

IBM的SAM1概念验证给出了一个乐观信号:505行COBOL代码,转换耗时32毫秒。但这个数字的含金量取决于后续——是冷启动时间还是热路径性能?是否包含中间表示的编译开销?信息尚不完整。

技术路线之争仍在发酵。LLM派主张「先跑起来再修bug」,规则引擎派坚持「先证明正确再部署」。AGUELLID CODE的测试数据给后者添了筹码,但远未到终局。2200亿行代码的迁移成本,足够容纳多条技术路线共存十年以上。

一个值得玩味的细节:团队在博客末尾放了一个GitHub issue链接,邀请用户提交「让引擎失败的COBOL代码」。190个失败案例的分类清单,就是社区反馈的产物。这种开放姿态在 enterprise software 领域并不常见——他们似乎确信,透明度本身就是信任货币。

下一个版本v5.9的目标已经公开:把失败率压到0.5%以下,同时启动语义等价性验证框架。如果达成,这将是第一个被证明「行为等价」的COBOL-to-Python工业级工具。

届时,2200亿行代码的死亡倒计时,或许会真正开始。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
4月中旬财星“贴身”!这3个生肖主动迎来横财,钱包频频进账

4月中旬财星“贴身”!这3个生肖主动迎来横财,钱包频频进账

毅谈生肖
2026-04-06 12:05:25
抗美援朝 魔鬼李大安——判处死刑

抗美援朝 魔鬼李大安——判处死刑

秀心文雅
2026-04-05 07:05:03
外媒:中国728型气垫艇,3艘同坞建造,两栖作战翻倍加强

外媒:中国728型气垫艇,3艘同坞建造,两栖作战翻倍加强

万里繁华
2026-04-06 11:22:00
你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

夜深爱杂谈
2026-02-21 21:37:02
苏莱曼尼亲属遭美严惩:给中国外逃贪官敲响丧钟!

苏莱曼尼亲属遭美严惩:给中国外逃贪官敲响丧钟!

达文西看世界
2026-04-05 18:25:08
东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

番外行
2026-03-31 08:28:28
为男闺蜜关机四次后,老公发来与别人拥吻照:以后没人打扰我们了

为男闺蜜关机四次后,老公发来与别人拥吻照:以后没人打扰我们了

晓艾故事汇
2026-04-04 09:13:14
胜勇士发布会!乌度卡赞最后时刻与KD申京配合,总结防守端问题!

胜勇士发布会!乌度卡赞最后时刻与KD申京配合,总结防守端问题!

篮球资讯达人
2026-04-06 14:33:14
皇马青训最强神童?16岁“新坎特”横空出世!

皇马青训最强神童?16岁“新坎特”横空出世!

仰卧撑FTUer
2026-04-06 11:27:35
你敢信吗?太湖底下有2.3米厚的淤泥,可上面才盖着不到1.9米的水

你敢信吗?太湖底下有2.3米厚的淤泥,可上面才盖着不到1.9米的水

掠影后有感
2026-04-01 20:26:07
男子入职第二天就被外派越南?上海警方出手了

男子入职第二天就被外派越南?上海警方出手了

看看新闻Knews
2026-04-05 23:11:07
宋宁峰出轨是有原因的!女主身材谁看了能不爱?网友:极品

宋宁峰出轨是有原因的!女主身材谁看了能不爱?网友:极品

陈意小可爱
2026-04-05 16:14:49
5800亿预算打了水漂?石油储备严重缩水,印度离“瘫痪”只差5天时间!

5800亿预算打了水漂?石油储备严重缩水,印度离“瘫痪”只差5天时间!

亿通电子游戏
2026-04-06 13:02:16
惊悚!一摩天轮因超载倒塌瞬间!底座撕裂!近80人被压或甩出→

惊悚!一摩天轮因超载倒塌瞬间!底座撕裂!近80人被压或甩出→

特种设备安全科普
2026-04-05 21:43:49
何润东X需求很大?董璇逼小酒窝认新爹?

何润东X需求很大?董璇逼小酒窝认新爹?

八卦疯叔
2026-04-06 10:25:06
心梗去世的人越来越多?医生再次强调:宁可打打牌,也别做这6事

心梗去世的人越来越多?医生再次强调:宁可打打牌,也别做这6事

健康之光
2026-03-26 16:00:06
专家警告:每天吃一把蓝莓,就等于给肝脏“大扫除”?真相揭秘!

专家警告:每天吃一把蓝莓,就等于给肝脏“大扫除”?真相揭秘!

白宸侃片
2026-04-06 12:32:32
美媒:美航天局局长称外星人存在几率“相当高”

美媒:美航天局局长称外星人存在几率“相当高”

环球网资讯
2026-04-06 11:20:49
雷军晒新一代SU7设计师手稿:全新进气格栅+内置4D毫米波雷达

雷军晒新一代SU7设计师手稿:全新进气格栅+内置4D毫米波雷达

IT之家
2026-04-05 17:16:11
日媒举手投降:中国已彻底世界第一!

日媒举手投降:中国已彻底世界第一!

华商韬略
2026-04-05 13:04:12
2026-04-06 15:04:49
报错免疫体
报错免疫体
一名在需求评审和数据异常中反复横跳的产品运营。
809文章数 6关注度
往期回顾 全部

科技要闻

前同事被蒸馏成Token,AI能否偷走职场经验

头条要闻

特朗普希望7日前与伊朗达成协议 专家:实现可能性较低

头条要闻

特朗普希望7日前与伊朗达成协议 专家:实现可能性较低

体育要闻

球员系列赛大满贯!赵心童10-3世界第一 加冕赛季第4冠

娱乐要闻

乔任梁离世10年 父母曝舞台光鲜的背后

财经要闻

118吨!这家央行,大幅抛售黄金!

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

本地
亲子
旅游
公开课
军事航空

本地新闻

跟着歌声游安徽,听古村回响

亲子要闻

一定要让孩子刻在脑子里

旅游要闻

满屏春日惊喜!曹杨新村的春天,每一帧都是壁纸

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗:在C-130运输机残骸中发现一具美军士兵遗体

无障碍浏览 进入关怀版