网易首页 > 网易号 > 正文 申请入驻

前陆军游骑兵和英伟达专利大户联手,要让AI写代码不再"翻车"

0
分享至

一个曾在阿富汗服役的陆军游骑兵,和一个手握27项神经网络专利的英伟达"大师级发明家",在2023年凑到一起。两年后,他们创办的Blitzy以14亿美元估值拿下2亿美元融资。

这笔交易最刺眼的地方在于:当所有人都在鼓吹"大模型万能"时,这家公司偏偏说"不够"。他们的核心判断是——光靠前沿大语言模型,根本搞不定企业级的生产代码。


这背后是一场关于"AI写代码"路线之争的暗战。Blitzy押注的不是更强的单点模型,而是让数千个AI智能体(人工智能代理程序)并行协作,连续跑上几周不停歇。

从战场到代码库:两个创始人的奇怪组合

Brian Elliott的身份标签很难复制:前陆军游骑兵、连续创业者。他的联合创始人Sid Pardeshi则是另一种典型——英伟达的"大师级发明家"(Master Inventor),名下攥着27项专利,覆盖神经网络和图像生成领域。

这个组合本身就暗示了Blitzy的产品哲学:既要有军事级的任务执行纪律,又要有芯片巨头的底层技术深度。

他们的目标客户也很明确——那些被庞大遗留代码库折磨的大型企业。不是初创公司的绿field项目,而是动辄百万行、甚至上亿行代码的老系统。

这类客户有个共同痛点:现有AI编程工具能写新代码,但读不懂旧代码。就像让一个新医生给做了三十年手术的老病人开方子,病历都翻不全。

为什么"更强的模型"不是答案

Blitzy的公开表态很直接:前沿大语言模型 alone(单独)无法在企业规模交付生产就绪代码。

这个判断和当下主流叙事形成反差。OpenAI、Anthropic、Google的模型迭代速度越来越快,上下文窗口越开越大,但Blitzy认为这解决不了结构性问题。

他们的解法分三步走:

第一步,反向工程现有环境。不是让AI"猜"代码库长什么样,而是系统性地拆解、建模。

第二步,构建动态知识图谱。把企业代码库变成一张活的地图,模块依赖、业务逻辑、历史债务全部可视化。

第三步,也是最重的投入——编排层(orchestration layer)协调数千个智能体并行工作。单次运行可以调用Google、Anthropic、OpenAI的模型超过10万次,连续推理数天甚至数周。

这个数字值得停顿一下:10万次模型调用,不是一个月,是一次运行。

这意味着Blitzy的系统设计从一开始就不是"对话式"的,而是"工程式"的。像调度一个软件工厂,而不是雇一个高级外包。

66.5%的基准分与"五倍提速"的客户反馈

Blitzy搬出了一个硬指标:SWE-Bench Pro得分66.5%。这是一个专门对比自主开发工具的编码基准测试,公司声称这一成绩超过了其他主要厂商的最新版本。

同时他们给出了客户侧的数据:部分客户的工程速度提升了五倍。平台已覆盖数十家全球2000强企业,横跨10个行业。

这两个数字需要分开看。66.5%是实验室成绩,有可比性但未必能翻译为实际产出;五倍提速是客户反馈,但"部分客户"的样本范围和测量方式未披露。

更关键的是产品形态:Blitzy交付的是"数月完成的软件开发工作",包含自动化测试和验证。这不是代码补全,不是函数生成,是端到端的工程交付。

处理规模也很夸张:从100万行到超过1亿行代码库。这个上限把绝大多数AI编程工具甩在了后面——很多工具在10万行级别就开始明显衰减。

融资结构里的信号:谁在看,谁在下注

本轮2亿美元由Northzone领投。新进入的名单包括PSG、Battery Ventures、Jump Capital、Morgan Creek Digital Assets、Defiant。老股东Flybridge、Link Ventures、NFX、Picus Capital、Venture Guides继续跟投。

更有意思的是战略投资方:Liberty Mutual Strategic Ventures(利宝互助保险)、Erie Strategic Ventures(伊利保险)。

保险公司入局不是财务投资那么简单。Blitzy明确提到要深入监管行业——政府、金融服务、保险。这些领域的旧系统现代化是刚性需求,但合规门槛极高,普通AI工具进不去。

保险巨头的战略投资,相当于提前锁定了供应商关系,也给Blitzy贴上了"可进监管行业"的信用背书。

过去六个月,Blitzy员工数量翻倍。新资金将用于扩充研究团队,扩大市场运营,以及——再次强调——向监管行业渗透。

CEO的表态:一场关于"自主性"的押注

Brian Elliott的声明值得完整引用:

「这笔融资是对我们平台的强力验证,也凸显了企业对更自主、更严谨的软件开发方式的迫切需求。我们始终相信,要为企业交付生产就绪代码,必须将超大规模智能体编排与深度理解遗留代码库的系统相融合。」

这段话里有两个关键词:"超大规模智能体编排"(hyperscaled agent orchestration)和"深度理解遗留代码库"。

前者是技术路径,后者是场景锚点。Blitzy没有试图做一个通用AI程序员,而是专攻"读懂老代码、改造老系统"这个特定战场。

这个选择有其现实考量:绿field(全新)项目的AI编程工具已经红海一片,Copilot、Cursor、各种开源方案层出不穷。但brownfield(遗留系统)改造是另一个世界——代码文档缺失、业务逻辑 oral(口头)传承、测试覆盖率低,大模型在这里频频"幻觉"。

Blitzy的动态知识图谱+多智能体并行,本质上是在用系统工程的方法对抗不确定性。不是让单个模型"更聪明",而是用架构设计"更可控"。

路线之争:单点突破 vs 系统作战

Blitzy的融资时间点耐人寻味。2026年5月,AI编程赛道正处于一个微妙的节点。

一方面,Cursor、Windsurf等工具凭借出色的交互设计迅速积累用户,证明"AI辅助编程"有真实付费意愿。另一方面,企业级客户的反馈开始分化——小团队用得很爽,大团队用不起来。

核心矛盾在于:个人开发者可以容忍AI的"幻觉",大不了人工修正;但企业级代码变更涉及合规、审计、回滚机制,一次"幻觉"可能是生产事故。

Blitzy的回应是彻底的企业级重做:不是给开发者配一个AI助手,而是给企业配一个AI工程团队。数千智能体并行、数周连续运行、自动化测试验证——这些设计都是为了把不确定性压缩到可接受范围。

代价也很明显:重、慢、贵。不是每个企业都需要或承受得起这种方案。Blitzy的客户名单是Global 2000,不是成长型初创。

这实际上是在AI编程赛道内部切出了一个新分层:消费级/小团队市场走"交互优先"路线,大企业核心系统走"可靠性优先"路线。两条路都需要,但技术栈完全不同。

14亿估值的隐含假设

2亿美元换14亿估值,稀释比例约14%。对于B轮或C轮阶段的公司,这个条款不算激进,也不算保守。

隐含假设很清晰:投资者相信"企业级AI编程"是一个独立品类,且Blitzy有机会成为头部。不是Copilot的替代品,而是面向不同场景的互补方案。

风险同样明显。智能体编排的技术复杂度极高,10万次模型调用的成本结构、延迟优化、故障恢复都是硬骨头。Blitzy需要证明其系统在经济上可持续——不是能跑通demo,而是能规模化盈利。

另一个变量是模型层。Blitzy目前调用Google、Anthropic、OpenAI的模型,但三家巨头的企业级编程产品也在进化。如果底层模型本身"更懂"企业代码,Blitzy的知识图谱+编排层是否还有不可替代性?

Elliott的回应逻辑是:模型能力在提升,但企业代码库的复杂性也在累积。动态知识图谱的价值不是替代模型,而是让模型"有上下文地"工作。这个论点能否成立,取决于未来12-24个月的客户留存数据。

一个关于"软件债务"的宏观注脚

Blitzy的崛起背后有一个容易被忽略的背景:全球企业软件债务正在到期。

COBOL系统、二十年前的Java单体应用、层层补丁的ERP——这些系统的维护者正在退休,文档正在丢失,而业务又离不开它们。美国政府的某些部门仍在用1959年设计的语言运行关键基础设施。

传统做法是外包给印度或东欧的工程团队,人工阅读、理解、重写。成本高昂,周期漫长,沟通损耗巨大。

Blitzy押注的是:AI可以将这个过程自动化,至少是半自动化。不是消灭人工,而是把人工从"读代码"转移到"审方案"。

如果这个假设成立,Blitzy的市场空间不是"AI编程工具",而是"遗留系统现代化服务"——一个数百亿美元、年增长率稳定的存量市场。

保险巨头的战略投资,某种程度上验证了这个叙事。保险公司的核心系统往往是几十年积累的技术债务重灾区,改造需求真实且预算充足。

技术细节的再审视:动态知识图谱到底是什么

Blitzy的宣传材料里,"动态知识图谱"是核心差异化卖点。但具体指什么?

从现有信息推断,这不是一个静态的代码索引(如传统的AST解析或代码搜索工具),而是一个随推理过程持续更新的语义网络。模块间的依赖关系、业务规则的隐含约束、历史bug的修复模式,都被编码为可查询的结构。

"动态"意味着这个图谱在智能体运行过程中不断演化。一个智能体发现的新依赖,会立即对其他智能体可见。这类似于多人在线游戏中的"战争迷雾"机制——每个单位探索的地图信息实时共享。

这种设计的工程挑战在于一致性和性能。数千智能体同时读写同一个知识图谱,如何避免冲突、如何保证低延迟,Blitzy没有公开技术细节。但从其处理亿级代码库的能力来看,底层应该有一套分片或缓存策略。

另一个关键组件是"编排层"。这不是简单的任务队列,而是需要考虑智能体间的依赖关系、资源分配、故障转移。Blitzy提到"数周不间断推理",意味着系统必须能处理模型API的限流、超时、偶发错误。

这些基础设施的搭建成本,解释了为什么Blitzy需要2亿美元融资,以及为什么其客户定位必须是Global 2000——只有足够大的合同金额,才能摊平研发成本。

竞争格局的重新测绘

Blitzy的出现,让AI编程赛道的地图需要重画。

第一层:个人开发者/小团队。Cursor、Windsurf、GitHub Copilot是主角。核心指标是用户体验、响应速度、价格。技术栈相对轻,依赖底层模型能力。

第二层:企业辅助编程。GitHub Copilot Enterprise、Amazon CodeWhisperer Customizations等。开始涉及私有代码库适配,但主要还是"助手"定位。

第三层:企业级自主开发。这是Blitzy试图占据的位置。强调端到端交付、遗留系统理解、合规可审计。技术栈重,销售周期长,但客单价和粘性也更高。

还有一层是"影子层":各大云厂商和模型厂商的企业级解决方案。Google的Duet AI for Developers、Anthropic的Claude for Enterprise、OpenAI的ChatGPT Enterprise都在进化。它们的优势是模型原生优化,劣势是场景理解深度。

Blitzy的赌注是:模型层和场景层之间存在一个"编排层"的独立机会。这个层需要同时理解AI能力和企业IT的复杂性,不是模型厂商的优先投入方向。

未回答的问题

Blitzy的公开信息留下了几个关键空白。

成本结构。10万次模型调用/单次运行的成本是多少?客户付费模式是按项目、按代码量、还是按调用次数?这些决定了商业模式的可持续性。

人工介入比例。"自动化测试和验证"的覆盖度如何?边界情况是否需要人工兜底?完全无人值守的承诺是否成立?

错误处理。当数千智能体中的一个出现"幻觉",系统如何检测、隔离、修正?SWE-Bench Pro的66.5%意味着仍有33.5%的任务失败,这些失败在真实场景中如何表现?

供应商锁定。动态知识图谱的格式是否开放?客户退出Blitzy时,能否带走积累的知识资产?

这些问题没有答案,但会影响企业采购决策。特别是金融服务和保险行业,对供应商锁定和可审计性极其敏感。

一个关于"AI原生"的观察

Blitzy的架构设计有一个值得注意的特征:它不是"AI增强传统工具",而是"AI原生重构工作流"。

传统软件开发工具链是为人设计的:IDE、版本控制、CI/CD、代码审查,每个环节假设人类是操作主体。AI被插入为辅助。

Blitzy的设计假设是:AI可以成为操作主体。人类退到定义目标、审查方案、处理异常的位置。这要求重新设计整个工具链,而不是在现有工具上加AI层。

这个选择的风险是兼容性。企业现有的DevOps流程、安全审计、合规框架,都是围绕人类开发者设计的。Blitzy需要证明其AI原生流程能被这些框架接纳,或者推动框架进化。

回报是潜在的结构性优势。如果AI原生架构被验证,后来者很难用"AI增强"路线追赶。这是14亿估值背后的技术赌注。

时间线复盘:从2023到2026的关键节点

2023年:公司成立。Elliott和Pardeshi组队,定位企业级自主软件开发。

2023-2025年:产品研发期。构建动态知识图谱引擎、智能体编排系统、多模型集成能力。这个阶段几乎没有公开声量。

2025年末-2026年初:客户验证期。拿下首批Global 2000客户,积累"五倍提速"的案例,完成SWE-Bench Pro测试。

2026年5月:2亿美元融资,14亿估值。宣布扩张研究团队、加大市场投入、深入监管行业。

这个节奏相对克制。从成立到大规模融资间隔近三年,说明产品需要较长时间打磨,也说明投资者需要看到真实客户验证才愿意入场。

对比一些AI编程初创公司"先融资后找场景"的路径,Blitzy的顺序是反过来的:先锁定场景(遗留系统现代化),再构建技术,再验证商业模式,最后规模化融资。

监管行业的特殊机会

Blitzy明确将政府、金融服务、保险列为重点拓展方向。这三个领域的共同点是:旧系统负担重、合规要求高、人工现代化成本极高。

以美国政府为例,GAO(政府问责办公室)多次报告关键系统依赖COBOL等老旧语言,维护人员退休潮迫在眉睫。传统外包模式周期长、透明度低,AI自动化有明确的替代价值。

但进入这些市场的门槛同样高。FedRAMP、SOX、PCI-DSS等合规认证需要大量时间和资源。Liberty Mutual和Erie的战略投资,可能包含合规经验的输出,帮助Blitzy缩短认证周期。

另一个隐性收益是:监管行业的成功案例具有强背书效应。如果能拿下大型银行或联邦机构的合同,其他行业的销售会显著简化。

人才策略:翻倍与研究方向

过去六个月员工翻倍,新资金继续扩充研究团队。这个节奏说明Blitzy仍处于技术深度投入期,而非单纯的销售扩张。

可能的研究方向包括:更高效的智能体通信协议、知识图谱的增量更新算法、多模型调用的成本优化、特定领域(如金融合规)的语义理解增强。

Pardeshi的27项专利背景,暗示公司可能在构建自己的知识产权壁垒。神经网络和图像生成的专利组合,可能与代码的图结构表示有技术迁移空间。

Elliott的军方背景则可能体现在项目管理和安全文化上。"陆军游骑兵"的训练强调任务规划、风险评估、团队在高压下的执行力——这些特质恰好匹配企业级软件交付的要求。

一个关于"并行"的深层含义

Blitzy反复强调的"数千智能体并行",不只是技术架构选择,也是产品哲学的表达。

传统软件开发是高度串行的:一个人读代码、理解、修改、测试,然后下一个人接力。即使团队协作,也是分模块并行,而非同一任务的真正并行。

AI智能体的"并行"打破了这个人因限制。数千个智能体可以同时探索代码库的不同角落,提出独立的修改方案,通过编排层协调冲突。这类似于从"手工车间"到"流水线"再到"集群计算"的跃迁。

但并行也带来新问题:如何定义"正确"?当多个智能体提出不同方案,裁决标准是什么?Blitzy的自动化测试和验证是部分答案,但测试覆盖度本身也是遗留系统的常见问题。

这里存在一个深层张力:AI可以并行生成大量代码,但"正确性"的验证最终仍需要某种形式的ground truth(基准事实)。在文档缺失的遗留系统中,ground truth往往就是"当前系统能跑"——而这正是需要被改造的对象。

Blitzy的应对可能是渐进式:不追求一次性重写,而是小步迭代,每次变更都有回滚机制。这与传统敏捷开发的理念一致,但执行主体换成了AI集群。

对科技从业者的启示

Blitzy的案例提供了几个值得关注的信号。

第一,"AI编程"正在分层。消费级、企业辅助级、企业自主级,三条路线的技术栈和商业模式差异巨大。选择赛道比选择"AI编程"这个大词更重要。

第二,遗留系统现代化是一个被低估的

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
在中国人民公安大学,穿了四年警服,毕业五年后,我们宿舍四个人,没一个在出现场

在中国人民公安大学,穿了四年警服,毕业五年后,我们宿舍四个人,没一个在出现场

侃故事的阿庆
2026-05-06 09:21:32
肖磊:刚刚,穆斯林世界第一大“叛徒”诞生了

肖磊:刚刚,穆斯林世界第一大“叛徒”诞生了

肖磊看世界
2026-05-05 16:21:09
吴宜泽社媒回复赵心童、丁俊晖:一起加油,永远的大哥

吴宜泽社媒回复赵心童、丁俊晖:一起加油,永远的大哥

懂球帝
2026-05-05 19:39:09
绳子断裂女游客已经死亡,事发前一直喊没绑紧,吓得快哭了

绳子断裂女游客已经死亡,事发前一直喊没绑紧,吓得快哭了

映射生活的身影
2026-05-05 21:19:42
特朗普提前9天访华,美财政部准备借款6710亿

特朗普提前9天访华,美财政部准备借款6710亿

陈腕特色体育解说
2026-05-05 23:27:12
5月6日0时高速免费结束,车主因充电耽误20分钟,无奈交了143元通行费

5月6日0时高速免费结束,车主因充电耽误20分钟,无奈交了143元通行费

观威海
2026-05-06 10:54:03
一只青蛙如何被井外势力蛊惑

一只青蛙如何被井外势力蛊惑

黔有虎
2026-05-05 22:54:29
51岁女子包养24岁男孩,嫌男孩不行被杀,2014年男孩说她索取无度

51岁女子包养24岁男孩,嫌男孩不行被杀,2014年男孩说她索取无度

汉史趣闻
2026-05-05 11:40:36
被快手砸了5.7亿的A站,成了沉默的“赛博坟场”。

被快手砸了5.7亿的A站,成了沉默的“赛博坟场”。

差评XPIN
2026-05-06 00:07:34
伯纳乌大地震!皇马放话出售姆巴佩,天价报价就接

伯纳乌大地震!皇马放话出售姆巴佩,天价报价就接

奶盖熊本熊
2026-05-06 00:00:36
16岁女子玩悬崖秋千坠亡:生前17秒视频曝光,旁人哄笑,错失救援

16岁女子玩悬崖秋千坠亡:生前17秒视频曝光,旁人哄笑,错失救援

李晚书
2026-05-06 10:46:28
FIFA急疯了!除了中国,还有这么多国家不给世界杯买单了

FIFA急疯了!除了中国,还有这么多国家不给世界杯买单了

泠泠说史
2026-05-05 19:53:46
浏阳烟花和丹东蓝莓采摘,如果悲剧真能换来醒悟!

浏阳烟花和丹东蓝莓采摘,如果悲剧真能换来醒悟!

胖胖说他不胖
2026-05-06 11:50:12
26死!一员工因亲属在浏阳花炮事故中离世请假,获领导暖心批复

26死!一员工因亲属在浏阳花炮事故中离世请假,获领导暖心批复

火山詩话
2026-05-06 10:04:31
伊朗外长落地北京后!特朗普态度180度转变:连说中国三句好话

伊朗外长落地北京后!特朗普态度180度转变:连说中国三句好话

风流女汉
2026-05-06 09:59:58
吴宜泽透露拿到奖金后准备在英国买房,50万英镑奖金需交税超23万镑,实际到手约26.5万镑

吴宜泽透露拿到奖金后准备在英国买房,50万英镑奖金需交税超23万镑,实际到手约26.5万镑

大风新闻
2026-05-06 11:53:02
男子和妻子的弟媳缠绵,怕妻子听到声音,2017年弟媳竟被他捂死了

男子和妻子的弟媳缠绵,怕妻子听到声音,2017年弟媳竟被他捂死了

汉史趣闻
2026-05-05 11:36:31
爆粗口的女副校长,与口头禅WC的女学生!

爆粗口的女副校长,与口头禅WC的女学生!

闲侃闲侃
2026-05-06 08:00:07
老外称在中国电商购买4TB外置硬盘被骗:拆开竟是SD卡+读卡器 平台秒退款

老外称在中国电商购买4TB外置硬盘被骗:拆开竟是SD卡+读卡器 平台秒退款

快科技
2026-05-05 12:05:14
内马尔向小罗比尼奥公开道歉:我确实冲动了,他是我很喜欢的后辈

内马尔向小罗比尼奥公开道歉:我确实冲动了,他是我很喜欢的后辈

懂球帝
2026-05-06 13:12:08
2026-05-06 14:43:00
灰度测试中
灰度测试中
生活正在重构,目前还在灰度测试阶段,暂不全量发布。
2136文章数 22关注度
往期回顾 全部

科技要闻

“马斯克不懂AI”:OpenAI当庭戳老底

头条要闻

男子购百万保险被邀免费游老挝 花数十万买"熊胆"心虚

头条要闻

男子购百万保险被邀免费游老挝 花数十万买"熊胆"心虚

体育要闻

活塞1比0骑士:坎宁安不再是一个人了

娱乐要闻

神仙友谊!杨紫连续10年为张一山庆生

财经要闻

人形机器人七小龙:谁真能卖 谁在讲故事?

汽车要闻

领克10/领克10+ 无论能源形式 领克都要快乐

态度原创

教育
旅游
亲子
房产
公开课

教育要闻

六条逻辑主线替代四个大概念,反映了怎样的理念? | 高中课标修订解读⑥

旅游要闻

龙江新观察|“五一”文旅热力十足 特色体验燃动春日消费

亲子要闻

52岁王小骞做梦也没想到,患上矮小症的女儿,如今竟然迎来了逆袭

房产要闻

五一楼市彻底明牌!塔尖人群都在重仓凯旋新世界

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版