网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

代码定位太慢？蚂蚁ACL2026新作：让模型自己学会「该搜多少」

2026-06-14 09:32:37　来源: 新智元

北京举报

0

分享至

新智元报道

【新智元导读】FuseSearch：学习型自适应并行执行 —— 一个40亿参数的模型，凭什么在代码定位上干过了商用闭源大模型？答案只有四个字：搜得更聪明。

在AI编程狂飙突进的今天，一个尴尬的事实正在浮出水面：

你花在「让 AI 改代码」上的钱，超过一半其实烧在了「找代码」上。

研究表明，当前最先进的AI编程Agent，超过50%的计算资源消耗在代码搜索与定位环节——Agent翻来覆去地搜文件、读代码、定位函数，轮次消耗惊人，Token账单飞涨。

当所有人都在卷「模型多大、能写多长的代码」时，蚂蚁集团的一篇ACL 2026 Findings论文把目光转向了一个更底层的问题：能不能让搜索本身变得更聪明？

答案是可以。而且效果堪称惊艳——

FuseSearch-4B，一个仅40亿参数的开源模型，在SWE-bench Verified上达到84.7%文件级F1，匹配Claude Haiku 4.5的定位能力，同时速度快93.6%，Token消耗降低68.9%。

怎么做到的？一句话：让模型自己学会该并行多少。

代码定位

AI编程最烧钱的「卡脖子」环节

设想这样一个场景：你让AI帮你修一个Bug，它需要在一个几十万行代码的大型项目中，精准找到该改哪个文件、哪个函数。

这就是代码定位（Code Localization）——自动软件修复中最关键、也最昂贵的瓶颈。

现有方案分为两大流派，各有各的痛点：

但这两派有一个共同的致命缺陷：一次只能做一件事。

每一轮交互只能调用一个工具，逐步缩小范围。就像你在图书馆找一本书，规定每次只能翻开一个书架看一眼——轮次用完了，信息还没收集够。

论文把这种现象称为信息匮乏（Information Starvation）。

并行 ≠ 万能解药

那解决方案似乎很简单——一次多调几个工具不就行了？

没那么容易。论文实验揭示了一个反直觉的发现：无脑并行反而更糟。

如果固定每轮调用8个工具（朴素的并行策略），会产生超过34.9%的冗余调用——重复搜索已经看过的代码区域，不仅浪费Token，还会引入噪声信号干扰判断。

核心矛盾就此浮出水面：

并行少了→信息不够用，定位精度下降。并行多了→大量冗余，浪费计算资源。

FuseSearch的核心洞察是：搜索效率和搜索质量并非对立关系。关键不在于并行多少，而在于——什么时候该多并行，什么时候该少并行。

FuseSearch

极简工具箱 + 自适应智能

FuseSearch的设计哲学出奇地优雅：不给模型定死规则，让它自己学会动态调整并行度。

3.1 三把「瑞士军刀」

零成本部署

FuseSearch只用三个只读工具，极其克制：

就这三个。不需要代码知识图谱，不需要语法解析器，不需要任何重型基础设施。零依赖，拿来就能用，可即时部署到任意代码仓库。语言无关，Python 仓库能用，Java仓库也能用。

工具虽少，能力完备——glob找文件、grep 搜内容、read_file读细节，三者组合可以遍历整个代码库。

关键创新

用「信息增益」量化搜索质量

论文首次提出工具效率（Tool Efficiency）指标，衡量每次工具调用的信息新颖性：

信息增益=新发现的代码实体数÷总返回的代码实体数

打个比方：你派了5个侦察兵去探路。如果5个人报告的都是同一条路，那4 个人就白跑了。工具效率衡量的，就是「每个侦察兵带回了多少独家情报」。

效率越高 → 每次搜索都在探索新区域。效率越低 → 在做重复劳动。

两阶段训练

先学会并行，再学会聪明地并行

FuseSearch的训练策略分两步走：

阶段一：监督微调（SFT）——建立并行能力

从233个高质量GitHub仓库中提取约21,000个issue-patch对，用强大的教师模型（Kimi-K2-Instruct）生成搜索轨迹。然后用双重标准严格筛选：

定位准确率 ≥ 0.8
工具效率 ≥ 0.5

从约24,000条候选轨迹中，精选出约 6,000 条「又准又不浪费」的高质量数据，教会小模型「每轮可以同时调 2-8 个工具」。

阶段二：强化学习（RL）——学会自适应

SFT之后，模型会并行了，但还不知道什么时候该多并行、什么时候该少并行。

RL阶段的奖励函数设计得极为精妙：

\text{奖励} = 0.8 \times \text{定位准确率} + 0.2 \times (\text{定位准确率} \times \text{工具效率})

注意那个乘积项：

只有「找得准」且「搜得不浪费」同时满足，才能拿到额外奖励
如果定位完全错误（准确率=0），无论效率多高，奖励都是零——模型不能「高效地犯错」

这个设计迫使模型在搜索的每个阶段都做权衡：当前是广撒网收益大，还是精准验证收益大？

训练结果：一种「先撒网、再收网」的搜索策略

经过RL训练，模型自动学会了一种「老司机」式的自适应搜索模式：

这种「先广度、后深度」的模式，完全是模型自己从奖励信号中学出来的，没有任何人工规则。

实验结果：小模型大翻身

5.1 核心数据（SWE-bench Verified，386 个实例）

在Qwen3-4B上对比之前的方法RepoSearcher，FuseSearch的提升堪称碾压：

一句话总结：准确率翻倍，速度快16倍，Token省了近70%。

5.2 40亿参数 vs.商用闭源大模型

一个可以本地部署的4B开源小模型，定位能力与商用闭源大模型持平，同时更快、更省。

5.3 接入下游Agent：不掉精度，省一半成本

把FuseSearch-4B作为Kimi-K2-Instruct的「前置搜索引擎」：

不影响修复效果，直接把成本砍掉近一半。

为什么这项工作值得关注？

FuseSearch带来了三个层面的贡献：

学术层面

首次将「搜索效率」变成一个可训练的目标。不是简单地让模型多搜或少搜，而是通过精巧的奖励函数设计，让模型自己学会「什么时候该搜多少」。这为 Agent 工具调用策略的优化提供了一个新范式。

工程层面

极简设计，零部署成本。三个只读工具，语言无关，不依赖任何重型基础设施。论文作者已将代码开源，可即时部署到任意代码仓库。

产业层面

小模型逆袭大模型。40亿参数匹配Claude级别的定位表现，证明了「聪明的策略」比「堆参数」更重要。对于对延迟和成本敏感的工业级AI编程场景，这条路线极具落地价值。

论文信息

论文标题：FuseSearch: Learning Adaptive Parallel Execution for Efficient Code Localization
收录会议：ACL 2026 Findings
作者单位：蚂蚁集团（Ant Group）
论文链接：https://github.com/sxthunder/FuseSearch

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

人手一个数据库，Kimi背后这套AI基建到底有多能扛？

量子位 2026-05-14 22:54:30
27 跟贴 27
刚刚，百度开源拿下全球第一！作者疑似DeepSeek出走大神

新智元 2026-06-22 22:16:20
0 跟贴 0

刚刚，阿里HappyHorse1.1上线，我用它把国足送进世界杯

智东西 2026-06-22 20:23:55
0 跟贴 0

计算所、ETH研究者提出WorldCache，视频世界模型近无损提速3.7倍

机器之心Pro 2026-06-03 10:58:06
0 跟贴 0
Claude Code破解3500年前死语言！74年来最大考古语言学突破

新智元 2026-06-22 22:15:16
0 跟贴 0

一个程序员的自白:10年搭起的三根职业支柱,全倒了,不如去做木匠

机器之心Pro 2026-06-22 11:43:16
6 跟贴 6

代码与体温的二重奏：数智时代如何用“算法共情”重建组织信任

经济观察报 2026-06-20 09:08:29
1 跟贴 1
男子开车以为进小区结果是上高速近日，男子驾车从贵阳回遵义过端午，误将外观与小区大门高度相似的高速收

中安在线 2026-06-22 11:43:28
109 跟贴 109

马斯克前联创洽谈10亿美元巨融，要造一个真正归你的AI

新智元 2026-06-22 22:14:48
0 跟贴 0
告别「单科专家」：首个Agent全面进化框架EEVEE发布

机器之心Pro 2026-06-22 13:12:53
0 跟贴 0
AI奇观：我在主会场卷，Agent在20余个分会场替我听会

新智元 2026-06-22 15:37:45
0 跟贴 0
在清华，我拍到了物理AGI第一幕！

新智元 2026-06-22 13:35:48
0 跟贴 0
DeepSeek 2.0时刻？智谱市值突破万亿港元，GLM-5.2刷屏华尔街

华尔街见闻官方 2026-06-22 14:28:04
2 跟贴 2
韩国拒签G7针对中国的文件

猴姐不好惹 2026-06-22 00:47:01
0 跟贴 0
楼市最狠的招，终于来了

大川东山再起 2026-06-22 15:28:42
19 跟贴 19
内塔尼亚胡强硬表态：以军不会撤出黎巴嫩

新华社 2026-06-22 14:35:09
7252 跟贴 7252
数智时代的“无影桥”：算法洪流中如何用“心算力”重构组织协同

经济观察报 2026-06-18 09:12:15
0 跟贴 0
OpenAI 决定靠卖广告养 AI

钛媒体APP 2026-06-22 20:05:11
0 跟贴 0
2比2战平乌拉圭！佛得角再造冷门，手握出线主动权

澎湃新闻 2026-06-22 08:06:28
6391 跟贴 6391
恩和发布BPL协议语言，定位生物制造的“工业级编译器”

钛媒体APP 2026-06-22 10:00:22
0 跟贴 0
参数思想，整体思想，你学会了吗？

大鹏老师讲数学 2026-06-22 08:28:54
3 跟贴 3
华为Claw-Anything：跨设备、跨时间、跨服务Claw评测与数据引擎

机器之心Pro 2026-06-21 19:38:32
7 跟贴 7
清华团队提出首个可信原生中转基础设施TrustedARI

机器之心Pro 2026-06-22 18:12:31
0 跟贴 0
哪家公司代码是771

杨村章若男 2026-06-19 09:34:06
0 跟贴 0
ACL 2026｜AI for聋哑群体，港理工开源思考型手语翻译模型

机器之心Pro 2026-05-05 15:22:29
0 跟贴 0
ACL 2026 | 腾讯混元发现「不完全学习」，SFT仍漏学15%训练数据

新浪财经 2026-06-19 21:42:38
0 跟贴 0
旧社会女性处境太窒息：她们不是弱，是被规则勒死

小六一影视 2026-06-21 10:48:43
1 跟贴 1
AI隐私训练时，那个最难控制的「阀门」能自动调节吗？

机器之心Pro 2026-06-21 21:19:41
0 跟贴 0
吉林 2026 最新招生计划公布！5 大分数段报考策略一次性讲透！#志愿填报##吉林高考#

仲老师讲高考 2026-06-21 15:20:28
0 跟贴 0
女子将宠物犬寄存海底捞办公室后死亡门店回应

极目新闻 2026-06-22 08:36:39
2526 跟贴 2526
花2W挖来的机械工程师，机器人地轨调试现场，大家评评值不值

机器人第七轴研发 2026-06-21 18:27:00
0 跟贴 0
不会写代码的普通人，也能靠手搓应用赚钱了？

壹号塔台 2026-06-18 11:10:26
0 跟贴 0
大神程序员蒸馏自己，用16个skill给AI注入软件工程之魂

量子位 2026-05-12 03:08:58
0 跟贴 0
西方毛骨悚然：突然醒悟，中国一直在单挑所有人！如今已无人能阻

青烟小先生 2026-06-22 19:48:04
0 跟贴 0
9天做出可玩demo，AI编程真的能挑战R星13年？

像素与芯片 2026-06-22 02:11:33
0 跟贴 0
冒犯所有人，滴露广告如此低级为哪般

南方都市报 2026-06-21 23:32:10
910 跟贴 910
AI自己写代码，训出1B端侧「小钢炮」-1

机器之心Pro 2026-05-26 14:32:09
0 跟贴 0
龙虾军团有了最强「视力」！一眼看图直接写代码-1

机器之心Pro 2026-04-02 16:56:32
0 跟贴 0
算法背后的牧羊人：数智时代从“算力调度”到“人心唤醒”的领导力跃迁

经济观察报 2026-06-12 09:06:30
0 跟贴 0
养老金调整时间及补发规则解析

夏至陌离殇 2026-06-22 03:42:34
0 跟贴 0

离谱到家，日本踢世界杯比赛，中国观众超过了日本观众数倍

离谱到家，日本踢世界杯比赛，中国观众超过了日本观众数倍

体坛狗哥

2026-06-21 18:36:47

出大事了！马科斯突遭晴天霹雳，菲律宾后院失火，解放军要出手了

出大事了！马科斯突遭晴天霹雳，菲律宾后院失火，解放军要出手了

酒话醉人

2026-06-22 12:24:54

财政部：1—5月证券交易印花税1262亿元，同比增长88.8%

财政部：1—5月证券交易印花税1262亿元，同比增长88.8%

澎湃新闻

2026-06-22 17:07:11

高市以“难保工作时间”回应丑闻质询引发舆论哗然

高市以“难保工作时间”回应丑闻质询引发舆论哗然

新华社

2026-06-22 20:01:02

中国第一败家子：为追求女星与文强干架，在天上人间搅起风云

中国第一败家子：为追求女星与文强干架，在天上人间搅起风云

青青会讲故事

2024-12-17 11:29:08

中缅取得重大突破！云南等了百年的机会来了？

中缅取得重大突破！云南等了百年的机会来了？

牲产队

2026-06-22 18:19:17

《给阿嬷的情书》在英国首映，现场400包纸巾全送完

《给阿嬷的情书》在英国首映，现场400包纸巾全送完

中国日报

2026-06-22 12:36:26

小金属，谁是王者！

亿通电子游戏

2026-06-22 19:04:25

深度科普：四维空间到底什么样？与三维空间有什么区别？

深度科普：四维空间到底什么样？与三维空间有什么区别？

宇宙时空

2026-06-21 21:20:06

当“关系户”混进央八医疗剧，龇牙咧嘴，全程尬演，难怪弃剧一片

当“关系户”混进央八医疗剧，龇牙咧嘴，全程尬演，难怪弃剧一片

一娱三分地

2026-06-21 18:33:45

1943 年主将拒交兵权，拒不赴延安进修，还加害接任将领

1943 年主将拒交兵权，拒不赴延安进修，还加害接任将领

唠叨说历史

2026-05-25 11:46:11

79岁王奎荣将北京140平房子、2000多万存款，全部赠予小37岁妻子

79岁王奎荣将北京140平房子、2000多万存款，全部赠予小37岁妻子

白面书誏

2026-06-22 21:31:40

A股：今晚2.5亿股民，要兴奋到睡不着觉了，你知道为什么吗？

A股：今晚2.5亿股民，要兴奋到睡不着觉了，你知道为什么吗？

另子维爱读史

2026-06-22 20:46:41

大涨7%！牛市旗手，启动！

小白鸽财经

2026-06-22 14:35:24

河南郑州一女子称试衣遭孩童掀开试衣帘，致全身裸露被多名男性围观，涉事门店发致歉声明：将启动全面整改

河南郑州一女子称试衣遭孩童掀开试衣帘，致全身裸露被多名男性围观，涉事门店发致歉声明：将启动全面整改

大风新闻

2026-06-22 18:37:52

李鹏总理儿媳罕见影像，容颜端庄尽显风华，祖父功勋可比肩元帅

李鹏总理儿媳罕见影像，容颜端庄尽显风华，祖父功勋可比肩元帅

微野谈写作

2026-06-19 06:45:09

南京27公斤黄金盗窃案，童某某落网细节公布

南京27公斤黄金盗窃案，童某某落网细节公布

环球网资讯

2026-06-22 15:09:37

美加墨世界杯西班牙与沙特小组赛开打，全网都在找“开球嘉宾”李现在哪，网友的视频来了

美加墨世界杯西班牙与沙特小组赛开打，全网都在找“开球嘉宾”李现在哪，网友的视频来了

极目新闻

2026-06-22 00:49:37

中国女排输土耳其，一人得到瓦尔加斯的夸赞：他是一个很棒的球员

中国女排输土耳其，一人得到瓦尔加斯的夸赞：他是一个很棒的球员

南海浪花

2026-06-22 12:11:24

正大量上市，钾含量是苹果15倍，6月使劲吃，腿脚有劲，精神饱满

正大量上市，钾含量是苹果15倍，6月使劲吃，腿脚有劲，精神饱满

观星赏月

2026-06-22 19:44:52

AI产业主平台领航智能+时代

15507文章数 66928关注度

往期回顾全部

科技要闻

智谱盘中狂飙超40%，市值破万亿港元

头条要闻

英国首相斯塔默宣布辞职

头条要闻

英国首相斯塔默宣布辞职

体育要闻

法国球星祝中国队下届世界杯取得好成绩

娱乐要闻

陪睡陪玩是皮毛，向佐揭内娱暗规则

财经要闻

前美联储主席格林斯潘去世享年100岁

汽车要闻

华为智驾ADS限时优惠月底结束 7月1日前下订立省3000元

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

健康

游戏

房产

公开课

家居要闻

绿意盎然自然之境

粽子还没吃完？专家教你“清库存”

《GTA6》封面来到现实有多惊艳！完美还原香车美女

房产要闻

一年时间，36个盘“消失”！海口楼市，罕见“大收缩”！

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版