网易首页 > 网易号 > 正文 申请入驻

连按Tab完成重构:蚂蚁CodeFuse团队提出无指令代码编辑框架NES

0
分享至



在 AI coding 工具快速演进的今天,“让模型写代码” 正在从补全、问答走向Agent 端到端编程:从需求拆解、跨文件修改到测试修复,一次任务动辄涉及多轮规划与执行。

但在真实开发里,最频繁、最消耗注意力的往往不是 “大任务”,而是无处不在的小编辑:一次重命名、一次参数补全、一次跨文件 refactor 的连锁修改…… 这些动作密集、节奏快,任何额外的提示词输入、等待模型响应或频繁切换上下文,都会打断开发者的 “心流”。

蚂蚁集团的 CodeFuse 算法团队长期从事大模型代码生成 / 编辑、AI IDE 智能辅助与工程化落地研究。此次在 FSE 2026 的 Industry Track 提出了NES(Next Edit Suggestion):一个无指令(instruction-free)、低延迟(<250ms)的 “下一步编辑建议” 框架。NES 不要求开发者先用自然语言描述意图,而是从历史编辑轨迹(historical editing trajectories)里学习开发者的目标与习惯,直接给出 “下一处该改哪里、该怎么改” 的建议,并把交互简化为连续的 Tab → Tab → Tab。

FSE(ACM Joint European Software Engineering Conference and Symposium on the Foundations of Software Engineering)是全球软件工程领域的顶级学术会议(CCF-A 类)其中的 Industry track 专门面向卓越应用研究,重点考察工作的显著性 (Significance)、稳健性 (Soundness) 以及对当前工业实践的改进程度。



  • 论文:NES: An Instruction-Free, Low-Latency Next Edit Suggestion Framework Powered by Learned Historical Editing Trajectories(FSE 2026)
  • arxiv:https://arxiv.org/html/2508.02473v3

一、大模型会写,但 “编辑协作” 仍不够顺滑

近两年,代码大模型工具显著提升了代码生成与编辑效率,但在代码编辑(code editing)这类高频任务中,现有范式仍有两类关键痛点:

1. 过度依赖显式指令,打断心流

很多研究与产品的编辑能力建立在 “用户先用自然语言描述修改意图 → 模型再生成 patch” 的链路上。现实中,开发者并不总能(也不愿意)把 “下一步要改什么” 先说清楚:尤其在重构、维护、跨文件依赖调整中,编辑意图往往是边读边改、逐步推进的。

2. 编辑任务强时效,延迟直接影响可用性

代码编辑与补全一样是 “即时交互” 场景。论文指出用户通常期望 1 秒内反馈,而很多方法还依赖较重的理解、检索或推理流程,导致延迟上升,进一步放大 “打断感”。

更重要的是:编辑并非一次性动作。一个 “看似简单” 的需求(例如把一个组件新增属性)往往会触发连锁修改:改接口、改实现、改调用点、补参数…… 如果每一步都要重新描述、重新等待,就很难形成真正的协作体验。

二、NES 从历史编辑轨迹去判断 “下一步如何改”

NES 的出发点来自一个朴素但被低估的事实:

开发者的目标与习惯,往往沉淀在他们的历史编辑模式里。

例如重复的重构动作、跨文件依赖的修改路径、某类 API 的调用顺序、团队内的代码风格等,都能从 “编辑轨迹” 中体现出来。NES 选择把这些轨迹当作 “隐式意图信号”,从而绕开显式自然语言指令。



为此,NES 设计了一个双模型架构:

  • NES-Location:预测 “下一处最可能的编辑位置”(跨文件 / 跨模块的导航建议)。
  • NES-Edit:在到达位置后生成 “应该如何改” 的具体代码修改。

三、从 “轨迹采集 → 数据构建 → 两阶段训练 → 推理加速” 闭环落地

NES 的实现可以拆成三个关键环节。

3.1 轨迹采集:用增量 diff 捕获真实编辑操作

要让模型学到 “编辑习惯”,首先要能稳定捕获编辑轨迹。NES 在 IDE 插件侧实现了实时、增量的差异检测(incremental difference detection),把计算范围从 “全文件 diff” 收缩到 “当前被修改的局部片段”,以降低开销并提升实时性。

同时,论文提出了自定义的NES diff 格式:不仅标注新增 / 删除 / 保留行,还给每一行加上绝对行号,提升信息密度并减少位置歧义。这一点对 “预测编辑位置”“生成可直接应用的 patch” 都很关键。

3.2 两阶段训练:SFT 学模式,DAPO 对齐人类偏好

NES 对两个模型都采用了两阶段后训练流程:

  • Stage 1:SFT(监督微调):让模型先学会基本的编辑模式与轨迹 - 意图映射。
  • Stage 2:DAPO(强化学习对齐):在高质量偏好数据上进一步优化行为,使输出更贴近真实开发者的 “有用建议”。





通过两阶段的模型训练,NES 在核心指标上达到 SOTA:

  • 编辑位置预测准确率 75.6%(NES-Location)
  • 编辑内容 Exact Match Rate 27.7%(NES-Edit)

3.3 推理优化:把 “可落地性” 拉到 250ms 以内

在 IDE 内联建议场景里,推理延迟几乎决定生死。NES 在系统侧引入了Prefix Caching与Speculative Decoding等优化,并针对工业环境进行工程调优,使端到端建议响应达到 平均 <250ms 的量级。

工业部署上,论文给出了选择小模型(Qwen3-4B)并结合高质量后训练数据的理由:

  • 8B 等更大模型成本与延迟更高,不适合 “低延迟” 体验目标。
  • 通过 SFT+DAPO,小模型也能达到很强的任务效果,具备更优的成本性能。

四、效果与价值:交互链路被重构

4.1 效果展示:

逻辑类的修改,当用户把 Point2D 改为 Point3D 时,模型能够理解代码逻辑的变化,首先增加 z 参数,接着预测需要跳转到第 18 行进行修改,用户采纳修改后,紧接着预测用户到第 19 行进行修改



格式统一,当把 Monday 修改为星期一时,首先 edit 模型会对 7-9 行进行同样的命名风格修改,用户采纳后,next-tab 模型帮助用户导航到第 10 行进行同样的修改,整个过程用户只需要按 tab 键即可完成



4.2 开发者与代码的交互链路被改写

很多工具的编辑能力建立在 “先描述 → 模型再改” 的范式上,评估也常围绕单次编辑是否正确。NES 的价值在于它把协作粒度切到 “下一步”,把编辑变成一个连续循环:

  • Location让跨文件修改的 “导航成本” 显著下降;
  • Edit让到位后的改动可以直接一键接受;
  • 二者组合形成链式推进,尤其适合 refactor 这类连锁任务。

这类体验的提升,对开发者心流非常重要。

五、NES 在 Agent 时代的不可替代生态位

写代码从来不是一次性的创作,而是无数次 "发现问题→定位→修改→再定位" 的循环。那些打断心流的瞬间,往往不是来自一个复杂的 Bug,而是一次又一次的 "下一处该改哪"。

在 Code Agent 快速发展的今天,编辑级的精准响应反而成为更难被绕过的基础能力 —— 它直接关乎开发者能否真正保持心流、信任 AI 的建议并持续采纳。NES 给出的答案是:从轨迹里学意图,把延迟压到感知阈值以内,让 "下一步" 变成一次 Tab。当模型开始比你更早知道该改哪里,人与 AI 的协作边界,正在被悄悄重构。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1983年,陈云亲自批示:立即枪毙广东县委书记王仲,原因为何?

1983年,陈云亲自批示:立即枪毙广东县委书记王仲,原因为何?

莫地方
2026-04-20 09:30:18
到底得有多坏,才能做出这么丧尽天良的事!

到底得有多坏,才能做出这么丧尽天良的事!

胖胖说他不胖
2026-04-19 09:00:30
不愧是广西第一美人,确实美若天仙

不愧是广西第一美人,确实美若天仙

陈意小可爱
2026-04-20 07:53:22
五预警齐发!雷暴大风、暴雨、冰雹……“组团”来袭!上海这天雨势明显

五预警齐发!雷暴大风、暴雨、冰雹……“组团”来袭!上海这天雨势明显

鲁中晨报
2026-04-20 11:12:11
住了33年的房屋要被强拆还地,台湾妇人叫嚣:我是大日本帝国臣民

住了33年的房屋要被强拆还地,台湾妇人叫嚣:我是大日本帝国臣民

金牛传声
2026-04-19 12:27:48
博主称民宿内多个针孔摄像头直播大学生隐私,合肥警方:受害人房内已拆除,老板报警了

博主称民宿内多个针孔摄像头直播大学生隐私,合肥警方:受害人房内已拆除,老板报警了

扬子晚报
2026-04-20 11:36:49
古装剧都是骗人的:真实的古代百姓餐桌,现代人看一眼就想吐

古装剧都是骗人的:真实的古代百姓餐桌,现代人看一眼就想吐

富贵说
2026-04-19 14:52:13
35岁男子常用微波炉加热食物,2年后确诊胃癌,医生:犯了2个大错

35岁男子常用微波炉加热食物,2年后确诊胃癌,医生:犯了2个大错

小柱解说游戏
2026-04-19 21:11:53
那番绝境,大帝终究还要面对

那番绝境,大帝终究还要面对

虚声
2026-04-20 08:08:29
中国航司大面积取消日本航班,武汉已无直飞日本航班

中国航司大面积取消日本航班,武汉已无直飞日本航班

极目新闻
2026-04-19 19:55:25
5月1日起物业行业彻底大变天!新规落地,业主终于不用再忍气吞声

5月1日起物业行业彻底大变天!新规落地,业主终于不用再忍气吞声

另子维爱读史
2026-04-19 19:37:43
133号舰艇编队为何选择从这里进入太平洋?专家解读

133号舰艇编队为何选择从这里进入太平洋?专家解读

环球网资讯
2026-04-20 12:17:06
4月17日,日本开始赌国运了

4月17日,日本开始赌国运了

闲闲碎
2026-04-18 20:34:49
张雪回应比赛提前结束:如果继续比赛可能引发安全事故;“赛车圈还是很干净的,每个人都为了自己的信仰拼搏”

张雪回应比赛提前结束:如果继续比赛可能引发安全事故;“赛车圈还是很干净的,每个人都为了自己的信仰拼搏”

大风新闻
2026-04-20 10:28:40
国家紧急预警!供应链投毒集中爆发,所有人尽快自查防护

国家紧急预警!供应链投毒集中爆发,所有人尽快自查防护

娱乐圈见解说
2026-04-19 02:48:57
无缘对阵湖人?杜兰特伤情曝光,令人沮丧,原因找到了,火箭表态

无缘对阵湖人?杜兰特伤情曝光,令人沮丧,原因找到了,火箭表态

萌兰聊个球
2026-04-20 08:46:07
确定!英超争冠不会有附加赛,如果同分,曼城比阿森纳多一个优势

确定!英超争冠不会有附加赛,如果同分,曼城比阿森纳多一个优势

嗨皮看球
2026-04-20 11:23:17
阿联酋没美元了

阿联酋没美元了

凯利经济观察
2026-04-20 12:17:23
请来“项羽”的苏超,又吓了所有人一跳

请来“项羽”的苏超,又吓了所有人一跳

金错刀
2026-04-19 17:54:26
太扎心了!上海男子年薪百万失业引不满,新婚3个月女子就想离婚

太扎心了!上海男子年薪百万失业引不满,新婚3个月女子就想离婚

火山詩话
2026-04-20 06:12:18
2026-04-20 15:23:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12810文章数 142632关注度
往期回顾 全部

科技要闻

蓝色起源一级火箭完美回收 客户卫星未入轨

头条要闻

媒体:伊朗刚说不谈 美国立即开打

头条要闻

媒体:伊朗刚说不谈 美国立即开打

体育要闻

阿森纳已拼尽全力,但你早干嘛去了...

娱乐要闻

鹿晗生日上热搜,被关晓彤撕下体面

财经要闻

月之暗面IPO迷局

汽车要闻

把天门山搬进厂?开仰望U8冲上45度坡的那刻 我腿软了

态度原创

数码
旅游
游戏
艺术
公开课

数码要闻

消息称谷歌无屏健身手环定名Google Fitbit Air

旅游要闻

北京经开区重磅发布2026年文商旅体活动

《GT7》制作人官宣更新!神秘新车剪影引爆玩家猜测

艺术要闻

王羲之《换鹅帖》尚在人间,惊艳无比!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版