网易首页 > 网易号 > 正文 申请入驻

扩散语言模型写代码!速度比自回归快10倍

0
分享至

闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

谁说扩散模型只能生成图像和视频?

现在它们能高质量地写代码了,速度还比传统大模型更快!

Inception Labs推出基于扩散技术的全新商业级大语言模型——Mercury

Mercury突破了自回归模型 “从左到右” 逐词生成的限制,采用 “从噪声到结构化输出” 的方式,能一次性预测所有方向的token,提高了生成速度。

这样一来,Mercury还解决了自回归“一旦生成难以回头调整”的问题。

扩散模型并不是仅考虑前面已经生成的内容,它能在生成过程中进行动态纠错修改,具有更大的灵活性。

尽管采用了扩散技术,Mercury模型系列仍保留了Transformer架构。

这确保了该模型能直接复用近年来为大语言模型开发的高效训练、推理优化技术(如低阶算子优化、超参数调优工具等)。

实测数据显示,面对相同的编程任务,Mercury的代码生成速度比传统工具最多快10倍,大幅缩短了开发周期。

在H100 GPU上实现1109 tokens/秒吞吐量

Mercury用成熟的Transformer作为神经网络基础,结合扩散技术的并行生成能力,既保留了大模型的兼容性,又突破了自回归模型逐词生成的速度限制。

扩散生成流程

Mercury的核心创新在于 “扩散式生成”,流程如下:

  1. 训练阶段的正向过程:从真实文本(如代码片段)出发,逐步加入噪声(随机替换、删除token等),最终变成完全随机的噪声序列。
  2. 推理阶段的反向过程(核心):从随机噪声开始,通过Transformer模型迭代优化,逐步去除噪声,最终生成符合真实分布的文本。每次迭代中,模型会并行修改多个token,而非逐词生成。

这一过程扩展了此前的离散扩散方法,通过优化数据处理和计算逻辑,实现了大规模训练(万亿级token)。

高效利用硬件

Mercury主要通过并行化文本生成、动态去噪调度、混合精度量化等技术,极致发挥GPU性能,实现对硬件的高效利用,降低训练和推理成本。

  • 并行化文本生成

扩散机制允许模型在单次前向传播中预测多个token,相较于自回归模型的“从左到右”逐词生成,显著提升了GPU利用率。

NVIDIA H100 GPU上,Mercury Coder Mini和Mercury Coder Small(Mercury Coder系列编码优化产品)分别实现了1109 tokens/秒737 tokens/秒的吞吐量。

在Copilot Arena的基准测试中,可将响应时间压缩至其他工具的1/4,同时硬件资源占用减少60%。

  • 动态去噪调度算法

Mercury通过自适应调整去噪步数,在简单任务中减少计算量,在复杂任务中保留足够迭代次数,实现精度与效率的平衡,从而更高效地利用硬件资源,避免不必要的计算开销。

  • 混合精度量化技术

模型在推理时可自动切换至低精度计算模式,内存占用减少30%,同时通过残差补偿机制维持输出质量。这让Mercury能在有限的硬件内存条件下运行,且不明显影响性能。

强大的错误纠正能力

与传统自回归模型 “从左到右” 逐词生成,一旦生成难以回头调整不同,Mercury不受限于仅考虑前面已生成的内容,能够在生成过程中动态修改之前的内容,具有更大的灵活性。

  • 双向注意力机制
  • Mercury在去噪过程中引入上下文双向关联,能够更好地理解文本的前后语境,从而更准确地发现和纠正错误。
  • 实时纠错模块
  • 模型在去噪步骤中会同步检测代码逻辑漏洞,通过强化学习动态修正输出。在代码生成任务中,Mercury Coder可以自动修正逻辑漏洞,还支持函数级参数自动校正,能有效提高代码的准确性和可用性。
  • 多语言语法树嵌入
  • Mercury将Python、Java等语言的抽象语法树(AST)结构融入扩散过程,有助于减少语法错误。

超快响应速度与当前CI能力不匹配

在LLMs出现之前,持续集成/交付(CI/CD)的速度就已经成为一个主要瓶颈,这导致开发人员在测试时把时间浪费在等待拉取请求(PRs)上。

有时,一个更改操作需要在队列中等待数小时,甚至有时会因为不稳定需要重新开始。

Mercury模型在编写代码方面实现了超高速响应,但如果每次代码更改都需要数小时进行测试,那么就像这位网友提出的问题一样:

即使大模型能够以比人类快100倍的速度写代码,但测试速度跟不上的话,这将没有什么意义。

于是问题来了:

如何缓解超快响应速度与当前CI能力不匹配的问题?

一些人认为因为开发人员时间比机器时间昂贵得多,所以可以通过简单地“投入更多机器”来解决CI速度问题。

然而,也有另一些人指出,这对于谷歌等“印钞机”公司可能可行,但对于普通公司来说,CI预算是固定的,增加计算资源并不是一件容易的事情。

Inception Labs团队

Mercury的开发方Inception Labs的三位联合创始人是来自斯坦福、UCLA和康奈尔大学的计算机教授。

其中,Stefano Ermon是扩散模型的共同发明人,他与Sohl-Dickstein等学者共同构建了扩散模型的理论基础,并通过后续研究推动了模型的实用化。

另一位创始人Aditya Grover曾在Meta FAIR担任研究科学家。

攻读博士学位期间,他先后在谷歌DeepMind、微软研究院和OpenAI实习。

Volodymyr Kuleshov曾在2018年获得Arthur Samuel最佳论文奖。

该团队包括来自Google DeepMind、微软、Meta、OpenAI和NVIDIA的资深人士,目前正专注于用扩散技术改进大模型性能。

Inception Labs还开放了Mercury模型的在线体验平台。

感兴趣的朋友可点击下方链接体验~

论文地址:https://arxiv.org/abs/2506.17298
Mercury在线体验平台:https://chat.inceptionlabs.ai/

参考链接:
https://news.ycombinator.com/item?id=44489690

— 完 —

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张雪峰二婚妻子付幸:几个月婚姻分走数亿,11岁女儿遗产继承复杂

张雪峰二婚妻子付幸:几个月婚姻分走数亿,11岁女儿遗产继承复杂

眼光很亮
2026-03-27 16:04:09
兵败淮海后,47岁邱清泉身中七弹身亡,临终前大骂:老子不突围了

兵败淮海后,47岁邱清泉身中七弹身亡,临终前大骂:老子不突围了

史笔似尘钩
2026-03-23 20:05:30
最贵一只上千元!浙江男子钻进深山4年,养了3万多只

最贵一只上千元!浙江男子钻进深山4年,养了3万多只

万象硬核本尊
2026-03-28 21:12:26
74年李先念找到李德生,沉默半晌后说:要你辞职,是毛主席的建议

74年李先念找到李德生,沉默半晌后说:要你辞职,是毛主席的建议

鹤羽说个事
2026-03-27 22:49:42
俄罗斯:拟自4月1日起禁止汽油出口 优先保障俄国内市场供应

俄罗斯:拟自4月1日起禁止汽油出口 优先保障俄国内市场供应

每日经济新闻
2026-03-28 18:40:36
李荣浩怒撕单依纯恩将仇报自毁前程,离天后王菲距离还差很多原创

李荣浩怒撕单依纯恩将仇报自毁前程,离天后王菲距离还差很多原创

李守智
2026-03-29 16:43:23
伊朗最终还是动用了自己的底牌,证明战争已经到了最危急的时刻!

伊朗最终还是动用了自己的底牌,证明战争已经到了最危急的时刻!

达文西看世界
2026-03-29 13:40:21
汽柴油即将下调!3月29日92/95号汽油最新价,4月7日调价窗口开启

汽柴油即将下调!3月29日92/95号汽油最新价,4月7日调价窗口开启

沙雕小琳琳
2026-03-29 10:28:54
无耻!伊朗把征兵年龄降到12岁了

无耻!伊朗把征兵年龄降到12岁了

老马拉车莫少装
2026-03-27 15:27:16
美顶流主播母亲遭绑60天拖成死局?受访泪崩:怪我有钱有名害了妈!

美顶流主播母亲遭绑60天拖成死局?受访泪崩:怪我有钱有名害了妈!

英国报姐
2026-03-28 21:11:20
委内瑞拉总统马杜罗社交媒体账号发文:我们很好,内心坚定且平静

委内瑞拉总统马杜罗社交媒体账号发文:我们很好,内心坚定且平静

新京报
2026-03-29 10:39:07
暴跌95%,裁员5万人,全球第二大车企爆大雷

暴跌95%,裁员5万人,全球第二大车企爆大雷

蒋东文
2026-03-27 21:09:47
为什么不能让家里女人掌握经济大权 网友讲出一例例实例触目惊心

为什么不能让家里女人掌握经济大权 网友讲出一例例实例触目惊心

侃神评故事
2026-03-29 19:35:03
《三体》作者刘慈欣再开“脑洞”:人类文明只是AI掌管地球的“开机程序 ”

《三体》作者刘慈欣再开“脑洞”:人类文明只是AI掌管地球的“开机程序 ”

中国经营报
2026-03-29 16:39:28
贝克汉姆全家出席活动失控大哭?贝嫂认输愿单独赴美找儿媳求和,还求助好大儿的国宝级教父?

贝克汉姆全家出席活动失控大哭?贝嫂认输愿单独赴美找儿媳求和,还求助好大儿的国宝级教父?

英国报姐
2026-03-28 21:09:42
日本舆论要求日本政府向中方道歉

日本舆论要求日本政府向中方道歉

澎湃新闻
2026-03-28 22:00:07
日本警视厅对强闯 我驻日使馆不法之徒所属 部队驻地等展开搜查

日本警视厅对强闯 我驻日使馆不法之徒所属 部队驻地等展开搜查

每日经济新闻
2026-03-29 09:55:30
伊朗军方:美方唯一能听懂的语言就是武力 将“歼灭”来犯美军

伊朗军方:美方唯一能听懂的语言就是武力 将“歼灭”来犯美军

新京报
2026-03-29 19:38:13
张水华被男选手跟跑!比赛解说怒斥:没有绅士风度 想蹭她的热度

张水华被男选手跟跑!比赛解说怒斥:没有绅士风度 想蹭她的热度

念洲
2026-03-29 08:30:55
洛杉矶10万人 参加“不要国王”抗议 多人被捕

洛杉矶10万人 参加“不要国王”抗议 多人被捕

每日经济新闻
2026-03-29 15:10:55
2026-03-29 23:40:49
量子位 incentive-icons
量子位
追踪人工智能动态
12362文章数 176428关注度
往期回顾 全部

科技要闻

马斯克承认xAI"建错了",11位创始人均离职

头条要闻

中国警告美国:勿将"冲突战乱"引入亚太地区

头条要闻

中国警告美国:勿将"冲突战乱"引入亚太地区

体育要闻

绝杀卫冕冠军后,他单手指天把胜利献给父亲

娱乐要闻

汪峰定律再现!李荣浩喊话单依纯侵权

财经要闻

Kimi、Minimax 们的算力荒

汽车要闻

岚图泰山X8配置曝光 四激光雷达/华为新一代座舱

态度原创

时尚
艺术
健康
数码
军事航空

来到1980的周也,好毛利兰

艺术要闻

耗资4亿!天津第三殡仪馆改成了“公园”样,不阴森了

干细胞抗衰4大误区,90%的人都中招

数码要闻

仅花48元!成功捡漏64GB DDR5内存:血赚好几千

军事要闻

美两栖攻击舰载3500名增援到达

无障碍浏览 进入关怀版