英国国王学院:让AI像人类思考一样"反复斟酌"，生成速度飞跃10倍|翻译|编程|实验

英国国王学院:让AI像人类思考一样"反复斟酌"，生成速度飞跃10倍

2025-11-19 21:20:05　来源: 科技行者

北京举报

分享至

这项由英国国王学院朱青林、姚奕真等研究者领导的研究团队完成的突破性工作，发表于2025年10月的arXiv预印本平台（论文编号：arXiv:2510.11052v2），同时得到了阿斯利康制药公司人工智能中心、香港中文大学以及著名的阿兰·图灵研究院的共同支持。这项研究解决了当前AI文本生成领域的一个核心难题：如何让机器在保持准确性的同时，大幅提升生成速度。

当我们使用ChatGPT或其他AI工具时，可能很少会思考一个问题：为什么AI需要一个字一个字地"憋"出答案？就像一个人在思考复杂问题时，总是要停顿、组织语言，然后缓慢地说出每个词。这种传统的"自回归"生成方式虽然效果不错，但速度实在让人着急，特别是当我们需要AI处理长文本或复杂任务时。

近年来，科学家们尝试了一种新的解决方案，叫做"扩散语言模型"。可以把它想象成这样一个过程：AI不再像传统方式那样从左到右逐字生成，而是先在纸上写满了占位符（就像填空题的空格），然后同时思考所有空格应该填什么，反复修改和完善，直到得出最终答案。这种方法的好处是可以并行处理，理论上速度会快很多。

然而，现有的扩散语言模型存在两个严重问题。第一个问题是"健忘症"：每当AI决定某个位置应该填入特定词汇后，它就会完全忘记之前对这个位置的其他想法，就像一个人做选择题时，一旦选定答案A，就完全忘记了曾经考虑过答案B和C的理由。第二个问题是"急躁症"：AI往往在还没有充分考虑整个句子的逻辑和连贯性时，就匆忙做出局部决定，导致前后矛盾或逻辑不通。

针对这些问题，英国国王学院的研究团队开发了一种名为"潜在精炼解码"（Latent Refinement Decoding，简称LRD）的全新方法。这个方法的巧妙之处在于模仿了人类思考的两个阶段：深思熟虑和果断行动。

在第一阶段，研究团队让AI进入"深思熟虑"模式。不同于传统方法那样非黑即白的选择（要么选这个词，要么完全放弃），LRD允许AI对每个位置保持"模糊"的想法。打个比方，就像一个人在写作时，脑海中对某个位置可能同时浮现几个候选词汇，比如"美丽的"、"漂亮的"、"动人的"，而不是立即确定用哪一个。在这个阶段，AI会将这些可能的选择按照置信度进行"混合"，形成一种介于确定和不确定之间的中间状态。

这种混合的方式非常巧妙。研究团队设计了一个基于"熵"（可以理解为不确定性程度）的权重系统。当AI对某个位置非常确定时，这个位置就更倾向于具体的词汇；当AI还很犹豫时，这个位置就更多地保持"待定"状态。这就像一个人在思考时，对于确定的地方会更加明确，对于不确定的地方会保持开放性。

在这个深思熟虑的阶段，AI会反复调整自己的想法，直到达到一个相对稳定的状态。研究团队通过监测AI思考过程中的"变化程度"来判断是否已经想清楚了。一旦AI的想法不再大幅波动，就意味着它已经对整个问题有了比较完整的理解。

接下来进入第二阶段："果断行动"模式。在这个阶段，AI开始逐步将那些已经比较确定的位置"钉死"，确定具体的词汇，但对于那些仍然不太确定的位置，继续保持之前第一阶段形成的"混合"状态。这样做的好处是，已经确定的部分可以为剩余部分提供更好的上下文信息，帮助AI做出更准确的后续判断。

更重要的是，研究团队还设计了一个"适应性停止"机制。传统方法通常需要固定数量的迭代步骤，不管问题简单还是复杂都要走完全程，就像不管路程远近都要开车一小时才停下。而LRD可以自动判断什么时候已经达到了足够好的结果，可以提前"收工"。对于简单问题，可能几步就搞定；对于复杂问题，会自动延长思考时间。

为了验证这种方法的效果，研究团队在四个不同类型的任务上进行了全面测试。这些任务包括编程问题求解（HumanEval和MBPP）和数学推理问题（GSM8K和MATH500）。测试中使用了两个主要的AI模型家族：LLaDA（8亿参数）和Dream（7亿参数），每个家族都包括基础版本和经过指令调优的版本。

实验结果相当令人鼓舞。在准确性方面，LRD在几乎所有测试场景中都显著超越了传统方法。以最难的编程任务HumanEval为例，改进幅度达到了6.3个百分点，这在AI领域是一个相当可观的提升。在数学推理任务中，提升幅度从1.0到3.8个百分点不等，证明了方法的普适性。

在速度方面，LRD的表现更是惊艳。在处理较短文本（256个字符）时，速度提升达到1.2到2.4倍；在处理中等长度文本（512个字符）时，速度提升达到1.2到4.6倍；最令人印象深刻的是在处理长文本（1024个字符）时，速度提升可以达到1.7到10.6倍。这意味着原本需要10分钟才能完成的任务，现在可能只需要1分钟就能搞定。

研究团队还深入分析了为什么LRD能够取得这样的效果。通过监测AI在处理过程中"想法变化"的程度，他们发现LRD的两阶段设计确实符合预期：在第一阶段，AI的想法会快速收敛到一个稳定状态；在第二阶段，随着确定词汇的逐步增加，AI对剩余位置的判断变得越来越有信心。

特别有趣的是，研究团队发现大多数问题其实在前几个思考步骤中就能得到很好的解决。以Dream模型在编程任务上的表现为例，68.9%的问题在第2步就达到了收敛状态，超过85%的问题在第3步内就搞定了。这说明大多数时候，AI并不需要进行过于复杂的"思考"，关键是要让它在关键时刻能够充分利用全局信息。

为了确保结论的可靠性，研究团队还进行了详细的消融实验，就是逐个移除LRD的各个组件，看看每个部分到底贡献了多少。结果显示，"混合嵌入"机制是整个方法最核心的部分，移除它会导致最大的性能下降。第一阶段的"深思熟虑"过程虽然会稍微增加计算时间，但对最终结果的准确性有重要贡献。而"适应性停止"机制则是速度提升的最主要来源，移除它会让速度优势基本消失。

研究团队还测试了一些关键参数的影响。他们发现，"混合强度"需要恰到好处：太低了就退化成传统方法，太高了又会导致AI过于"犹豫不决"，无法做出有效决策。通过大量实验，他们确定了最优的参数范围。

另一个有趣的发现是，在"混合"过程中，并不需要考虑太多的候选词汇。即使只考虑概率最高的少数几个选择，效果也已经非常好了。这说明关键不在于选择的多样性，而在于能够保持一定的灵活性，避免过早的"一刀切"决策。

从技术角度来看，LRD的成功在于它找到了一个巧妙的平衡点。传统的自回归方法过于保守，每次只敢迈出一小步；早期的扩散方法又过于激进，容易出现前后不一致的问题。LRD通过两阶段设计，既保留了并行处理的速度优势，又避免了过早决策的陷阱。

这项研究的意义不仅仅局限于技术层面的改进。在实际应用中，生成速度的大幅提升意味着AI可以更好地支持实时交互场景，比如智能客服、实时翻译、代码自动完成等。对于需要处理大量文本的应用，比如文档摘要、内容创作、学术论文写作等，这种速度提升更是具有重要的实用价值。

值得注意的是，LRD并不是一个封闭的系统，而是一个可以与现有技术相结合的框架。研究团队指出，LRD可以作为一个"插件式"的解码模块，与未来的扩散语言模型相结合。同时，它还可以与系统级优化技术（如KV缓存、推测性解码等）进一步结合，实现更大的性能提升。

当然，这项研究也存在一些局限性。目前的实验主要集中在编程和数学推理这两个相对结构化的任务上，对于更加开放性的创作任务（如小说写作、诗歌创作）的效果还需要进一步验证。此外，虽然速度有了显著提升，但相比传统自回归模型，扩散模型在部署复杂度和硬件要求方面仍然存在一定挑战。

展望未来，这项研究为AI文本生成领域开辟了一个新的方向。随着硬件性能的不断提升和算法的进一步优化，基于扩散机制的并行生成方法有望成为下一代AI系统的标准配置。特别是在需要高实时性和高质量并存的应用场景中，LRD这样的方法可能会发挥越来越重要的作用。

更深层次地看，这项研究体现了AI发展的一个重要趋势：从简单的模仿人类输出，转向模仿人类思考过程。LRD的两阶段设计实际上反映了人类在处理复杂问题时的认知模式：先进行发散性思考，考虑各种可能性，然后逐步收敛到具体的解决方案。这种"从模糊到清晰"的过程可能是实现更强人工智能的一个重要路径。

此外，研究中提到的"适应性"概念也值得关注。传统的AI系统往往采用"一刀切"的处理方式，对所有问题都使用相同的计算资源和处理步骤。而LRD能够根据问题的复杂程度自动调整处理深度，这种"因题而异"的智能化资源分配方式，可能是未来AI系统的一个重要特征。

说到底，这项来自英国国王学院的研究为我们展示了AI文本生成的一种全新可能性。通过让AI学会"深思熟虑"和"适时决断"，不仅大幅提升了生成速度，还改善了生成质量。这种突破不仅具有重要的技术价值，更为我们理解和改进AI系统的思考方式提供了宝贵的启示。对于普通用户而言，这意味着未来的AI助手可能会变得更加快速和可靠，能够更好地满足我们对实时、高质量文本生成的需求。有兴趣深入了解技术细节的读者，可以通过arXiv:2510.11052v2查阅这项研究的完整论文。

Q&A

Q1：潜在精炼解码（LRD）相比传统AI文本生成有什么优势？

A：LRD的最大优势是同时提升了速度和准确性。传统AI需要一个字一个字地生成文本，而LRD让AI可以同时思考所有位置该填什么，就像同时做多道填空题。在保持甚至提高准确性的前提下，生成速度可以提升1.2到10.6倍。

Q2：LRD的两阶段设计是如何工作的？

A：第一阶段是"深思熟虑"模式，AI对每个位置保持多种可能性的混合状态，不急于做决定；第二阶段是"果断行动"模式，AI逐步确定有把握的位置，同时为不确定的位置提供更好的上下文信息。这种设计模仿了人类思考的自然过程。

Q3：这项技术什么时候能够应用到日常的AI产品中？

A：LRD作为一个通用的解码框架，可以作为"插件"集成到现有的AI系统中。虽然目前还在研究阶段，但由于其显著的性能优势，预计会逐步应用到需要实时文本生成的场景中，如智能客服、代码自动补全和实时翻译等应用。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.