网易首页 > 网易号 > 正文 申请入驻

帝国理工学院和爱丁堡大学联合突破让AI写作效率翻倍

0
分享至


当我们写作时,通常会先在脑海中构思整体框架,然后决定先写哪一段,后写哪一段。比如写一篇关于做菜的文章,我们可能先写食材准备,再写烹饪步骤,最后写装盘技巧。但如果让计算机来写作,它通常只能像流水线一样从头到尾按顺序生成,就像只会按照1、2、3、4的顺序填空,不能灵活调整。

这项由帝国理工学院和爱丁堡大学联合开展的研究发表于2026年,论文编号为arXiv:2602.12586v1,为人工智能写作带来了一个重要突破。研究团队开发了一种名为MCDIFFUSE的新方法,让AI能够像人类一样进行"计划后填空"的智能写作。

传统的AI写作系统就像一个只会按部就班的学生,必须从第一个字开始,按顺序写到最后一个字。而新的扩散语言模型虽然可以跳跃式填空,但往往不知道该先填哪个空,后填哪个空,就像一个拿着拼图块却不知道先拼哪块的人。研究团队发现,如果能教会AI合理安排填空顺序,就能显著提升写作质量。

MCDIFFUSE的核心创新就像给AI安装了一个"写作策略大脑"。这个大脑会在每次填空前进行"预演",就像下棋高手会在脑海中提前模拟几步棋一样。当AI面临多个可以填写的空白时,它不会盲目选择,而是会先在心里把每种选择的后续发展都推演一遍,然后选择能让整篇文章最连贯、最优质的那个选项。

研究团队用了一种叫做蒙特卡洛树搜索的技术,这听起来很复杂,但实际上就像一个非常聪明的"试错系统"。假设你在玩一个填字游戏,有很多空格要填。普通的方法是看哪个空格最有把握就先填哪个,但MCDIFFUSE的方法是先想象"如果我先填这个空格,后面会发生什么情况?如果先填那个空格,又会怎样?"通过这种反复的心理演练,它能找到最佳的填写顺序。

具体来说,当AI遇到一篇需要填空的文档时,比如一段代码中有多个空白需要填写,MCDIFFUSE会先把所有可能的填写方案都在脑海中"试演"一遍。就像一个象棋大师在下棋前会在心里模拟"如果我走这步,对方可能会这样应对,然后我再这样走..."一样,AI也会模拟"如果我先填这个空,然后填那个空,最后的效果会如何?"

这种方法在编程任务上表现尤其出色。在MBPP编程测试中,MCDIFFUSE的表现比传统方法提升了19.5%,在数学推理任务MATH500上提升了4.9%。这相当于把一个60分的学生提升到了72分,是非常显著的进步。更令人惊喜的是,MCDIFFUSE生成的内容更加简洁,平均比传统方法减少了65%的文字长度,但质量却更高。

研究过程中,团队还发现了一个有趣的现象。虽然MCDIFFUSE大部分时候还是按照从左到右的顺序填空,就像我们正常的阅读习惯,但在大约7-10%的情况下,它会选择"非常规"的填空顺序。这些看似"不按常理出牌"的选择,往往能带来质量的显著提升。就像烹饪中有时候需要先处理配菜再处理主料一样,看似打破常规,实际上却能让最终的菜品更加出色。

团队在六个不同的任务上测试了MCDIFFUSE,包括数学推理、代码生成和常识问答。结果显示,这个新方法不仅在编程任务上表现优异,在其他类型的任务中也有稳定的提升。特别是在需要严格逻辑结构的编程任务中,合理的填空顺序显得尤为重要,因为代码的不同部分之间存在复杂的依赖关系,就像建房子必须先打地基再建墙一样。

更深入的分析揭示了两个重要发现。首先,虽然按顺序填空是主流策略,但适当的"跳跃式"填空确实能带来更好的效果。其次,与传统的搜索方法不同,MCDIFFUSE需要的不是更多的"试错次数",而是更大胆的"探索勇气"。就像探险家发现新大陆需要的不是更多的船只,而是敢于偏离既定航线的勇气。

从技术实现角度来看,MCDIFFUSE就像一个配备了"战略顾问"的写作AI。这个顾问会综合考虑两个因素:一是当前选择的"即时收益"(填这个空能得到多少分),二是"长远影响"(这个选择会对后续填空造成什么影响)。通过巧妙平衡这两个因素,AI能做出更加明智的决策。

研究团队特别强调,MCDIFFUSE不需要额外的训练,这意味着它可以直接应用到现有的AI系统中。这就像给现有的汽车安装了一个更智能的导航系统,不需要换车,但能让驾驶体验显著提升。

实验结果表明,当AI需要生成结构化内容时,比如编写代码或解决数学问题,合理的填空顺序就像演奏交响乐时的精确节拍一样重要。每个音符(或代码片段)都需要在正确的时机出现,才能创造出和谐的整体效果。

这项研究的意义不仅在于技术突破,更在于它揭示了AI写作的一个基本原理:顺序很重要。就像做菜时调料添加的顺序会影响最终口味,AI填空的顺序也会影响生成内容的质量。MCDIFFUSE通过系统性地优化这个顺序,让AI写作向人类的写作思维又迈进了一步。

研究团队还发现,在计算资源的使用上,MCDIFFUSE实现了一个有趣的平衡。它不需要大幅增加计算量,主要的额外开销来自于"思考时间"而不是"计算复杂度"。这就像一个棋手花更多时间思考策略,而不是需要更强的计算能力。

对于未来的应用前景,MCDIFFUSE为AI写作助手、代码生成工具和自动化内容创作打开了新的可能。它让我们看到,AI不仅能够模仿人类的写作结果,还能学习人类的写作过程和思维方式。当AI开始像人类一样"先构思,再下笔"时,我们距离真正智能的AI助手又近了一步。

说到底,这项研究告诉我们一个朴素但重要的道理:即使在人工智能领域,"磨刀不误砍柴工"的古训依然适用。花时间制定好策略,往往比盲目行动更能取得好结果。MCDIFFUSE让AI学会了这个道理,也为我们展示了AI写作的美好未来。对于那些关心AI发展的读者,这项研究提供了一个令人鼓舞的信号:AI正在变得更加智能,更加接近人类的思维方式。有兴趣深入了解技术细节的读者,可以通过论文编号arXiv:2602.12586v1查询完整的研究报告。

Q&A

Q1:MCDIFFUSE是什么,它是如何工作的?

A:MCDIFFUSE是一种让AI智能决定填空顺序的新技术。它就像给AI安装了一个"写作策略大脑",会在填空前先预演各种可能性,选择最能提升整体质量的填空顺序,而不是盲目按序填写。

Q2:MCDIFFUSE比传统AI写作方法好在哪里?

A:MCDIFFUSE在编程任务上提升了19.5%,在数学推理上提升了4.9%,同时生成的内容平均减少65%的冗余文字但质量更高。它让AI能够像人类一样进行策略性写作,而不是机械式的顺序填空。

Q3:普通人什么时候能用上MCDIFFUSE技术?

A:由于MCDIFFUSE不需要额外训练就能应用到现有AI系统中,预计很快就能集成到AI写作助手、代码生成工具等产品中。这意味着普通用户在使用AI写作工具时,很可能已经在享受这项技术带来的质量提升。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
胜日本贺希宁采访!哽咽强调意义重大,解析半场调整,寄语回正轨

胜日本贺希宁采访!哽咽强调意义重大,解析半场调整,寄语回正轨

篮球资讯达人
2026-02-26 21:52:24
皇马名宿:如果当年有VAR,巴萨梦一队至少会少拿3座联赛冠军

皇马名宿:如果当年有VAR,巴萨梦一队至少会少拿3座联赛冠军

懂球帝
2026-02-26 21:46:19
谢贤前女友再曝猛料!相识第一天拒绝了两次谢贤,当时行情非常好

谢贤前女友再曝猛料!相识第一天拒绝了两次谢贤,当时行情非常好

念得小柔
2026-02-13 02:19:33
浙江二婚女爱上新西兰小伙,带着女儿移民新西兰,5年后神秘失踪

浙江二婚女爱上新西兰小伙,带着女儿移民新西兰,5年后神秘失踪

徐云流浪中国
2026-02-26 18:34:11
三进万安滩,从屈辱撤离到扬眉吐气,越南已不在威胁中国的名单中

三进万安滩,从屈辱撤离到扬眉吐气,越南已不在威胁中国的名单中

触摸史迹
2026-02-26 11:28:32
体制内情商高能带来啥意外惊喜?网友:别在地铁看,别问我为什么

体制内情商高能带来啥意外惊喜?网友:别在地铁看,别问我为什么

带你感受人间冷暖
2026-02-24 01:03:13
1985年我带的班装备总出故障,突然全连装备焕然一新,后来才知我的兵半夜偷着修

1985年我带的班装备总出故障,突然全连装备焕然一新,后来才知我的兵半夜偷着修

Ck的蜜糖
2026-02-24 09:35:08
突发,比尔盖茨承认萝莉岛事件,更多内幕曝光

突发,比尔盖茨承认萝莉岛事件,更多内幕曝光

新行情
2026-02-26 15:46:30
你在闲鱼上买过什么好东西?网友:人类对咸鱼的开发不足1%

你在闲鱼上买过什么好东西?网友:人类对咸鱼的开发不足1%

另子维爱读史
2026-01-09 21:12:13
贵妇影帝私生子被女儿撞见

贵妇影帝私生子被女儿撞见

毒舌扒姨太
2026-02-25 22:39:28
国际篮联严惩!中国男篮遭遇2次误判细节曝光,中国篮协应上诉

国际篮联严惩!中国男篮遭遇2次误判细节曝光,中国篮协应上诉

何老师呀
2026-02-26 23:05:32
中国男篮赢球仍有一人该批!王牌前锋在场输10分,郭士强认清现实

中国男篮赢球仍有一人该批!王牌前锋在场输10分,郭士强认清现实

老叶评球
2026-02-26 21:40:12
台退将:站在金门看大陆,我以为中国大陆已经打通了!

台退将:站在金门看大陆,我以为中国大陆已经打通了!

米师傅安装
2026-01-22 03:35:20
官宣!正式加盟,连续9年全水啊,湖人终于醒目,佩林卡有救了

官宣!正式加盟,连续9年全水啊,湖人终于醒目,佩林卡有救了

球童无忌
2026-02-26 16:01:13
著名演员罗伯特自杀离世,享年71岁,被躁郁症折磨选择轻生

著名演员罗伯特自杀离世,享年71岁,被躁郁症折磨选择轻生

素素娱乐
2026-02-25 15:29:00
爱泼斯坦案再曝猛料!女星指控献祭,证人曝狩猎派对像饥饿游戏

爱泼斯坦案再曝猛料!女星指控献祭,证人曝狩猎派对像饥饿游戏

小徐讲八卦
2026-02-25 07:05:52
攻不了,也守不住?中国空军在西藏上空,被印度空军足足欺负40年

攻不了,也守不住?中国空军在西藏上空,被印度空军足足欺负40年

来科点谱
2026-02-22 07:15:34
哈登重伤!骑士爆冷惜败,施罗德26分,阿伦27+11,一战看穿3件事

哈登重伤!骑士爆冷惜败,施罗德26分,阿伦27+11,一战看穿3件事

篮球扫地僧
2026-02-26 17:53:36
门乔被杀只是开始!毒贩向墨西哥政府宣战:这届世界杯,别想看!

门乔被杀只是开始!毒贩向墨西哥政府宣战:这届世界杯,别想看!

瓜哥的动物日记
2026-02-25 15:33:17
牟宗义被查

牟宗义被查

观察者网
2026-02-26 09:34:05
2026-02-27 00:03:00
科技行者 incentive-icons
科技行者
科技正在如何变革商业世界
7349文章数 553关注度
往期回顾 全部

科技要闻

单季营收681亿净利429亿!英伟达再次炸裂

头条要闻

男子因银行系统错误"欠款1000万亿":工厂可能会被拍卖

头条要闻

男子因银行系统错误"欠款1000万亿":工厂可能会被拍卖

体育要闻

从排球少女到冰壶女神,她在米兰冬奥练出6块腹肌

娱乐要闻

向华强公开表态 财产留给儿媳妇郭碧婷

财经要闻

中国AI调用量超美国 4款大模型霸榜前5

汽车要闻

40岁的吉利,不惑于内外

态度原创

时尚
本地
艺术
家居
旅游

今年春天最美搭配:西装+半裙,怎么穿都好看!

本地新闻

津南好·四时总相宜

艺术要闻

2025第三届全国水粉画大展 | 入选作品选刊

家居要闻

归隐于都市 慢享自由

旅游要闻

迪士尼米奇也过中国年!

无障碍浏览 进入关怀版