网易首页 > 网易号 > 正文 申请入驻

哈佛大学学者发明"思维压缩器" 让AI推理速度飞跃5倍

0
分享至


来自哈佛大学、加州理工学院MIT和Hippocratic AI的研究团队在2025年11月发表了一项突破性成果,论文题目为"ORION: Teaching Language Models to Reason Efficiently in the Language of Thought"。这项研究发表在顶级会议的评审中,感兴趣的读者可以通过论文编号arXiv:2511.22891v1查询完整内容。

当前的大型语言模型就像一个思维过度活跃的学生,为了解决一道简单的数学题,它会在草稿纸上写满密密麻麻的推理过程,用上千个词来表达本来几句话就能说清楚的思路。比如回答"一个农夫有3只鸡和2头牛,它们总共有多少条腿?"这样的问题,现在的AI模型会絮絮叨叨写上300多个词,反复验算、自我纠错,就像一个缺乏自信的学生在考试时不断检查答案。

这种"话痨式"推理带来了严重的问题。首先是速度慢得让人抓狂,用户等待AI回答一个简单问题可能需要好几秒钟,因为系统在后台生成了大量冗余的思考文字。其次是成本高昂,每多生成一个词就意味着更多的计算资源消耗,就像出租车按里程计费一样,绕远路的代价最终都要用户买单。更重要的是,这种冗长的推理过程往往充满矛盾和错误,就像一个人自言自语时越说越糊涂。

研究团队受到了一个有趣的心理学理论启发——"思维语言假说"。这个理论认为,人类大脑进行复杂思考时并不是用我们平时说话的自然语言,而是用一种更加简洁、符号化的"内在语言",就像程序员写代码时使用的简洁命令一样。当你心算"8+5"时,大脑并不会默念"八加上五等于十三"这样的完整句子,而是用某种更直接的符号运算。

基于这个洞察,研究团队开发了一套名为"Mentalese"(心智语言)的压缩推理系统。这就像给AI安装了一个"思维压缩器",让它学会用最简洁的符号来表达推理过程。原本需要300个词的农夫数腿问题,在新系统中只需要10个词就能搞定:"鸡2腿,牛4腿...3×2+2×4=14"。

然而,仅仅让AI学会简洁表达还不够,研究团队面临一个关键挑战:如何在保持简洁的同时不损失推理的准确性?这就像要求一个健谈的人突然变得惜字如金,初期肯定会出现表达不清、遗漏要点的问题。

为了解决这个难题,研究团队设计了一种巧妙的训练方法,叫做"短优偏好优化"(SLPO)。这种方法的核心思路类似于一个明智的老师评判学生作业:如果两份作业都答对了,那么表达更简洁的那份会得到更高的分数;但如果只有冗长的那份答对了,老师绝不会因为它太啰嗦就给低分。

这种训练策略的精妙之处在于它的自适应性。面对简单问题时,系统会倾向于用最简洁的方式表达;但遇到复杂问题时,系统不会被强制压缩,而是允许使用更多的推理步骤。这就像一个经验丰富的医生,看感冒时几分钟就能下诊断,但面对疑难杂症时会进行详细的检查和分析。

研究团队的训练过程分为两个阶段,就像培养一个高效思考者的完整流程。第一阶段是"符号化学习",让AI系统熟悉这种简洁的表达方式,就像教孩子学会用数学符号而不是文字来表达数学概念。第二阶段是"强化优化",通过奖励机制让AI在保持准确性的前提下追求表达的简洁性。

实验结果令人印象深刻。在数学推理任务上,新开发的ORION模型实现了4到16倍的文字压缩比,推理速度提升了5倍,训练成本降低了7到9倍。更重要的是,准确率只下降了2到10个百分点,这在工程实践中是完全可以接受的代价。

以AIME数学竞赛为例,原本的DeepSeek R1模型需要平均7481个词来解答一道题目,而ORION模型只需要184个词就能达到相近的正确率。这种压缩不是简单的删减,而是真正提取了推理的本质,去除了冗余和噪音。

研究团队还与最先进的商业模型进行了对比测试。令人惊讶的是,他们只有15亿参数的ORION模型,在保持2倍压缩率的情况下,准确率竟然比GPT-4o和Claude-3.5这样的大型模型还要高出5%。这就像一台小巧的跑车在燃油经济性和速度上同时击败了大型SUV。

这项技术的应用前景非常广阔。在实时对话系统中,用户不再需要等待AI冗长的"思考"过程,可以获得几乎即时的智能回复。在教育领域,AI辅导系统可以提供更加清晰、直接的解题思路,而不是让学生被冗长的推理过程搞得更加困惑。在专业咨询服务中,AI可以快速给出要点明确的建议,提高工作效率。

不过,这项技术也存在一些局限性。研究团队发现,过度的压缩训练可能导致AI在面对真正复杂问题时推理深度不够。此外,当给AI设置了过长的生成限制时,它有时会"退化"回原来冗长的推理模式,就像一个已经养成简洁习惯的人在压力下又开始啰嗦。

从技术发展的角度看,这项研究代表了AI领域一个重要的范式转变:从追求"更多"转向追求"更好"。过去几年,AI的发展主要依赖于增加模型规模和数据量,但这种方式面临着成本和效率的双重压力。ORION模型证明了,通过改进算法和训练方法,可以用更小的模型达到更好的效果。

这种技术进步对整个AI产业的意义重大。它降低了部署智能系统的门槛,让更多中小企业能够承担AI应用的成本。同时,它也为AI在移动设备和边缘计算场景中的应用打开了新的可能性,因为压缩后的模型需要更少的计算资源和存储空间。

研究团队还开源了包含4万个数学问题的"MentaleseR-40k"数据集,为其他研究者提供了宝贵的资源。这个数据集中的每个问题都被转换成了简洁的符号化推理形式,就像为AI研究社区提供了一本"高效思维"的教科书。

展望未来,这项技术有可能催生新一代的AI助手,它们不仅更快、更省资源,还能提供更加清晰和直观的推理过程。这对于需要AI解释其决策过程的关键应用场景特别重要,比如医疗诊断、法律分析或金融投资建议。

说到底,这项研究的最大价值在于它改变了我们对AI推理的理解。它证明了智能不在于话说得多,而在于思考得准。就像古人说的"言简意赅",真正的智慧往往体现在用最少的话表达最深刻的思想。ORION模型让AI向着这个方向迈出了重要一步,为未来更加高效、实用的人工智能系统奠定了基础。这不仅是技术的进步,更是AI向人类思维模式学习的一次成功尝试。

Q&A

Q1:Mentalese心智语言是什么?

A:Mentalese是研究团队开发的一种压缩推理语言,类似于数学公式那样用符号化的方式表达思维过程。它让AI不再用冗长的自然语言进行推理,而是用简洁的符号命令,比如用"SET:w;EQ:abs(180-5.5*w)=110"这样的格式来解决数学问题,从而大幅减少不必要的文字。

Q2:ORION模型的推理压缩技术会影响准确率吗?

A:会有一定影响,但在可接受范围内。ORION模型虽然将推理文字压缩了4到16倍,但准确率只下降了2到10个百分点。更重要的是,在某些测试中,ORION模型甚至比GPT-4o和Claude这样的大型模型准确率还要高出5%,证明简洁推理不等于推理能力降低。

Q3:短优偏好优化SLPO训练方法有什么特别之处?

A:SLPO的特别之处在于它不会盲目追求简洁而牺牲准确性。就像一个明智的老师,如果学生的两份作业都答对了,它会奖励更简洁的那份;但如果只有详细的作业答对了,它绝不会因为篇幅长而给低分。这种智能化的奖励机制让AI学会了在保证正确性的前提下追求表达效率。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
逆转中国台北,男篮3人优秀,1人最差,赢球功臣锁定,出线稳了

逆转中国台北,男篮3人优秀,1人最差,赢球功臣锁定,出线稳了

现代小青青慕慕
2026-03-02 02:12:30
蒙古为何成为韩国老男人的圣地?带你去瞧瞧这个可悲的国家

蒙古为何成为韩国老男人的圣地?带你去瞧瞧这个可悲的国家

吕醿极限手工
2025-12-29 18:33:00
内维尔:桑切斯今天表现得很差,几乎是完全失控了

内维尔:桑切斯今天表现得很差,几乎是完全失控了

懂球帝
2026-03-02 02:30:47
透露S妈悲伤过度被送急诊,她表示很久没有见小玥儿,小箖箖

透露S妈悲伤过度被送急诊,她表示很久没有见小玥儿,小箖箖

情感大头说说
2026-03-02 00:18:09
罗德里戈:内马尔入选世界杯大名单不存在争议,我们需要他

罗德里戈:内马尔入选世界杯大名单不存在争议,我们需要他

懂球帝
2026-03-01 21:09:57
2023年,100岁的基辛格预测:若爆发三战,敢打美国本土仅3个国家

2023年,100岁的基辛格预测:若爆发三战,敢打美国本土仅3个国家

李哥三观很正
2024-09-01 04:23:53
曾经的重点大学沦为双非!这4所高校实力堪比211,录取分却被低估

曾经的重点大学沦为双非!这4所高校实力堪比211,录取分却被低估

Delete丨CC
2026-03-01 19:43:25
全球首款机器人手机!荣耀Robot Phone亮相MWC:今年就量产发布

全球首款机器人手机!荣耀Robot Phone亮相MWC:今年就量产发布

快科技
2026-03-01 22:45:20
亚马尔闪耀背后,放大了巴萨1个棘手问题,3大球星全难成主力

亚马尔闪耀背后,放大了巴萨1个棘手问题,3大球星全难成主力

晚雾空青
2026-03-02 01:33:19
自称无法获得世界宽恕后,中央媒体对谷爱凌的称呼发生变化

自称无法获得世界宽恕后,中央媒体对谷爱凌的称呼发生变化

陈意小可爱
2026-03-01 13:17:13
国家最大的敌人,是愚昧和僵化

国家最大的敌人,是愚昧和僵化

深度报
2026-02-06 22:28:05
放假半天!不补休

放假半天!不补休

小易商丘
2026-03-01 10:00:47
胡春华发表署名文章

胡春华发表署名文章

社评
2025-10-31 10:11:37
褚时健到2002年才明白,原来当年是得罪了惹不起的那几位

褚时健到2002年才明白,原来当年是得罪了惹不起的那几位

阿柒的讯
2026-02-24 15:07:34
这女的真不讲究

这女的真不讲究

太急张三疯
2026-02-14 19:35:03
1980年邓小平说:毛主席的错误,要毫不含糊地批评,但要实事求是

1980年邓小平说:毛主席的错误,要毫不含糊地批评,但要实事求是

帝哥说史
2026-02-25 06:30:03
意外!这是中超冠军?上港全场0射正,新外援被北京国安踢哭了

意外!这是中超冠军?上港全场0射正,新外援被北京国安踢哭了

罗掌柜体育
2026-03-01 18:54:02
美国女子:我告知移民局特工患有自闭症后,他们将我从车里拖出来

美国女子:我告知移民局特工患有自闭症后,他们将我从车里拖出来

倾世璃歌
2026-02-06 13:05:02
哈梅内伊之死成“遇害”,哈尼亚死后页面变黑白,异国孝行感天地

哈梅内伊之死成“遇害”,哈尼亚死后页面变黑白,异国孝行感天地

山间听雨
2026-03-01 20:59:10
特朗普可能会成为美国历史上最倒霉的总统,在特殊的时刻当上总统

特朗普可能会成为美国历史上最倒霉的总统,在特殊的时刻当上总统

百态人间
2026-02-09 15:39:25
2026-03-02 04:27:00
科技行者 incentive-icons
科技行者
科技正在如何变革商业世界
7389文章数 553关注度
往期回顾 全部

科技要闻

荣耀发布机器人手机、折叠屏、人形机器人

头条要闻

特朗普警告伊朗“不要报复” 伊朗外长回应

头条要闻

特朗普警告伊朗“不要报复” 伊朗外长回应

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

黄景瑜 李雪健坐镇!38集犯罪大剧来袭

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

理想汽车2月交付26421辆 历史累计交付超159万辆

态度原创

数码
游戏
旅游
本地
家居

数码要闻

曝苹果WWDC 26将推Core AI框架取代Core ML并公布多项AI功能

以《生化危机》命名?Capcom解答对RE引擎的误读

旅游要闻

青州春雨刷屏,千年古城烟雨朦胧,藏着最动人的东方浪漫!

本地新闻

津南好·四时总相宜

家居要闻

素色肌理 品意式格调

无障碍浏览 进入关怀版