网易首页 > 网易号 > 正文 申请入驻

哈佛大学学者发明"思维压缩器" 让AI推理速度飞跃5倍

0
分享至


来自哈佛大学、加州理工学院MIT和Hippocratic AI的研究团队在2025年11月发表了一项突破性成果,论文题目为"ORION: Teaching Language Models to Reason Efficiently in the Language of Thought"。这项研究发表在顶级会议的评审中,感兴趣的读者可以通过论文编号arXiv:2511.22891v1查询完整内容。

当前的大型语言模型就像一个思维过度活跃的学生,为了解决一道简单的数学题,它会在草稿纸上写满密密麻麻的推理过程,用上千个词来表达本来几句话就能说清楚的思路。比如回答"一个农夫有3只鸡和2头牛,它们总共有多少条腿?"这样的问题,现在的AI模型会絮絮叨叨写上300多个词,反复验算、自我纠错,就像一个缺乏自信的学生在考试时不断检查答案。

这种"话痨式"推理带来了严重的问题。首先是速度慢得让人抓狂,用户等待AI回答一个简单问题可能需要好几秒钟,因为系统在后台生成了大量冗余的思考文字。其次是成本高昂,每多生成一个词就意味着更多的计算资源消耗,就像出租车按里程计费一样,绕远路的代价最终都要用户买单。更重要的是,这种冗长的推理过程往往充满矛盾和错误,就像一个人自言自语时越说越糊涂。

研究团队受到了一个有趣的心理学理论启发——"思维语言假说"。这个理论认为,人类大脑进行复杂思考时并不是用我们平时说话的自然语言,而是用一种更加简洁、符号化的"内在语言",就像程序员写代码时使用的简洁命令一样。当你心算"8+5"时,大脑并不会默念"八加上五等于十三"这样的完整句子,而是用某种更直接的符号运算。

基于这个洞察,研究团队开发了一套名为"Mentalese"(心智语言)的压缩推理系统。这就像给AI安装了一个"思维压缩器",让它学会用最简洁的符号来表达推理过程。原本需要300个词的农夫数腿问题,在新系统中只需要10个词就能搞定:"鸡2腿,牛4腿...3×2+2×4=14"。

然而,仅仅让AI学会简洁表达还不够,研究团队面临一个关键挑战:如何在保持简洁的同时不损失推理的准确性?这就像要求一个健谈的人突然变得惜字如金,初期肯定会出现表达不清、遗漏要点的问题。

为了解决这个难题,研究团队设计了一种巧妙的训练方法,叫做"短优偏好优化"(SLPO)。这种方法的核心思路类似于一个明智的老师评判学生作业:如果两份作业都答对了,那么表达更简洁的那份会得到更高的分数;但如果只有冗长的那份答对了,老师绝不会因为它太啰嗦就给低分。

这种训练策略的精妙之处在于它的自适应性。面对简单问题时,系统会倾向于用最简洁的方式表达;但遇到复杂问题时,系统不会被强制压缩,而是允许使用更多的推理步骤。这就像一个经验丰富的医生,看感冒时几分钟就能下诊断,但面对疑难杂症时会进行详细的检查和分析。

研究团队的训练过程分为两个阶段,就像培养一个高效思考者的完整流程。第一阶段是"符号化学习",让AI系统熟悉这种简洁的表达方式,就像教孩子学会用数学符号而不是文字来表达数学概念。第二阶段是"强化优化",通过奖励机制让AI在保持准确性的前提下追求表达的简洁性。

实验结果令人印象深刻。在数学推理任务上,新开发的ORION模型实现了4到16倍的文字压缩比,推理速度提升了5倍,训练成本降低了7到9倍。更重要的是,准确率只下降了2到10个百分点,这在工程实践中是完全可以接受的代价。

以AIME数学竞赛为例,原本的DeepSeek R1模型需要平均7481个词来解答一道题目,而ORION模型只需要184个词就能达到相近的正确率。这种压缩不是简单的删减,而是真正提取了推理的本质,去除了冗余和噪音。

研究团队还与最先进的商业模型进行了对比测试。令人惊讶的是,他们只有15亿参数的ORION模型,在保持2倍压缩率的情况下,准确率竟然比GPT-4o和Claude-3.5这样的大型模型还要高出5%。这就像一台小巧的跑车在燃油经济性和速度上同时击败了大型SUV。

这项技术的应用前景非常广阔。在实时对话系统中,用户不再需要等待AI冗长的"思考"过程,可以获得几乎即时的智能回复。在教育领域,AI辅导系统可以提供更加清晰、直接的解题思路,而不是让学生被冗长的推理过程搞得更加困惑。在专业咨询服务中,AI可以快速给出要点明确的建议,提高工作效率。

不过,这项技术也存在一些局限性。研究团队发现,过度的压缩训练可能导致AI在面对真正复杂问题时推理深度不够。此外,当给AI设置了过长的生成限制时,它有时会"退化"回原来冗长的推理模式,就像一个已经养成简洁习惯的人在压力下又开始啰嗦。

从技术发展的角度看,这项研究代表了AI领域一个重要的范式转变:从追求"更多"转向追求"更好"。过去几年,AI的发展主要依赖于增加模型规模和数据量,但这种方式面临着成本和效率的双重压力。ORION模型证明了,通过改进算法和训练方法,可以用更小的模型达到更好的效果。

这种技术进步对整个AI产业的意义重大。它降低了部署智能系统的门槛,让更多中小企业能够承担AI应用的成本。同时,它也为AI在移动设备和边缘计算场景中的应用打开了新的可能性,因为压缩后的模型需要更少的计算资源和存储空间。

研究团队还开源了包含4万个数学问题的"MentaleseR-40k"数据集,为其他研究者提供了宝贵的资源。这个数据集中的每个问题都被转换成了简洁的符号化推理形式,就像为AI研究社区提供了一本"高效思维"的教科书。

展望未来,这项技术有可能催生新一代的AI助手,它们不仅更快、更省资源,还能提供更加清晰和直观的推理过程。这对于需要AI解释其决策过程的关键应用场景特别重要,比如医疗诊断、法律分析或金融投资建议。

说到底,这项研究的最大价值在于它改变了我们对AI推理的理解。它证明了智能不在于话说得多,而在于思考得准。就像古人说的"言简意赅",真正的智慧往往体现在用最少的话表达最深刻的思想。ORION模型让AI向着这个方向迈出了重要一步,为未来更加高效、实用的人工智能系统奠定了基础。这不仅是技术的进步,更是AI向人类思维模式学习的一次成功尝试。

Q&A

Q1:Mentalese心智语言是什么?

A:Mentalese是研究团队开发的一种压缩推理语言,类似于数学公式那样用符号化的方式表达思维过程。它让AI不再用冗长的自然语言进行推理,而是用简洁的符号命令,比如用"SET:w;EQ:abs(180-5.5*w)=110"这样的格式来解决数学问题,从而大幅减少不必要的文字。

Q2:ORION模型的推理压缩技术会影响准确率吗?

A:会有一定影响,但在可接受范围内。ORION模型虽然将推理文字压缩了4到16倍,但准确率只下降了2到10个百分点。更重要的是,在某些测试中,ORION模型甚至比GPT-4o和Claude这样的大型模型准确率还要高出5%,证明简洁推理不等于推理能力降低。

Q3:短优偏好优化SLPO训练方法有什么特别之处?

A:SLPO的特别之处在于它不会盲目追求简洁而牺牲准确性。就像一个明智的老师,如果学生的两份作业都答对了,它会奖励更简洁的那份;但如果只有详细的作业答对了,它绝不会因为篇幅长而给低分。这种智能化的奖励机制让AI学会了在保证正确性的前提下追求表达效率。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1.4亿欧!巴黎签阿尔瓦雷斯!

1.4亿欧!巴黎签阿尔瓦雷斯!

足球王国
2026-05-15 13:07:13
鲁比奥:乌克兰军队是欧洲最强大军队,泽连斯基下令对俄反击

鲁比奥:乌克兰军队是欧洲最强大军队,泽连斯基下令对俄反击

史政先锋
2026-05-15 12:20:26
知名女主持人自曝痛到当场求饶,要求立即终止!医生提醒:这些人不要盲目跟风

知名女主持人自曝痛到当场求饶,要求立即终止!医生提醒:这些人不要盲目跟风

上海约饭局
2026-05-13 15:05:22
唏嘘!日本3大旅欧名将无缘世界杯 三笘薫梦碎:开赛1个月前重伤

唏嘘!日本3大旅欧名将无缘世界杯 三笘薫梦碎:开赛1个月前重伤

我爱英超
2026-05-15 13:50:18
演员李雪琴:14岁时父母离异,她患过抑郁症,走红后母亲被判刑

演员李雪琴:14岁时父母离异,她患过抑郁症,走红后母亲被判刑

小椰的奶奶
2026-05-15 14:57:26
明朝灭亡前24小时,崇祯手里还有一张王牌,为何宁死不用?

明朝灭亡前24小时,崇祯手里还有一张王牌,为何宁死不用?

勇哥读史
2026-05-15 21:02:05
怒怼迪士尼优速通的男子,最大问题是没有认清自己的社会底层身份

怒怼迪士尼优速通的男子,最大问题是没有认清自己的社会底层身份

北欧模式
2026-05-15 19:40:51
中塔正式签署“永久”条约,中国西大门牢牢焊死,邻国变成铁杆

中塔正式签署“永久”条约,中国西大门牢牢焊死,邻国变成铁杆

孤城落叶
2026-05-15 07:51:38
气炸!许利民不满北京球员连续失误怒拍广告牌 无缘完成20分大逆转

气炸!许利民不满北京球员连续失误怒拍广告牌 无缘完成20分大逆转

狼叔评论
2026-05-15 22:30:17
相恋仅7个月 !皇马25岁巨星与网红女友分手:姐弟恋告终

相恋仅7个月 !皇马25岁巨星与网红女友分手:姐弟恋告终

叶青足球世界
2026-05-15 20:47:37
马刺新星瓦塞尔身家1900万,5年1.35亿合同细节曝光

马刺新星瓦塞尔身家1900万,5年1.35亿合同细节曝光

慢享生活集
2026-05-16 01:55:35
2026年政府机关编外人员大清理,表面是减人事实是逼着增效!

2026年政府机关编外人员大清理,表面是减人事实是逼着增效!

职场资深秘书
2026-05-01 09:46:57
《主角》花彩香至死不知,这才是胡三元把易青娥托付给米兰的真相

《主角》花彩香至死不知,这才是胡三元把易青娥托付给米兰的真相

阿纂看事
2026-05-15 19:47:23
泰森被主持人问4亿美金怎么花光还倒欠5000万,他坦言职业生涯败家经历让人唏嘘

泰森被主持人问4亿美金怎么花光还倒欠5000万,他坦言职业生涯败家经历让人唏嘘

可乐谈情感
2026-05-15 17:37:43
北京一男子掏空积蓄,凑500万入股中国人寿,20年后分红吓人

北京一男子掏空积蓄,凑500万入股中国人寿,20年后分红吓人

一刀故事
2025-05-14 13:32:29
你发现没有,凡是结婚时不主动提彩礼的,女方家庭通常就是以下两种情况

你发现没有,凡是结婚时不主动提彩礼的,女方家庭通常就是以下两种情况

心理观察局
2026-05-08 09:32:04
来了来了!19岁超级新星!正式打进中国男篮

来了来了!19岁超级新星!正式打进中国男篮

篮球实战宝典
2026-05-15 17:19:02
“摸奶子”惹争议!OPPO的流量反噬来了?莫奈:我背锅?!

“摸奶子”惹争议!OPPO的流量反噬来了?莫奈:我背锅?!

品牌新
2026-05-13 17:03:19
特朗普访华二儿媳旗袍惊艳!不穿大牌穿国货,这波文化尊重有诚意

特朗普访华二儿媳旗袍惊艳!不穿大牌穿国货,这波文化尊重有诚意

知南风
2026-05-16 00:47:49
北京全市,将迎中到大雨!西南部局地或达暴雨量级,气温明起明显下降

北京全市,将迎中到大雨!西南部局地或达暴雨量级,气温明起明显下降

鲁中晨报
2026-05-15 20:22:03
2026-05-16 02:55:00
科技行者 incentive-icons
科技行者
科技正在如何变革商业世界
8357文章数 564关注度
往期回顾 全部

科技要闻

直降千元起步!苹果华为率先开启618让利

头条要闻

黄仁勋在北京喝豆汁痛苦皱眉 问“这是什么东西”

头条要闻

黄仁勋在北京喝豆汁痛苦皱眉 问“这是什么东西”

体育要闻

德约科维奇买的球队,从第6级联赛升入法甲

娱乐要闻

方媛为何要来《桃花坞6》没苦硬吃?

财经要闻

腾讯掉队,马化腾戳破真相

汽车要闻

高尔夫GTI刷新纽北纪录 ID. Polo GTI迎全球首秀

态度原创

健康
本地
旅游
数码
房产

专家揭秘干细胞回输的安全风险

本地新闻

用苏绣的方式,打开江西婺源

旅游要闻

藏在沈阳闹市的金色秘境!2 万㎡油菜花全开,地铁直达还免费

数码要闻

联想发布ThinkPad T14 Gen 7 支持LPCAMM2可更换内存

房产要闻

老黄埔热销之下,珠江春,为何去化仅3成?

无障碍浏览 进入关怀版