网易首页 > 网易号 > 正文 申请入驻

哈佛大学学者发明"思维压缩器" 让AI推理速度飞跃5倍

0
分享至


来自哈佛大学、加州理工学院MIT和Hippocratic AI的研究团队在2025年11月发表了一项突破性成果,论文题目为"ORION: Teaching Language Models to Reason Efficiently in the Language of Thought"。这项研究发表在顶级会议的评审中,感兴趣的读者可以通过论文编号arXiv:2511.22891v1查询完整内容。

当前的大型语言模型就像一个思维过度活跃的学生,为了解决一道简单的数学题,它会在草稿纸上写满密密麻麻的推理过程,用上千个词来表达本来几句话就能说清楚的思路。比如回答"一个农夫有3只鸡和2头牛,它们总共有多少条腿?"这样的问题,现在的AI模型会絮絮叨叨写上300多个词,反复验算、自我纠错,就像一个缺乏自信的学生在考试时不断检查答案。

这种"话痨式"推理带来了严重的问题。首先是速度慢得让人抓狂,用户等待AI回答一个简单问题可能需要好几秒钟,因为系统在后台生成了大量冗余的思考文字。其次是成本高昂,每多生成一个词就意味着更多的计算资源消耗,就像出租车按里程计费一样,绕远路的代价最终都要用户买单。更重要的是,这种冗长的推理过程往往充满矛盾和错误,就像一个人自言自语时越说越糊涂。

研究团队受到了一个有趣的心理学理论启发——"思维语言假说"。这个理论认为,人类大脑进行复杂思考时并不是用我们平时说话的自然语言,而是用一种更加简洁、符号化的"内在语言",就像程序员写代码时使用的简洁命令一样。当你心算"8+5"时,大脑并不会默念"八加上五等于十三"这样的完整句子,而是用某种更直接的符号运算。

基于这个洞察,研究团队开发了一套名为"Mentalese"(心智语言)的压缩推理系统。这就像给AI安装了一个"思维压缩器",让它学会用最简洁的符号来表达推理过程。原本需要300个词的农夫数腿问题,在新系统中只需要10个词就能搞定:"鸡2腿,牛4腿...3×2+2×4=14"。

然而,仅仅让AI学会简洁表达还不够,研究团队面临一个关键挑战:如何在保持简洁的同时不损失推理的准确性?这就像要求一个健谈的人突然变得惜字如金,初期肯定会出现表达不清、遗漏要点的问题。

为了解决这个难题,研究团队设计了一种巧妙的训练方法,叫做"短优偏好优化"(SLPO)。这种方法的核心思路类似于一个明智的老师评判学生作业:如果两份作业都答对了,那么表达更简洁的那份会得到更高的分数;但如果只有冗长的那份答对了,老师绝不会因为它太啰嗦就给低分。

这种训练策略的精妙之处在于它的自适应性。面对简单问题时,系统会倾向于用最简洁的方式表达;但遇到复杂问题时,系统不会被强制压缩,而是允许使用更多的推理步骤。这就像一个经验丰富的医生,看感冒时几分钟就能下诊断,但面对疑难杂症时会进行详细的检查和分析。

研究团队的训练过程分为两个阶段,就像培养一个高效思考者的完整流程。第一阶段是"符号化学习",让AI系统熟悉这种简洁的表达方式,就像教孩子学会用数学符号而不是文字来表达数学概念。第二阶段是"强化优化",通过奖励机制让AI在保持准确性的前提下追求表达的简洁性。

实验结果令人印象深刻。在数学推理任务上,新开发的ORION模型实现了4到16倍的文字压缩比,推理速度提升了5倍,训练成本降低了7到9倍。更重要的是,准确率只下降了2到10个百分点,这在工程实践中是完全可以接受的代价。

以AIME数学竞赛为例,原本的DeepSeek R1模型需要平均7481个词来解答一道题目,而ORION模型只需要184个词就能达到相近的正确率。这种压缩不是简单的删减,而是真正提取了推理的本质,去除了冗余和噪音。

研究团队还与最先进的商业模型进行了对比测试。令人惊讶的是,他们只有15亿参数的ORION模型,在保持2倍压缩率的情况下,准确率竟然比GPT-4o和Claude-3.5这样的大型模型还要高出5%。这就像一台小巧的跑车在燃油经济性和速度上同时击败了大型SUV。

这项技术的应用前景非常广阔。在实时对话系统中,用户不再需要等待AI冗长的"思考"过程,可以获得几乎即时的智能回复。在教育领域,AI辅导系统可以提供更加清晰、直接的解题思路,而不是让学生被冗长的推理过程搞得更加困惑。在专业咨询服务中,AI可以快速给出要点明确的建议,提高工作效率。

不过,这项技术也存在一些局限性。研究团队发现,过度的压缩训练可能导致AI在面对真正复杂问题时推理深度不够。此外,当给AI设置了过长的生成限制时,它有时会"退化"回原来冗长的推理模式,就像一个已经养成简洁习惯的人在压力下又开始啰嗦。

从技术发展的角度看,这项研究代表了AI领域一个重要的范式转变:从追求"更多"转向追求"更好"。过去几年,AI的发展主要依赖于增加模型规模和数据量,但这种方式面临着成本和效率的双重压力。ORION模型证明了,通过改进算法和训练方法,可以用更小的模型达到更好的效果。

这种技术进步对整个AI产业的意义重大。它降低了部署智能系统的门槛,让更多中小企业能够承担AI应用的成本。同时,它也为AI在移动设备和边缘计算场景中的应用打开了新的可能性,因为压缩后的模型需要更少的计算资源和存储空间。

研究团队还开源了包含4万个数学问题的"MentaleseR-40k"数据集,为其他研究者提供了宝贵的资源。这个数据集中的每个问题都被转换成了简洁的符号化推理形式,就像为AI研究社区提供了一本"高效思维"的教科书。

展望未来,这项技术有可能催生新一代的AI助手,它们不仅更快、更省资源,还能提供更加清晰和直观的推理过程。这对于需要AI解释其决策过程的关键应用场景特别重要,比如医疗诊断、法律分析或金融投资建议。

说到底,这项研究的最大价值在于它改变了我们对AI推理的理解。它证明了智能不在于话说得多,而在于思考得准。就像古人说的"言简意赅",真正的智慧往往体现在用最少的话表达最深刻的思想。ORION模型让AI向着这个方向迈出了重要一步,为未来更加高效、实用的人工智能系统奠定了基础。这不仅是技术的进步,更是AI向人类思维模式学习的一次成功尝试。

Q&A

Q1:Mentalese心智语言是什么?

A:Mentalese是研究团队开发的一种压缩推理语言,类似于数学公式那样用符号化的方式表达思维过程。它让AI不再用冗长的自然语言进行推理,而是用简洁的符号命令,比如用"SET:w;EQ:abs(180-5.5*w)=110"这样的格式来解决数学问题,从而大幅减少不必要的文字。

Q2:ORION模型的推理压缩技术会影响准确率吗?

A:会有一定影响,但在可接受范围内。ORION模型虽然将推理文字压缩了4到16倍,但准确率只下降了2到10个百分点。更重要的是,在某些测试中,ORION模型甚至比GPT-4o和Claude这样的大型模型准确率还要高出5%,证明简洁推理不等于推理能力降低。

Q3:短优偏好优化SLPO训练方法有什么特别之处?

A:SLPO的特别之处在于它不会盲目追求简洁而牺牲准确性。就像一个明智的老师,如果学生的两份作业都答对了,它会奖励更简洁的那份;但如果只有详细的作业答对了,它绝不会因为篇幅长而给低分。这种智能化的奖励机制让AI学会了在保证正确性的前提下追求表达效率。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
去了一趟伊朗才发现:原来在伊朗人眼里,中国人是这样的

去了一趟伊朗才发现:原来在伊朗人眼里,中国人是这样的

千秋文化
2026-03-24 21:40:40
河南街头用头撞车事件,警方回应后续来了!评论区彻底炸锅

河南街头用头撞车事件,警方回应后续来了!评论区彻底炸锅

奇思妙想草叶君
2026-03-25 13:12:39
高速停车区卫生间,满地手纸无从下脚;甘肃高速回应:是个待开发停车区,已打扫干净

高速停车区卫生间,满地手纸无从下脚;甘肃高速回应:是个待开发停车区,已打扫干净

大风新闻
2026-03-26 18:19:03
宅基地确权最后冲刺:今年不把名字改成儿子的,以后可能就改不了

宅基地确权最后冲刺:今年不把名字改成儿子的,以后可能就改不了

混沌录
2026-03-19 21:59:03
周恩来晚年含泪揭秘,当年若非毛主席深夜提灯来,历史或将改写

周恩来晚年含泪揭秘,当年若非毛主席深夜提灯来,历史或将改写

鹤羽说个事
2026-03-18 21:47:42
张雪峰离世1天后,才发现女儿名字取得暗藏深意,字字都有来头

张雪峰离世1天后,才发现女儿名字取得暗藏深意,字字都有来头

暖心萌阿菇凉
2026-03-25 22:01:09
中国游客到朝鲜游玩,朝鲜人疑问:为什么中国人自由却过的不幸福

中国游客到朝鲜游玩,朝鲜人疑问:为什么中国人自由却过的不幸福

白色得季节
2026-03-16 19:50:53
夫妻性生活:别再傻傻用力了!让妻子上瘾的三个技巧,男人必看!

夫妻性生活:别再傻傻用力了!让妻子上瘾的三个技巧,男人必看!

精彩分享快乐
2025-11-20 00:05:03
江西铜业:2025年净利润同比增长2.41% 拟10派6元

江西铜业:2025年净利润同比增长2.41% 拟10派6元

证券时报
2026-03-26 18:22:05
笑掉大牙!伊朗高层当众互撕,吹破天的强硬,连军饷都发不出来

笑掉大牙!伊朗高层当众互撕,吹破天的强硬,连军饷都发不出来

老马拉车莫少装
2026-03-25 19:39:00
他偷偷处决了军统站长,明知要被上级除掉,他却还敢去赴约

他偷偷处决了军统站长,明知要被上级除掉,他却还敢去赴约

浩渺青史
2026-03-26 17:32:02
张雪峰离世后,妻子真实身份曝光:历史博士、高校副教授,40天闪婚

张雪峰离世后,妻子真实身份曝光:历史博士、高校副教授,40天闪婚

画夕
2026-03-26 20:44:59
华尔街大鳄称:黄金正重演2008年剧本!金价将涨到11400美元?

华尔街大鳄称:黄金正重演2008年剧本!金价将涨到11400美元?

王爷说图表
2026-03-25 22:43:39
热到25.8℃!别急,成都天气又要变

热到25.8℃!别急,成都天气又要变

掌上金牛
2026-03-26 19:19:29
柯文哲一审重判17年,真正被击中的,是民众党赖以生存的那块招牌

柯文哲一审重判17年,真正被击中的,是民众党赖以生存的那块招牌

蓝色海边
2026-03-26 17:10:03
问界M6实车到店,全新中大型SUV,预售26.98万起,会被大家认可吗

问界M6实车到店,全新中大型SUV,预售26.98万起,会被大家认可吗

红涛说車
2026-03-25 21:08:55
50岁何润东做梦也没想到,因张凌赫一个造型,让他的口碑一夜暴涨

50岁何润东做梦也没想到,因张凌赫一个造型,让他的口碑一夜暴涨

八卦南风
2026-03-24 15:15:25
“这次穿得算保守了”,女老师短裙配蕾丝袜,学生上课头都不敢抬

“这次穿得算保守了”,女老师短裙配蕾丝袜,学生上课头都不敢抬

妍妍教育日记
2026-03-21 10:05:03
女孩当小姐,一晚要提供4到5次上门服务,被亲人点到不赴约

女孩当小姐,一晚要提供4到5次上门服务,被亲人点到不赴约

情感艺术家
2026-02-26 10:48:00
66岁大妈喜欢睡前泡脚,不久脑梗去世,专家怒斥:太无知了

66岁大妈喜欢睡前泡脚,不久脑梗去世,专家怒斥:太无知了

比利
2026-03-21 13:00:22
2026-03-26 21:44:49
科技行者 incentive-icons
科技行者
科技正在如何变革商业世界
7757文章数 556关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

美国总统特朗普公开宣布访华行程 外交部回应

头条要闻

美国总统特朗普公开宣布访华行程 外交部回应

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

房产
时尚
艺术
数码
公开课

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

上新|| 她们说,找到了自己的人生裙子!

艺术要闻

哪一座桥不是风景?

数码要闻

iQOO Z11x发布:LCD党的护眼神机 1499元起

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版