网易首页 > 网易号 > 正文 申请入驻

结构为王:AI 推理新思路,思维链结构成突破 LLM 高效训练关键

0
分享至

IT之家 2 月 15 日消息,科技媒体 marktechpost 昨日(2 月 14 日)发布博文,报道称加州大学伯克利分校的研究团队提出了一种 AI 训练方法,仅需少量数据即可增强大语言模型(LLM)推理能力。

提升 LLM 推理能力的难点在于训练模型生成具有结构化自反思、验证和回溯的长链式思维(CoT)响应。现有模型的训练过程通常需要在大量数据集上进行昂贵的微调,且许多专有模型的训练方法并不公开。

研究团队提出了一种新的训练方法,仅使用 17000 个 CoT 示例,微调 Qwen2.5-32B-Instruct 模型,并结合了 SFT 和 LoRA 微调技术,强调优化推理步骤的结构完整性而非内容本身,通过改进逻辑一致性并最大限度地减少不必要的计算开销,从而显著提高了 LLM 的推理效率。

研究表明,在增强 LLM 推理性能方面,CoT 的结构起着至关重要的作用,改变训练数据的逻辑结构会显著影响模型的准确性,而修改单个推理步骤的影响则很小。

IT之家附上使用新方法后的测试效果如下:

  • AIME 2024:准确率达到 56.7%,提升了 40.0 个百分点。

  • LiveCodeBench:得分 57.0%,提升了 8.1 个百分点。

  • Math-500:达到 90.8%,提升了 6.0 个百分点。

  • AMC 2023:达到 85.0%,提升了 17.5 个百分点。

  • OlympiadBench:达到 60.3%,提升了 12.7 个百分点。

这些结果表明,高效的微调技术可以使 LLM 在更少的数据需求下达到与 OpenAI 的 o1-preview 等专有模型相媲美的推理能力。

这项研究表明,将关注点从大规模数据依赖转向结构完整性,可以开发出一种以最少的计算资源确保强大逻辑一致性的训练方法。这种方法减少了对海量数据集的依赖,同时保持了强大的推理能力,使 LLM 更易于访问和扩展。

该研究的成果为未来模型的优化铺平了道路,证明结构化微调策略可以有效地增强 LLM 推理能力,而不会影响效率,这标志着复杂的 AI 推理模型在更广泛应用方面迈出了重要一步。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
唯恐天下不乱?卡里克救火曼联名宿却大放厥词:全胜也不能留任

唯恐天下不乱?卡里克救火曼联名宿却大放厥词:全胜也不能留任

雪狼侃体育
2026-01-16 09:57:08
老僧为毛主席留下两个预言:一个成为他的憾事,一个指明中国出路

老僧为毛主席留下两个预言:一个成为他的憾事,一个指明中国出路

浩渺青史
2026-01-14 12:42:28
你的存款超过了这个数,恭喜,你已迈入真正有钱人的门槛

你的存款超过了这个数,恭喜,你已迈入真正有钱人的门槛

平说财经
2026-01-14 17:52:06
江苏消防两个支队降级,朱亚明调任副总队长

江苏消防两个支队降级,朱亚明调任副总队长

靠山屯闲话
2026-01-15 20:51:54
“性萧条”才是这个时代真正的危机

“性萧条”才是这个时代真正的危机

深蓝夜读
2025-09-24 16:00:09
中俄贸易突然降温:五年来第一次下滑,发生了什么

中俄贸易突然降温:五年来第一次下滑,发生了什么

桂系007
2026-01-14 19:59:42
天呀,杜海涛竟然现成这样了,沈梦辰对他是真爱啊

天呀,杜海涛竟然现成这样了,沈梦辰对他是真爱啊

草莓解说体育
2026-01-07 01:43:18
原来他就是闫学晶前夫,儿子林傲霏的生父是剧场大佬

原来他就是闫学晶前夫,儿子林傲霏的生父是剧场大佬

查尔菲的笔记
2026-01-12 19:49:15
CBA最新排名!广东被挤到第3,山东冲进前5,辽宁第11,山西第14

CBA最新排名!广东被挤到第3,山东冲进前5,辽宁第11,山西第14

老吴说体育
2026-01-16 00:20:10
难以置信!有人把呆呆家门口的土挖走,直播销售三坨赚了190元…

难以置信!有人把呆呆家门口的土挖走,直播销售三坨赚了190元…

火山诗话
2026-01-15 09:32:32
大冷门!林诗栋梁靖崑携手一轮游,屡失关键分太遗憾,王皓心碎

大冷门!林诗栋梁靖崑携手一轮游,屡失关键分太遗憾,王皓心碎

球盲百小易
2026-01-16 01:13:55
大降价当然不愁卖!12月奔驰GLE销量超3100台!市场表现始终强势

大降价当然不愁卖!12月奔驰GLE销量超3100台!市场表现始终强势

三农老历
2026-01-16 09:26:04
U23亚洲杯,乌兹别克不好踢,但一切皆有可能

U23亚洲杯,乌兹别克不好踢,但一切皆有可能

小僫搞笑解说
2026-01-16 09:35:27
失算了,特朗普明抢委内瑞拉5000万桶石油,转头发现中国连一桶也不买了

失算了,特朗普明抢委内瑞拉5000万桶石油,转头发现中国连一桶也不买了

特特农村生活
2026-01-16 08:55:17
林昀儒2-3遭新年首败,国乒小将闪耀,混双八强诞生

林昀儒2-3遭新年首败,国乒小将闪耀,混双八强诞生

老做体育解说
2026-01-16 06:52:25
七旬老太去北京看病,发现医生竟是她在云南当知青时生下的孩子

七旬老太去北京看病,发现医生竟是她在云南当知青时生下的孩子

兰姐说故事
2025-01-16 05:05:03
拔出萝卜带出泥!闫学晶塌方,中戏毕业照流出,更多天龙人遭殃

拔出萝卜带出泥!闫学晶塌方,中戏毕业照流出,更多天龙人遭殃

温柔看世界
2026-01-13 11:27:16
贾国龙回应关店:关闭的102家门店在一季度完成,1.7万西贝员工尽力了

贾国龙回应关店:关闭的102家门店在一季度完成,1.7万西贝员工尽力了

第一财经资讯
2026-01-15 19:42:10
《寻秦记》开慰劳宴,古天乐强颜欢笑,账面亏损1亿

《寻秦记》开慰劳宴,古天乐强颜欢笑,账面亏损1亿

光影新天地
2026-01-14 18:04:04
国家癌症中心张凯:结直肠癌有望成为第二个被人类“消灭”的癌症|每经人物·大健康

国家癌症中心张凯:结直肠癌有望成为第二个被人类“消灭”的癌症|每经人物·大健康

华庭讲美食
2026-01-15 11:30:14
2026-01-16 10:39:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
324810文章数 606883关注度
往期回顾 全部

科技要闻

被网友"催"着走,小米紧急"抄"了特斯拉

头条要闻

特朗普:对委内瑞拉发动军事袭击计划"泄密者"已被抓

头条要闻

特朗普:对委内瑞拉发动军事袭击计划"泄密者"已被抓

体育要闻

聂卫平:黑白棋盘上的凡人棋圣

娱乐要闻

黄慧颐手撕保剑锋 曾黎意外卷入风波

财经要闻

深圳有白银商家爆雷 维权群超350人

汽车要闻

从 "商务" 变 "潮酷" 全新一汽奥迪A6L首秀亮相

态度原创

亲子
教育
家居
时尚
军事航空

亲子要闻

看来做人不能盲目自信

教育要闻

广州多区明确不组织期末统考,严禁面向非毕业年级

家居要闻

岁月柔情 现代品质轻奢

年度最扎心电影,看得中年男女坐立难安

军事要闻

美国已正式开始出售委内瑞拉石油

无障碍浏览 进入关怀版