网易首页 > 网易号 > 正文 申请入驻

结构为王:AI 推理新思路,思维链结构成突破 LLM 高效训练关键

0
分享至

IT之家 2 月 15 日消息,科技媒体 marktechpost 昨日(2 月 14 日)发布博文,报道称加州大学伯克利分校的研究团队提出了一种 AI 训练方法,仅需少量数据即可增强大语言模型(LLM)推理能力。

提升 LLM 推理能力的难点在于训练模型生成具有结构化自反思、验证和回溯的长链式思维(CoT)响应。现有模型的训练过程通常需要在大量数据集上进行昂贵的微调,且许多专有模型的训练方法并不公开。

研究团队提出了一种新的训练方法,仅使用 17000 个 CoT 示例,微调 Qwen2.5-32B-Instruct 模型,并结合了 SFT 和 LoRA 微调技术,强调优化推理步骤的结构完整性而非内容本身,通过改进逻辑一致性并最大限度地减少不必要的计算开销,从而显著提高了 LLM 的推理效率。

研究表明,在增强 LLM 推理性能方面,CoT 的结构起着至关重要的作用,改变训练数据的逻辑结构会显著影响模型的准确性,而修改单个推理步骤的影响则很小。

IT之家附上使用新方法后的测试效果如下:

  • AIME 2024:准确率达到 56.7%,提升了 40.0 个百分点。

  • LiveCodeBench:得分 57.0%,提升了 8.1 个百分点。

  • Math-500:达到 90.8%,提升了 6.0 个百分点。

  • AMC 2023:达到 85.0%,提升了 17.5 个百分点。

  • OlympiadBench:达到 60.3%,提升了 12.7 个百分点。

这些结果表明,高效的微调技术可以使 LLM 在更少的数据需求下达到与 OpenAI 的 o1-preview 等专有模型相媲美的推理能力。

这项研究表明,将关注点从大规模数据依赖转向结构完整性,可以开发出一种以最少的计算资源确保强大逻辑一致性的训练方法。这种方法减少了对海量数据集的依赖,同时保持了强大的推理能力,使 LLM 更易于访问和扩展。

该研究的成果为未来模型的优化铺平了道路,证明结构化微调策略可以有效地增强 LLM 推理能力,而不会影响效率,这标志着复杂的 AI 推理模型在更广泛应用方面迈出了重要一步。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
59岁演员炫耀美国生活,祖孙三代奢华享乐,深扒细节后网友沉默了

59岁演员炫耀美国生活,祖孙三代奢华享乐,深扒细节后网友沉默了

潮鹿逐梦
2026-03-13 17:52:40
中国游客到朝鲜游玩,朝鲜人疑问:为什么中国人是这样的?

中国游客到朝鲜游玩,朝鲜人疑问:为什么中国人是这样的?

照亮你的前行之路
2026-03-16 00:13:04
历史首次!国乒0冠收尾,颁奖时料不到王励勤这种反应:全程黑脸

历史首次!国乒0冠收尾,颁奖时料不到王励勤这种反应:全程黑脸

刘哥谈体育
2026-03-16 10:29:30
狠话刚出口就殒命!伊朗高官扬言杀内塔尼亚胡,2小时后被炸身亡

狠话刚出口就殒命!伊朗高官扬言杀内塔尼亚胡,2小时后被炸身亡

老马拉车莫少装
2026-03-15 22:43:55
邦本宜裕前两轮中超仅出场58分钟,妻子发声:我真的很不甘心

邦本宜裕前两轮中超仅出场58分钟,妻子发声:我真的很不甘心

懂球帝
2026-03-16 10:25:03
银行也有跪式服务了…

银行也有跪式服务了…

微微热评
2026-03-15 22:37:43
张兰直播怒怼马筱梅!生完娃就要过亿豪宅,汪小菲买房?拿钢镚买

张兰直播怒怼马筱梅!生完娃就要过亿豪宅,汪小菲买房?拿钢镚买

观鱼听雨
2026-03-15 23:07:45
朝鲜不忍了,10枚导弹齐射,美韩日拉响警报,半岛局势彻底变天!

朝鲜不忍了,10枚导弹齐射,美韩日拉响警报,半岛局势彻底变天!

嫹笔牂牂
2026-03-15 16:50:17
90年代,让工人下岗的罪魁祸首的是谁?

90年代,让工人下岗的罪魁祸首的是谁?

小蜜情感说
2026-03-13 19:27:39
恐怖的9-1!中国女足夺冠筹码曝光,澳大利亚队或重演日本队悲剧

恐怖的9-1!中国女足夺冠筹码曝光,澳大利亚队或重演日本队悲剧

何老师呀
2026-03-15 14:07:27
从身价2亿到负债1.2亿!巨掌科技创始人宣布破产,被高利贷催收

从身价2亿到负债1.2亿!巨掌科技创始人宣布破产,被高利贷催收

垛垛糖
2026-03-13 21:50:20
战火未停,特朗普又把矛头指向朝鲜?金与正放下狠话:必先发制人

战火未停,特朗普又把矛头指向朝鲜?金与正放下狠话:必先发制人

林子说事
2026-03-13 20:28:42
喜鹊报喜!2026年4月这3个生肖贵人送财又送缘,好运挡不住

喜鹊报喜!2026年4月这3个生肖贵人送财又送缘,好运挡不住

毅谈生肖
2026-03-16 11:28:25
你发现没,最近没人提固态电池了?后路都让抄了,饼画不下去了

你发现没,最近没人提固态电池了?后路都让抄了,饼画不下去了

小李车评李建红
2026-03-15 08:00:03
美国最新膳食指南:不是颠覆,是一次迟来的认错

美国最新膳食指南:不是颠覆,是一次迟来的认错

富贵说
2026-03-15 15:25:13
3·15晚会曝光AI投毒后:力擎GEO火速删文销号,宣称覆盖8大AI模型及12家媒体平台

3·15晚会曝光AI投毒后:力擎GEO火速删文销号,宣称覆盖8大AI模型及12家媒体平台

超角度
2026-03-15 23:46:27
34 岁女子遇害后续:最后监控视频曝光,凶手已锁定 来过泰国五次

34 岁女子遇害后续:最后监控视频曝光,凶手已锁定 来过泰国五次

社会日日鲜
2026-03-15 10:11:50
2000 年赵一荻拔氧气管离世,她至死不知,张学良为她留合葬空墓

2000 年赵一荻拔氧气管离世,她至死不知,张学良为她留合葬空墓

小燕聊剧
2026-03-15 19:25:41
本田汽车暴亏1000亿,彻底卖不动了

本田汽车暴亏1000亿,彻底卖不动了

新浪财经
2026-03-13 20:37:07
事态失控!美军大幅增兵5000,伊朗新领袖神秘失踪,国内已打响反政权反神权第一枪!

事态失控!美军大幅增兵5000,伊朗新领袖神秘失踪,国内已打响反政权反神权第一枪!

澳洲红领巾
2026-03-15 13:34:23
2026-03-16 13:23:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
334239文章数 607068关注度
往期回顾 全部

科技要闻

315曝光AI大模型"投毒"!39.9元篡改AI答案

头条要闻

牛弹琴:伊朗反击越来越幽默 拉里贾尼新警告意味深长

头条要闻

牛弹琴:伊朗反击越来越幽默 拉里贾尼新警告意味深长

体育要闻

那个送老奶奶去医院的球员,成了队史第一人

娱乐要闻

第98届奥斯卡金像奖获奖名单公布

财经要闻

2月70城房价出炉:京沪二手房环比转涨

汽车要闻

浴火重生,2026上汽乘用车要大干一场

态度原创

游戏
数码
亲子
旅游
军事航空

游戏七日薄:《怪物猎人物语3:命运双龙》领衔

数码要闻

三星显示2027年QD-OLED显示器面板技术规划曝光:亮度再升级

亲子要闻

喝水少的孩子和喝水多的孩子,身体有什么差异?家长要注意了

旅游要闻

升级深度游“目的地”,回应美好期待;六安全面启动文旅消费促进工程

军事要闻

伊朗最高领袖重申“将向敌人索赔”

无障碍浏览 进入关怀版