网易首页 > 网易号 > 正文 申请入驻

DeepSeek团队再放大招:代码竟然能解锁AI通用推理能力

0
分享至



代码竟成AI推理“新宠”?DeepSeek团队提出CodeI/O方法:另辟蹊径,解锁通用AI推理能力!

大家有没有感觉,AI在某些“窄技能”上表现惊艳,比如做数学题、写代码,但在更广泛的推理任务上,就有点力不从心了?就像咱平时说的,有点“偏科”啊!

这是为啥呢?研究人员发现,问题就出在训练数据上!像数学、代码生成这种任务,数据管够,模型学得就好。但像逻辑推理、科学推断、符号推理这些更通用的推理任务,训练数据就稀少且碎片化,模型自然就“吃不饱”

那咋办呢?难道通用AI推理能力提升就卡在这儿了?

来自DeepSeek团队的大神们最近发表了一篇论文,提出了一种名为CodeI/O的新方法,简直是另辟蹊径,让人眼前一亮!


我们一起来扒一扒这篇论文

CodeI/O 的核心思想简单来说就是:把代码变成AI推理的“养料”!

你可能会问,代码和推理有啥关系? 关系可大了!

研究人员发现,真实世界的代码程序,其实蕴含着丰富的推理模式! 想想我们写代码的过程:

  • 逻辑流程规划:先想好程序的大框架,一步步实现功能

  • 状态空间搜索:调试bug,尝试不同的解决方案

  • 决策树遍历:if-else,各种条件判断

  • 模块化分解:把复杂问题拆成小模块,逐个击破

这些不都是 通用的推理能力吗? 只不过,这些推理模式隐藏在代码的语法和细节之中,之前的AI模型很难直接学到

CodeI/O 的巧妙之处就在于,它把原始代码转化成了一种 “代码输入-输出预测” 的格式。 就像下面这样:

  • 输入:一段代码 (函数) + 测试用例的输入

  • 输出:这段代码在给定输入下的执行结果 (输出)

更绝的是,CodeI/O 还要求模型用 自然语言的 “思维链 (Chain-of-Thought, CoT)” 来预测这个输入和输出! 这就像让模型用人类的语言,一步步解释代码的推理过程


这样做有啥好处呢?

  1. 1.提取通用推理模式: 通过预测代码的输入输出,并用CoT解释,模型就能学到代码中蕴含的通用推理“原语”,比如逻辑流程、状态搜索等等,而且 摆脱了代码语法的束缚

  2. 2.数据丰富且可扩展: 代码资源遍地都是!CodeI/O 可以从各种代码库中大规模收集数据,而且很容易生成新的输入-输出对,训练数据管够!

  3. 3.保真且可验证: 代码是可以执行的!我们可以 验证模型的预测是否正确 ,甚至可以让模型进行多轮修正 (CodeI/O++),进一步提升推理能力

实验效果如何呢?

研究人员在14个不同的推理 benchmark上进行了测试,包括符号推理、科学推理、逻辑推理、数学推理、常识推理等等。 结果令人惊喜!

  • 效果全面提升: CodeI/O 在各种推理任务上都取得了一致的提升,不像其他方法可能只在特定任务上有效

  • 超越强大基线: 即使和一些现有的优秀数据集 (如OpenMathInstruct2, OpenCoder-SFT-Stage1, WebInstruct) 相比,CodeI/O 也更胜一筹

  • 模型能力更均衡: CodeI/O 不会像某些方法那样,只提升模型在少数任务上的表现,反而导致其他任务下降,而是全面均衡地提升模型的推理能力


CodeI/O 就像是给AI模型找到了一种新的“学习方法”:

  • 不刷题,改“读代码”: 从海量代码中学习通用的推理模式,而不是死记硬背题目的答案

  • 从“术”到“道”: 摆脱代码语法的束缚,学习更本质的推理“原语”

  • 数据自给自足: 代码数据取之不尽,用之不竭,训练数据不再是瓶颈

参考:

https://arxiv.org/pdf/2502.07316

⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~

求赞

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
尴尬!香港男星拍短视频疑起生理反应,白天卖鸡爪晚上到酒吧表演

尴尬!香港男星拍短视频疑起生理反应,白天卖鸡爪晚上到酒吧表演

明月聊史
2025-03-17 16:45:17
男子喝醉后误入邻居家,与女邻居发生关系后,他肠子都悔青了

男子喝醉后误入邻居家,与女邻居发生关系后,他肠子都悔青了

结绿
2024-03-15 16:30:44
大批乌克兰人“包围”中国大使馆,反复高呼一句话,中方终于签字

大批乌克兰人“包围”中国大使馆,反复高呼一句话,中方终于签字

盘观前沿
2025-03-17 14:06:14
改革的主要目的是让老百姓过上好日子,而不是只让少数人富裕起来

改革的主要目的是让老百姓过上好日子,而不是只让少数人富裕起来

逍遥论经
2025-03-18 05:40:31
央视315曝光:停车扫码支付背后的消费乱象,该如何治理?

央视315曝光:停车扫码支付背后的消费乱象,该如何治理?

丁道师
2025-03-17 17:56:46
华山失联男子已找到,挂在树上,面部全非,家人哭晕,家中独子

华山失联男子已找到,挂在树上,面部全非,家人哭晕,家中独子

魔都姐姐杂谈
2025-03-14 19:02:04
冲突升级!穆帅怒怼圣马克西曼:修图作诗不训练,无法达到比赛要求

冲突升级!穆帅怒怼圣马克西曼:修图作诗不训练,无法达到比赛要求

雷速体育
2025-03-17 16:53:09
400公里射程碾压中俄!F-35B试射‘超级流星’,歼-20遭单向猎杀

400公里射程碾压中俄!F-35B试射‘超级流星’,歼-20遭单向猎杀

武器鉴赏
2025-03-16 15:03:56
川普称拜登特赦令无效,他能取消吗?

川普称拜登特赦令无效,他能取消吗?

寰宇大观察
2025-03-17 20:55:03
上游315|山东梁山翻新卫生巾被曝光企业再调查:到底谁是“刘总”

上游315|山东梁山翻新卫生巾被曝光企业再调查:到底谁是“刘总”

上游新闻
2025-03-17 13:27:17
降息决议时刻来了!今日凌晨的五大资讯冲击股市(3.17)!

降息决议时刻来了!今日凌晨的五大资讯冲击股市(3.17)!

别人都叫我阿腈
2025-03-18 04:09:49
2:0,国际米兰拿下意甲天王山战,更有3大喜讯,要打造王朝球队

2:0,国际米兰拿下意甲天王山战,更有3大喜讯,要打造王朝球队

体育全天候
2025-03-17 21:27:29
288比57!法国爆炸性消息!法战机首次参战,成功击落俄134个目标

288比57!法国爆炸性消息!法战机首次参战,成功击落俄134个目标

世界风云录
2025-03-16 18:10:25
梅州市大埔县三河镇党委副书记、镇长蔡振霆被查

梅州市大埔县三河镇党委副书记、镇长蔡振霆被查

鲁中晨报
2025-03-17 18:10:04
菲律宾变天!杜特尔特赌赢了,参议院要介入调查,判马科斯有罪?

菲律宾变天!杜特尔特赌赢了,参议院要介入调查,判马科斯有罪?

特特农村生活
2025-03-18 00:58:57
特多总理:期待能与中国开展更多合作

特多总理:期待能与中国开展更多合作

人民网
2025-03-17 06:00:08
网友:我直接呆住!看到新身份证“2025年-长期”,心里咯噔一下

网友:我直接呆住!看到新身份证“2025年-长期”,心里咯噔一下

明月杂谈
2025-03-17 17:09:48
上海交大发现:体内有恶性肿瘤的人,身体一般或可能有4个表现?

上海交大发现:体内有恶性肿瘤的人,身体一般或可能有4个表现?

今日养生之道
2025-03-16 20:07:01
沙特谈判刚结束,俄就对美说了一句扎心的话:中方正在突飞猛进!

沙特谈判刚结束,俄就对美说了一句扎心的话:中方正在突飞猛进!

风华讲史
2025-03-17 14:26:38
后院起火,石宇奇夺全英冠军,国家一队队友在瑞昌被打得很没面子

后院起火,石宇奇夺全英冠军,国家一队队友在瑞昌被打得很没面子

真理是我亲戚
2025-03-17 14:43:33
2025-03-18 08:51:00
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
583文章数 240关注度
往期回顾 全部

科技要闻

比亚迪:1秒钟两公里,充电跟加油一样快

头条要闻

美媒怒称莱克毁了美国之音 纷纷将板子打在她身上

头条要闻

美媒怒称莱克毁了美国之音 纷纷将板子打在她身上

体育要闻

和死神擦肩而过,她用金牌拥抱 ”爱人”

娱乐要闻

金秀贤曾二次发函威胁金赛纶,家属考虑起诉他

财经要闻

国家,发钱了!

汽车要闻

丰田宣布将推出三款全新电动车 包括一款电动皮卡

态度原创

游戏
家居
艺术
公开课
军事航空

《羊蹄山之魂》女主演员喊话索尼 推荐流媒应用登PS

家居要闻

暖栖透亮 精致且温馨

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

库尔斯克战事持续:俄方着手重建 乌方否认被围

无障碍浏览 进入关怀版