网易首页 > 网易号 > 正文 申请入驻

Anthropic让AI学会"自证清白":推理过程不再是黑箱

0
分享至

在医疗诊断、金融审计、法律合规这些高 stakes 场景里,大模型给出一个正确答案却说不清为什么,跟直接给错答案没什么两样。这是工程师们面对的真实技术瓶颈,不是哲学层面的讨论。

Anthropic 最近的研究"Teaching Claude Why"正是瞄准这个问题。它把行业从简单的思维链(Chain-of-Thought,简称 CoT)提示词,推进到一种更结构化的训练方法:让模型生成与最终输出解耦的、可验证的显式推理路径。对于正在搭建 AI 基础设施或垂直领域智能体的团队来说,这是从 demo 走向生产系统的关键一跃。


标准思维链的两大致命伤


大多数开发者对 CoT 都不陌生。你在提示词末尾加一句"让我们一步步思考",模型就会先生成一系列中间 token,再给出结论。这在算术和符号逻辑任务上确实有效,但结构上有两个硬伤。

第一是共依赖问题。推理过程和最终答案被纠缠在同一个连续的 token 流里。如果模型在第二步犯了细微错误,它往往会在第三步"幻觉"出一个 justification,只为跟自己之前的错误保持语言连贯。这时候推理变成了事后合理化,而非逻辑推导。

第二是无法验证。因为推理只是更多的文本,没有程序化手段在中途拦截、校验或审计逻辑。你本质上是在赌模型对自己的过程判断正确。

"Teaching Claude Why"如何重构架构

Anthropic 探索的方法,是强制模型把推理当作推理过程中一个独立的结构化组件,而非文本生成的副产品。核心思路是训练模型产出遵循特定逻辑约束的"推理 trace"。

具体做法是在训练数据集中让推理步骤被显式标注,并检查逻辑一致性。这不是单纯堆数据量,而是采用不同的损失函数:惩罚逻辑跳跃,奖励前提与结论之间的显式连接。

显式 Trace 生成

在这个框架下,模型被训练生成结构化 trace,相当于一个与最终响应分离的"逻辑草稿本"。这让系统能够实现"推理拦截"——智能体处理复杂法律文档时,可以在推理 trace 生成后暂停,用符号检查器或第二个"critic"模型对其进行校验,确认无误后再继续生成最终答案。

逻辑一致性作为训练目标


传统微调优化的是输出 token 的似然度。这项研究则引入辅助目标,直接惩罚推理 trace 中的矛盾。如果模型在某步断言"所有 A 都是 B",又在后文推出"某个 A 不是 B",训练信号会明确标记这是失败案例。这种反馈不依赖人工标注每个错误,而是可以通过自动化的符号引擎或形式化验证工具生成。

对垂直领域 AI 的落地意义

这项研究的价值不在于让 Claude 在通用基准上再涨几个点,而在于它为高可靠性 AI 系统提供了可工程化的基础模块。

在医疗场景,系统可以强制要求诊断推理包含"鉴别诊断"步骤,并用药理知识库实时校验。在金融审计,模型可以被要求显式列出每笔交易的核对规则,并与监管要求比对。在法律科技,合同分析 agent 可以生成条款依赖图,让律师用可视化工具审查逻辑链条。

这些不是未来愿景,而是当推理过程成为一等公民、可被独立操作和验证后,自然解锁的工程能力。

从模仿推理到结构化推理

行业过去两年的主流思路是用更多数据、更大模型、更长的 CoT 来"教"模型推理。Anthropic 这项研究指向另一个方向:把推理本身结构化为可操作的系统组件。

这类似于编程语言的演进——从汇编到高级语言,再到带有类型系统和静态分析的现代语言。每一步都不是让程序员"写得更像机器",而是让机器能更好地理解和验证人类意图。AI 系统的可靠性提升,很可能遵循类似路径:不是让模型更像人,而是让它的输出更像可被机器验证的结构。

对于正在评估模型选型或设计 agent 架构的团队,一个值得追问的问题是:你的系统能否在最终答案生成之前,独立地拦截、检查、甚至修改模型的推理过程?如果答案是否定的,那黑箱问题就还没有真正解决。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
貔貅认主不看财富,这四个生肖千万别碰,戴了反而会破财

貔貅认主不看财富,这四个生肖千万别碰,戴了反而会破财

纸鸢奇谭
2026-04-13 16:06:54
任正非:华为光系统绝对领先美国,是远远领先美国,也不需要美国任何帮助!网友:超节点算力太牛了!

任正非:华为光系统绝对领先美国,是远远领先美国,也不需要美国任何帮助!网友:超节点算力太牛了!

大白聊IT
2026-05-11 15:55:13
男女团夺冠拍全家福!孙颖莎奶凶,王楚钦与林诗栋打闹并抱住马龙

男女团夺冠拍全家福!孙颖莎奶凶,王楚钦与林诗栋打闹并抱住马龙

篮球资讯达人
2026-05-11 03:31:30
心脏决定寿命?劝告中老年别太节俭,多吃这3样,心脏越吃越年轻

心脏决定寿命?劝告中老年别太节俭,多吃这3样,心脏越吃越年轻

芹姐说生活
2026-05-11 13:29:00
伊朗最高领袖向武装部队司令下达新指导方针,伊朗警方逮捕7名涉嫌与敌对网络进行情报合作人员

伊朗最高领袖向武装部队司令下达新指导方针,伊朗警方逮捕7名涉嫌与敌对网络进行情报合作人员

每日经济新闻
2026-05-11 09:15:11
我国目前仍有两个机场公安局实行垂直管理,其中一个设在高校内

我国目前仍有两个机场公安局实行垂直管理,其中一个设在高校内

小圣杂谈原创
2026-05-09 15:58:24
从每年2.1万飙升至超1200万,能不贬值才怪!

从每年2.1万飙升至超1200万,能不贬值才怪!

黯泉
2026-05-09 12:39:25
搭井柏然无人知,《低智商犯罪》搭王骁火了,长相酷似张若昀

搭井柏然无人知,《低智商犯罪》搭王骁火了,长相酷似张若昀

娱君坠星河
2026-05-10 10:50:18
王清海教授:山楂的3个黄金组合,扫清血管“垃圾”,便宜又好用

王清海教授:山楂的3个黄金组合,扫清血管“垃圾”,便宜又好用

蜡笔小小子
2026-04-21 14:43:37
王曼昱为何遗憾落败张本美和?刘国正点评一语中的,张继科早把话说透

王曼昱为何遗憾落败张本美和?刘国正点评一语中的,张继科早把话说透

林子说事
2026-05-12 02:27:49
红场阅兵落幕,中方代表低调离场,普京摊牌,4年战争只是幌子?

红场阅兵落幕,中方代表低调离场,普京摊牌,4年战争只是幌子?

潮鹿逐梦
2026-05-11 16:41:45
大爆发!深圳5.2万套住宅要来?年内狂调44宗宅地,房价会跌吗

大爆发!深圳5.2万套住宅要来?年内狂调44宗宅地,房价会跌吗

深圳买房计划
2026-05-11 23:35:33
蓝营内讧彻底爆发,郑丽文政治算计被当众拆穿

蓝营内讧彻底爆发,郑丽文政治算计被当众拆穿

时尚的弄潮
2026-05-12 06:25:33
Faraday Future宣布人事调整:贾跃亭出任FF全球CEO

Faraday Future宣布人事调整:贾跃亭出任FF全球CEO

每日经济新闻
2026-05-11 10:02:52
根本卖不掉!连续6个一字跌停,封单超百万手,有人已亏91万

根本卖不掉!连续6个一字跌停,封单超百万手,有人已亏91万

财经智多星
2026-05-11 15:26:15
北控男篮酝酿换帅,张庆鹏引管理层不满,已邀请杨鸣重新出山

北控男篮酝酿换帅,张庆鹏引管理层不满,已邀请杨鸣重新出山

中国篮坛快讯
2026-05-12 06:57:55
NASA放出1.2万张登月照:这是人类阔别50年的视角

NASA放出1.2万张登月照:这是人类阔别50年的视角

野生运营
2026-05-07 10:31:03
72岁老戏骨濮存昕官宣外孙女出道,尖嘴猴腮,长相遭吐槽:太丑了

72岁老戏骨濮存昕官宣外孙女出道,尖嘴猴腮,长相遭吐槽:太丑了

深析古今
2025-12-08 12:29:36
别只盯着贺希宁!深圳男篮终是熬出头,重返四强只是起点!

别只盯着贺希宁!深圳男篮终是熬出头,重返四强只是起点!

林子说事
2026-05-11 20:03:19
大跌41.8% 智能音箱市场遇冷 小米一骑绝尘

大跌41.8% 智能音箱市场遇冷 小米一骑绝尘

快科技
2026-05-12 00:23:06
2026-05-12 07:40:49
字节漫游指南
字节漫游指南
有态度网友ytd
3660文章数 40关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

女子连上20多天瑜伽课被教练踢出群聊:天天来 不累吗

头条要闻

女子连上20多天瑜伽课被教练踢出群聊:天天来 不累吗

体育要闻

梁靖崑:可能是最后一届了,想让大家记住这个我

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

宗馥莉罢免销售负责人 部分业务将外包

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

教育
时尚
艺术
数码
军事航空

教育要闻

有公费海外交换机会的院校(妈妈!免费旷野!

今年夏天最流行的5双凉鞋,配裙子绝美!

艺术要闻

人民币78岁了!你见没见过的人民币,都在这里!

数码要闻

苹果iPadOS 17.7.11正式版发布

军事要闻

特朗普:伊朗的回应“完全不可接受”

无障碍浏览 进入关怀版