当你反复对一个语言模型说“再想想”,它真的能发现错误吗?已知的研究显示,把模型自己的推理链再喂给它,只会让它锚定在原有令牌上,变成自我批准的橡皮图章。那么,把同一个问题丢给同一个模型N次,每次重开关联,再交叉比对——是不是更像分开审讯几个证人?
开放权重模型虽然便宜,但每秒吞吐几百万令牌可能只是自信的废话。真正重要的指标是每美元能产出的正确结论数。而过往的“自我纠正”和“用模型来验证模型”都只是把感觉往上一级传递,没有跳出模型判断的循环。我们需要机械的、可计算的、确定性的检查。
![]()
一个新提出的逻辑图验证系统把模型的推理过程外化为一个有向图:每个论点成为一个节点,支撑关系成为边。这样一来,即便不谈“真假”,结构本身就暴露问题——没有支撑的前提是孤儿节点,循环论证就是环,结论与证据不连通说明推论链断裂。你不再需要问“它对吗”,而是检视图是否满足无环、连通的机械规则。
信心由此变成了拓扑属性。根据门格尔定理,连接证据到结论的节点不相交链越多,结论越坚固。如果你只找到一条从证据通到结论的路,它是脆弱的;如果有三条独立路径,对手就必须同时击破三个独立的断言。关键在于独立性是“采样”出来的,而不是“要求”出来的——在一个上下文里让模型给出三个独立论证,得到的往往是同一种说法的三次转述。但当你用N次独立推理调用(每次新建上下文,温度大于零),就会产生真正去相关的尝试。不同运行之间的毛刺和矛盾,正好就是单个记录里完全看不见的审讯漏洞。
系统不是让模型泛泛地“重新审视”,而是用最小割或介数中心度算出哪条边负载最大又未经证实,然后只把计算预算投到那个点上:“边7承载全局且未验证。”模型就集中力量核查该处。这种定向注意远比稀释式的复查有效。
可能会有人觉得,把每个模糊的推理步骤写成带类型的节点和有向边是一种“形式化税”,增加了工作量。但设计者反而视其为特性:一个原本隐晦含糊的步骤,在被强制类型化后,其模糊性就变得赤裸裸可见了。这套系统最终面向的是需要在文档上做多跳问答、声明验证的研究者和开发者,输出一张可审计的论证图,并可作为智能体随时调用的MCP工具。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.