网易首页 > 网易号 > 正文 申请入驻

OpenAI稀疏模型突破大模型黑箱困境,首次看清内部推理全过程

0
分享至


(来源:MIT TR)

在大型语言模型推动 AI 加速前行的今天,它们的内部依然是高度不透明的。

我们使用神经网络构建模型,却并不会为它们写下逐条逻辑。模型通过训练自动调整数十亿个权重,直到表现良好。但最终得到的,往往是一个人类难以解读的稠密结构。

在性能迅速演进的同时,“理解模型本身”却几乎没有跟上。而当 AI 已开始影响科学研究、教育、医疗、公共安全等关键领域时,这种理解缺口变得尤其令人不安。

OpenAI 正试图改变这一现状。

近日,OpenAI 研究科学家 Leo Gao 在接受《麻省理工科技评论》的独家采访时透露,他们构建了一种全新的实验性大型语言模型——权重稀疏 Transformer(weight-sparse transformer)。它的性能远不及 GPT-5 或 Claude、Gemini 等主流模型,甚至大致能力仅相当于 OpenAI 于 2018 年推出的 GPT-1(尽管团队尚未做直接对比),但它有一个罕见的特性:可以被人类真正看懂



为什么需要一个能看懂的大模型?

今天的大模型令人着迷,也同样让人不安:它们给出答案,却无法解释为什么;它们可能突然开始幻觉,却没人知道触发因子;它们展现出复杂推理能力,却无人能确定这些能力是否可靠。

主流大模型依赖的是稠密神经网络:每个神经元都和周围层的所有神经元相连。这样的结构很擅长学习,但也把知识打碎在海量连接中,形成一种极难阅读的复杂纠缠。在这种结构中:一个概念会被拆成多个碎片,藏在模型不同角落;一个神经元可能同时负责多个功能;你几乎无法追踪模型完成某个推理的完整路径。正因如此,大模型常被比喻为“让任何人都不敢拆开的飞机引擎”。

OpenAI 的想法是反其道而行,训练一个从一开始就更容易拆解的模型。

OpenAI 选择的方向是机制可解释性(mechanistic interpretability):不仅要看到模型输出什么,还要逆向工程出模型内部如何得出这个结果。

他们在结构与 GPT-2 非常接近的模型中加入了一个决定性的修改:强制大部分权重为零,让每个神经元只连接极少数其他神经元。这样模型被迫将特征局部化,而不是分散在整个网络中。这种设计的直接效果是:模型速度变慢、模型能力变弱,但模型内部结构变得可读、可追踪、可解释。

这个模型比市面上的任何 LLM 都要慢,但更容易把特定神经元或神经元群组与具体概念和功能对应起来。“模型的可解释性差异非常显著。”Gao 说。

团队用非常简单的任务测试这个新模型,让模型基于 Python 代码判断字符串应以哪种引号闭合。例如:‘hello’必须以单引号结尾,“hello”必须以双引号结尾。模型的算法是:记住开头的引号类型,在结尾复制它。


(来源:OpenAI)

在传统稠密模型中,很难追踪模型如何实现它。但在稀疏模型中,团队清晰看到完整的计算链条:模型将单引号与双引号编码到两个不同通道;MLP 模块将其加工为“是否是引号”与“是哪种引号”;注意力层跳过中间 token,找到开引号的位置;最终复制引号类型作为输出。这是模型内部机制首次以如此清晰的方式呈现。

对于更复杂的任务,例如 Python 代码中的变量绑定,模型内部电路变得难以完全描述。但 OpenAI 仍能够识别出关键路径,例如:一个注意力头将变量名复制到其定义位置;另一个注意力头将类型从定义处复制到变量后续使用处。这种“部分电路”,已经能够预测模型的后续行为。这意味着:即便任务复杂,模型内部的关键机制可能依然是局部结构化的,而非完全混乱的。



能否扩展到 GPT-3 或更大规模?


波士顿学院的数学家 Elisenda Grigsby 对该技术能否扩展到更大的模型持保留意见,因为大型模型必须处理更复杂多样的任务。Gao 和 Mossing 也承认这是当前模型的重大局限,并认为这种方法永远无法达到 GPT-5 那样的性能。但 OpenAI 相信,通过改进技术,未来可能构建出透明度与 GPT-3 相当的模型。

“也许几年内,我们就能拥有一个完全可解释的 GPT-3。你能走进它的每一个部分,理解它如何完成每一项任务。”Gao 说,“如果我们能拥有这样一个系统,我们将学到太多。”

无论能否扩展至超大规模模型,OpenAI 的实验正在推动一个核心问题走向更清晰的未来:我们能否让大模型从“强大但不可控”的黑箱,变成“透明且可信赖”的系统?

机械可解释性研究仍处在开端,但像权重稀疏 Transformer 这样的实验模型,让我们第一次看到了更透明、更安全的 AI 可能是什么样子。

这不是为了建造最强的模型,而是为了回答一个关乎未来 AI 的根本问题:我们能否真正理解正在改变世界的模型?

1.https://www.technologyreview.com/2025/11/13/1127914/openais-new-llm-exposes-the-secrets-of-how-ai-really-works/

2.https://openai.com/index/understanding-neural-networks-through-sparse-circuits/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“尼帕病毒”来势汹汹,建议:每家备好6样东西,关键时刻能救命

“尼帕病毒”来势汹汹,建议:每家备好6样东西,关键时刻能救命

路医生健康科普
2026-01-28 12:18:49
汪小菲马筱梅基因太绝!家中“小炸毛”萌翻全网这颜值太招人疼!

汪小菲马筱梅基因太绝!家中“小炸毛”萌翻全网这颜值太招人疼!

孤酒老巷QA
2026-03-24 05:34:17
姆巴佩正在步卡卡后尘,皇马赶快续约维尼修斯吧!

姆巴佩正在步卡卡后尘,皇马赶快续约维尼修斯吧!

刘笤说体坛
2026-03-26 08:57:48
余承东宣布华为手机全面回归!大方公布CPU型号 支持5A网络 麒麟处理器全国产突破美国制裁

余承东宣布华为手机全面回归!大方公布CPU型号 支持5A网络 麒麟处理器全国产突破美国制裁

快科技
2026-03-24 15:22:21
前女友缅怀张雪峰,呼吁大家嘴下留德,曾自曝遭家暴污蔑才分手!

前女友缅怀张雪峰,呼吁大家嘴下留德,曾自曝遭家暴污蔑才分手!

古希腊掌管松饼的神
2026-03-25 15:38:23
男子买菜顺手买体彩!花4元中698万 先上班再领奖 现场捐2000元

男子买菜顺手买体彩!花4元中698万 先上班再领奖 现场捐2000元

念洲
2026-03-26 13:12:32
普通人一生的存款标准

普通人一生的存款标准

捣蛋窝
2026-03-21 11:14:00
NeurIPS拒收中国论文,计算机学会宣布抵制并警告将其移出A类目录

NeurIPS拒收中国论文,计算机学会宣布抵制并警告将其移出A类目录

DeepTech深科技
2026-03-25 22:49:10
炸裂!张雪峰遗产分配爆出大瓜

炸裂!张雪峰遗产分配爆出大瓜

互联网品牌官
2026-03-26 12:21:26
轰21+10!湖人捡漏2米13悍将真香:年薪345万,变三巨头喂饼绝配

轰21+10!湖人捡漏2米13悍将真香:年薪345万,变三巨头喂饼绝配

李喜林篮球绝杀
2026-03-26 11:34:01
40年后才揭开谜底对越真相:越南真正的溃败始于许世友的3道军令

40年后才揭开谜底对越真相:越南真正的溃败始于许世友的3道军令

鉴史录
2026-03-22 10:01:56
王曼昱看到可能会心痛!张雪峰曾放话:迟早邀你做公司代言人

王曼昱看到可能会心痛!张雪峰曾放话:迟早邀你做公司代言人

铿锵格斗
2026-03-26 13:01:34
周边5大邻国做出选择,亚洲大地震!美国知道:中国正在静待时机

周边5大邻国做出选择,亚洲大地震!美国知道:中国正在静待时机

掉了颗大白兔糖
2026-03-26 01:00:31
一字之差变味儿了!防止规模性返贫,被扭曲成“防止规模性返乡”

一字之差变味儿了!防止规模性返贫,被扭曲成“防止规模性返乡”

雪中风车
2026-03-05 14:10:29
原来她是张雪峰母亲,一生操劳全力托举儿子,却中年丧夫晚年丧子

原来她是张雪峰母亲,一生操劳全力托举儿子,却中年丧夫晚年丧子

以茶带书
2026-03-26 13:38:50
内塔尼亚胡话音刚落,城市就遭袭击,联合国出面后,以军目的曝光

内塔尼亚胡话音刚落,城市就遭袭击,联合国出面后,以军目的曝光

小小科普员
2026-03-26 14:03:46
千万不要小看F-35,虽然打不过歼-20,却是东风快递、红旗导弹的巨大威胁

千万不要小看F-35,虽然打不过歼-20,却是东风快递、红旗导弹的巨大威胁

利刃号
2026-02-02 19:07:20
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
湖人7分险胜!差点翻车原因揭晓,4人表现太拉胯,数据一目了然

湖人7分险胜!差点翻车原因揭晓,4人表现太拉胯,数据一目了然

余飩搞笑段子
2026-03-26 11:33:35
逃难的林冲杀了收留他的王伦,这样的人进不了任何人的圈子

逃难的林冲杀了收留他的王伦,这样的人进不了任何人的圈子

凉湫瑾言
2026-03-23 13:29:51
2026-03-26 14:48:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16487文章数 514796关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

头条要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

时尚
教育
艺术
家居
本地

2026年了,最好看的还是“这件针织”!

教育要闻

高考地理中的花海经济

艺术要闻

哪一座桥不是风景?

家居要闻

傍海而居 静观蝴蝶海

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

无障碍浏览 进入关怀版