网易首页 > 网易号 > 正文 申请入驻

OpenAI稀疏模型突破大模型黑箱困境,首次看清内部推理全过程

0
分享至

在大型语言模型推动 AI 加速前行的今天,它们的内部依然是高度不透明的。

我们使用神经网络构建模型,却并不会为它们写下逐条逻辑。模型通过训练自动调整数十亿个权重,直到表现良好。但最终得到的,往往是一个人类难以解读的稠密结构。

在性能迅速演进的同时,“理解模型本身”却几乎没有跟上。而当 AI 已开始影响科学研究、教育、医疗、公共安全等关键领域时,这种理解缺口变得尤其令人不安。

OpenAI 正试图改变这一现状。

近日,OpenAI 研究科学家 Leo Gao 在接受《麻省理工科技评论》的独家采访时透露,他们构建了一种全新的实验性大型语言模型——权重稀疏 Transformer(weight-sparse transformer)。它的性能远不及 GPT-5 或 Claude、Gemini 等主流模型,甚至大致能力仅相当于 OpenAI 于 2018 年推出的 GPT-1(尽管团队尚未做直接对比),但它有一个罕见的特性:可以被人类真正看懂

为什么需要一个能看懂的大模型?

今天的大模型令人着迷,也同样让人不安:它们给出答案,却无法解释为什么;它们可能突然开始幻觉,却没人知道触发因子;它们展现出复杂推理能力,却无人能确定这些能力是否可靠。

主流大模型依赖的是稠密神经网络:每个神经元都和周围层的所有神经元相连。这样的结构很擅长学习,但也把知识打碎在海量连接中,形成一种极难阅读的复杂纠缠。在这种结构中:一个概念会被拆成多个碎片,藏在模型不同角落;一个神经元可能同时负责多个功能;你几乎无法追踪模型完成某个推理的完整路径。正因如此,大模型常被比喻为“让任何人都不敢拆开的飞机引擎”。

OpenAI 的想法是反其道而行,训练一个从一开始就更容易拆解的模型。

OpenAI 选择的方向是机制可解释性(mechanistic interpretability):不仅要看到模型输出什么,还要逆向工程出模型内部如何得出这个结果。

他们在结构与 GPT-2 非常接近的模型中加入了一个决定性的修改:强制大部分权重为零,让每个神经元只连接极少数其他神经元。这样模型被迫将特征局部化,而不是分散在整个网络中。这种设计的直接效果是:模型速度变慢、模型能力变弱,但模型内部结构变得可读、可追踪、可解释。

这个模型比市面上的任何 LLM 都要慢,但更容易把特定神经元或神经元群组与具体概念和功能对应起来。“模型的可解释性差异非常显著。”Gao 说。

团队用非常简单的任务测试这个新模型,让模型基于 Python 代码判断字符串应以哪种引号闭合。例如:‘hello’必须以单引号结尾,“hello”必须以双引号结尾。模型的算法是:记住开头的引号类型,在结尾复制它。

在传统稠密模型中,很难追踪模型如何实现它。但在稀疏模型中,团队清晰看到完整的计算链条:模型将单引号与双引号编码到两个不同通道;MLP 模块将其加工为“是否是引号”与“是哪种引号”;注意力层跳过中间 token,找到开引号的位置;最终复制引号类型作为输出。这是模型内部机制首次以如此清晰的方式呈现。

对于更复杂的任务,例如 Python 代码中的变量绑定,模型内部电路变得难以完全描述。但 OpenAI 仍能够识别出关键路径,例如:一个注意力头将变量名复制到其定义位置;另一个注意力头将类型从定义处复制到变量后续使用处。这种“部分电路”,已经能够预测模型的后续行为。这意味着:即便任务复杂,模型内部的关键机制可能依然是局部结构化的,而非完全混乱的。

能否扩展到 GPT-3 或更大规模?


波士顿学院的数学家 Elisenda Grigsby 对该技术能否扩展到更大的模型持保留意见,因为大型模型必须处理更复杂多样的任务。Gao 和 Mossing 也承认这是当前模型的重大局限,并认为这种方法永远无法达到 GPT-5 那样的性能。但 OpenAI 相信,通过改进技术,未来可能构建出透明度与 GPT-3 相当的模型。

“也许几年内,我们就能拥有一个完全可解释的 GPT-3。你能走进它的每一个部分,理解它如何完成每一项任务。”Gao 说,“如果我们能拥有这样一个系统,我们将学到太多。”

无论能否扩展至超大规模模型,OpenAI 的实验正在推动一个核心问题走向更清晰的未来:我们能否让大模型从“强大但不可控”的黑箱,变成“透明且可信赖”的系统?

机械可解释性研究仍处在开端,但像权重稀疏 Transformer 这样的实验模型,让我们第一次看到了更透明、更安全的 AI 可能是什么样子。

这不是为了建造最强的模型,而是为了回答一个关乎未来 AI 的根本问题:我们能否真正理解正在改变世界的模型?

1.https://www.technologyreview.com/2025/11/13/1127914/openais-new-llm-exposes-the-secrets-of-how-ai-really-works/

2.https://openai.com/index/understanding-neural-networks-through-sparse-circuits/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
47岁影后秦海璐,每月给丧子丧夫的婆婆转生活费

47岁影后秦海璐,每月给丧子丧夫的婆婆转生活费

君笙的拂兮
2026-06-02 12:53:59
提醒:80岁后少散步,多做2件事,许多老年人不重视!看完就明白

提醒:80岁后少散步,多做2件事,许多老年人不重视!看完就明白

宝哥精彩赛事
2026-06-02 11:36:41
网红董赤赤栽了:1300万粉丝、54万债务,她的结局比想象中惨得多

网红董赤赤栽了:1300万粉丝、54万债务,她的结局比想象中惨得多

橙星文娱
2026-06-03 11:31:20
她是王洪文亲信,曾任上海市委书记,1982年被判了17年

她是王洪文亲信,曾任上海市委书记,1982年被判了17年

鉴史录
2026-06-02 15:15:51
人走了,产业也完了!印尼想赶走中方镍矿团队,算完账,全沉默了

人走了,产业也完了!印尼想赶走中方镍矿团队,算完账,全沉默了

阿讯说天下
2026-06-03 02:45:20
央视怒批,目不识丁、洋相百出,王鹤棣翻车炸出多少内娱绝望文盲

央视怒批,目不识丁、洋相百出,王鹤棣翻车炸出多少内娱绝望文盲

阿废冷眼观察所
2026-06-03 00:34:48
葵花药业发布严正声明!从未生产、销售或授权任何驱蚊类产品,涉事产品与公司无任何关联

葵花药业发布严正声明!从未生产、销售或授权任何驱蚊类产品,涉事产品与公司无任何关联

每日经济新闻
2026-06-02 23:20:35
美军司令做梦想不到:没等解放军收复台湾,南天门计划有重大进展

美军司令做梦想不到:没等解放军收复台湾,南天门计划有重大进展

悦心知足
2026-06-03 05:51:15
广厦扳回一局!赛后看看各大媒体人怎么说,名嘴苏群一针见血

广厦扳回一局!赛后看看各大媒体人怎么说,名嘴苏群一针见血

海阔山遥YAO
2026-06-03 01:30:38
太敢说了!魏建军直播直言被紧急叫停,部分汽车厂商惊出一身冷汗

太敢说了!魏建军直播直言被紧急叫停,部分汽车厂商惊出一身冷汗

火山詩话
2026-06-02 06:07:10
安徽恶婆婆后续:儿媳后悔,找邻居说和,娘家全体出动求原谅晚了

安徽恶婆婆后续:儿媳后悔,找邻居说和,娘家全体出动求原谅晚了

米果说识
2026-05-31 16:45:27
中方罕见官方定性,菲防长不过一个跳梁小丑,小马科斯要好自为之

中方罕见官方定性,菲防长不过一个跳梁小丑,小马科斯要好自为之

李健政观察
2026-06-03 12:10:12
3500万!曼联第1笔签约,罗马诺官宣,兽腰来了

3500万!曼联第1笔签约,罗马诺官宣,兽腰来了

卡灵顿分析师
2026-06-03 12:34:35
云南一飞手过于自信造成无人机坠落,致1死1伤,赔30多万后一审被判三缓三

云南一飞手过于自信造成无人机坠落,致1死1伤,赔30多万后一审被判三缓三

红星新闻
2026-06-03 11:34:40
撕破脸!刚曝张柏芝三胎爹,coco再揭谢贤黑料,徐静蕾太高明

撕破脸!刚曝张柏芝三胎爹,coco再揭谢贤黑料,徐静蕾太高明

照亮你的前行之路
2026-06-03 11:32:03
2020年杜少平被押火葬场,抬进死刑执行车,8分钟后结束罪恶一生

2020年杜少平被押火葬场,抬进死刑执行车,8分钟后结束罪恶一生

莫地方
2026-06-03 01:45:03
男篮补招!郭士强瞄准9人,王哲林彻底无缘,北京队3巨头再次联手

男篮补招!郭士强瞄准9人,王哲林彻底无缘,北京队3巨头再次联手

体坛大事记
2026-06-03 11:33:05
奔赴美加墨!马宁谈执法26世界杯:22年很多人说最后一届 但我把不可能变可能

奔赴美加墨!马宁谈执法26世界杯:22年很多人说最后一届 但我把不可能变可能

新英体育
2026-06-03 10:49:29
眼看无力回天,马科斯对莎拉提了个要求,上任后,对华路线不能变

眼看无力回天,马科斯对莎拉提了个要求,上任后,对华路线不能变

小莜读史
2026-06-03 11:55:43
6月4日,人社部关于2026年上调退休人员,养老金的通知公布了吗?

6月4日,人社部关于2026年上调退休人员,养老金的通知公布了吗?

社保小达人
2026-06-03 10:15:28
2026-06-03 13:48:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16786文章数 514993关注度
往期回顾 全部

科技要闻

员工抗议键鼠追踪,Meta让步:可暂停30分钟

头条要闻

受贿数额特别巨大 内蒙古自治区政府原主席王莉霞被诉

头条要闻

受贿数额特别巨大 内蒙古自治区政府原主席王莉霞被诉

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

著名演员魏宗万去世!曾演活司马懿

财经要闻

左手通胀右手衰退,欧美当下的困局

汽车要闻

瑞虎8 PLUS/PRO非凡冠军上市 限时10.19万元起售

态度原创

房产
艺术
家居
健康
军事航空

房产要闻

突发!254亩调规,海口江东的超级学校真的快来了!

艺术要闻

二十年前割麦的场景

家居要闻

江畔轻奢 观云大宅

违规干细胞应用,暗藏致命隐患!

军事要闻

美伊互袭波及多国 过去一夜中东局势骤然升级

无障碍浏览 进入关怀版