网易首页 > 网易号 > 正文 申请入驻

OpenAI又开源了!仅0.4B,给模型大瘦身

0
分享至


智东西
作者 王涵
编辑 心缘

智东西12月15日报道,昨天,OpenAI开源新模型Circuit-Sparsity,模型参数量仅0.4B99.9%的权重为零。


▲Circuit-Sparsity开源(来源:Hugging Face)

这个技术试图解决模型的可解释性问题,简单来说就是回答“模型为什么做出这个决策?”以及“它是如何得出这个结果的?”这两个问题。

在AI飞速发展的今天,大语言模型(LLM)虽然表现出了惊人的能力,但其内部运作机制始终像一个神秘的“黑箱”。

我们不知道它为何做出某个回答,也不清楚它是如何从海量数据中提取知识的。这种不可解释性,成为了AI在医疗、金融、法律等高风险领域落地的重大障碍。

对此,OpenAI研究团队训练出了一个权重稀疏的Transformer模型,强制模型权重矩阵中99.9%权重为零,仅保留0.1%非零权重。

在这项研究中,研究团队在模型内部形成了紧凑且可读的“电路”(Circuits),每个电路都仅保留了保证模型性能的关键节点,神经元的激活变得具有明确的语义。

有外网网友称这一技术让当下的MoE(混合专家模型)走到了尽头,并说“我们一直以来都将权重隔离到‘专家’中,以此粗略地近似稀疏性,仅仅是为了满足稠密矩阵核的要求。”


▲外网评价(图源:X)

更有网友将这项研究形容为将模型“减肥到只剩骨架”,还说这项研究就好像打开了黑匣子,不试图解开稠密模型而是直接构建稀疏模型,正是这项研究有趣的地方。


▲外网评价(图源:X)

但有些网友却不这么认为,称其没有看出MoE模型为何会因此走到尽头,并进一步解释说这一技术是针对XAI(可解释AI)的,它的训练成本要高100-1000倍,回到“研究时代”并不意味着让事情变得更复杂。


▲外网评价(图源:X)

该模型目前受限于计算效率瓶颈,其运算速度较密集模型慢100至1000倍,将该技术直接应用于千亿参数级别的前沿大模型,现阶段尚不具备可行性。

开源地址:

Github:
https://github.com/openai/circuit_sparsity

Hugging Face:

https://huggingface.co/openai/circuit-sparsity

一、训练稀疏Transformer,OpenAI理清模型内部计算

要理解这项研究的突破,首先需要明白传统大模型为何难以解释。

在标准的密集模型(Dense Models)中,神经网络存在一种被称为“超级位置”(Superposition)的现象。简单来说,为了存储海量的信息,模型被迫让单个神经元或权重矩阵同时编码多个完全不同的概念。

这种特征纠缠导致了严重的后果,例如模型的决策不可追溯和逻辑混乱,当模型输出一个结果时,我们无法确定是哪个具体的“概念”在起作用。

针对以上问题,以前的研究通常从试图拆解密集、纠结的网络开始。但OpenAI团队采取了一种“反直觉”的策略,即训练权重稀疏的Transformer模型,强制模型权重矩阵中99.9%权重为零,仅保留0.1%非零权重。

强制模型限制了模型只能使用其神经元之间极少的可能连接,而这一简单的更改,几乎从根本上理清了模型的内部计算。


▲每个神经元只与下一个层的几个神经元相连(图源:OpenAI技术博客)

具体的技术手段包括:

1、动态剪枝与稀疏约束:在训练过程中,系统会动态执行“剪枝”操作,每一步优化后仅保留绝对值最大的权重(Top-K稀疏化)。

2、激活稀疏化:在残差流、注意力键/值矩阵等关键位置,研究团队引入了AbsTopK激活函数,强制仅保留前25%的激活值。

3、架构微调:为了配合稀疏化,研究团队用RMSNorm替代了传统的LayerNorm,避免归一化操作破坏稀疏性,同时引入了“Bigram表”来处理简单的模式匹配,从而释放模型的主干容量去处理复杂的逻辑推理。

二、模型内部形成紧凑可读的“电路”,规模缩减16倍

这项技术的最大成果,是模型内部形成了紧凑且可读的“电路”(Circuits)

在传统密集模型中,完成一个任务可能需要成千上万个节点协同工作,逻辑分散且难以捕捉。而在稀疏模型中,研究团队观察到了极简的计算路径:

1、极简的逻辑单元:例如在处理“字符串闭合”任务时,模型仅用12个节点就构建了一个完美的电路,清晰地展示了它是如何检测单引号或双引号是否闭合的。

2、可读的特征:神经元的激活变得具有明确的语义。研究人员发现了一些神经元专门负责检测“单引号”,另一些则像“计数器”一样精确地追踪列表的嵌套深度。

3、规模缩减16倍:对比实验显示,在相同的任务损失下,稀疏模型的电路规模比密集模型小了16倍。这意味着解读AI思维的难度降低了整整一个数量级。


▲稀疏模型的电路规模比密集模型小了16倍(图源:OpenAI技术论文)

为了验证这些电路的真实性,团队进行了“均值消融”实验。结果证明,移除非电路节点对任务几乎没有影响,而一旦移除电路中的关键节点,模型性能就会瞬间崩塌。这证实了这些电路确实是模型执行任务的“必经之路”。


▲“均值消融”实验(图源:OpenAI技术论文)

三、稀疏模型解读力强但速度慢千倍,OpenAI提出“桥梁网络”

为了测量稀疏模型计算的解耦程度。研究团队设计了一套简单的算法任务。对于每个模型,他们都将其剪裁成了仍能执行该任务的最小电路,并检查了该电路的简洁程度。

研究团队发现,用规模更大、稀疏度更高的模型进行训练后,就能够依托结构更简洁的电路,构建出性能更强的模型。


▲模型的可解释性与能力的对比图(图源:OpenAI技术博客)

从模型可解释性与性能的对比图可见,在稀疏模型规模固定的前提下,提升稀疏性,也就是将更多权重置零,虽会导致模型性能有所下降,但能显著增强其可解释性。

尽管稀疏模型在可解释性方面优势突出,但其应用目前受限于计算效率瓶颈:稀疏矩阵运算无法借助Tensor Cores实现加速,运算速度较密集模型慢100至1000倍。这意味着,将该技术直接应用于千亿参数级别的前沿大模型,现阶段尚不具备可行性。

为此,研究团队提出了“桥梁网络”(Bridges)方案:

1、编码-解码映射:在稀疏模型与预训练的密集模型之间插入一个编码器-解码器对。

2、跨模型干预:编码器将密集模型的激活映射到稀疏空间,解码器则反向转换。

“桥梁网络”(Bridges)方案可以在“透明”的稀疏模型上修改某个特征,然后通过桥梁将这种扰动映射回“黑箱”的密集模型,从而实现对现有大模型的可解释性行为编辑。

结语:OpenAI提出稀疏化新路径,让大模型从“黑箱”走向“可解释”

OpenAI研究团队的这项研究,标志着AI可解释性领域的一项重要突破,也印证了理解AI并非遥不可及的目标。

研究团队在论文博客中称,这项工作是迈向更宏大目标的早期探索。接下来,他们计划将相关技术扩展至更大规模的模型,同时进一步解释更多模型的行为逻辑。

为解决稀疏模型训练效率低下的问题,团队提出了两个后续研究方向:一是从现有密集模型中提取稀疏电路,替代“从头训练稀疏模型”的传统方式;二是研发更高效的可解释性模型训练技术,推动相关技术更易落地生产。

“我们的目标是逐步扩大可可靠解释的模型范围,同时打造相关工具,让未来的AI系统更易于分析、调试与评估。”研究团队在论文博客中写道。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
春晚名场面!王一博获好评,易烊千玺垫肩抢镜,热巴让人认不出

春晚名场面!王一博获好评,易烊千玺垫肩抢镜,热巴让人认不出

萌神木木
2026-02-16 21:24:57
春晚49个节目,仅3个小品无相声:为何我们最想看的,反而最少?

春晚49个节目,仅3个小品无相声:为何我们最想看的,反而最少?

补两刀
2026-02-16 19:12:21
日本首相高市早苗发表贺辞祝贺春节

日本首相高市早苗发表贺辞祝贺春节

东瀛万事通
2026-02-16 18:54:22
就为道那声“过年好”

就为道那声“过年好”

北青深一度
2026-02-16 11:06:41
央视春晚节目单公布,网友惊呼三个没想到,王菲取代岳云鹏成热点

央视春晚节目单公布,网友惊呼三个没想到,王菲取代岳云鹏成热点

蜜桔娱乐
2026-02-16 16:01:33
西方滤镜破碎!美游客拒不回国,死磕2400小时,这记耳光打得太响

西方滤镜破碎!美游客拒不回国,死磕2400小时,这记耳光打得太响

古史青云啊
2026-02-16 09:21:19
WOW!易建联公开露面!等了整整两年时间

WOW!易建联公开露面!等了整整两年时间

篮球实战宝典
2026-02-16 17:54:12
彻底沸腾!刚刚,暴涨90%!整个板块,集体狂飙!

彻底沸腾!刚刚,暴涨90%!整个板块,集体狂飙!

证券时报
2026-02-16 18:04:09
冯小刚一家晒除夕照!徐帆忙着炒菜包水饺,女儿穿新中式旗袍超美

冯小刚一家晒除夕照!徐帆忙着炒菜包水饺,女儿穿新中式旗袍超美

乐悠悠娱乐
2026-02-16 19:26:40
56岁照样是顶流!2025年王菲只用一首歌,给整个华语乐坛上了一课

56岁照样是顶流!2025年王菲只用一首歌,给整个华语乐坛上了一课

银河史记
2025-12-23 12:42:52
迪丽热巴人鱼公主杀疯了!水下跳舞美到失语,这哪是春晚这是深海幻境

迪丽热巴人鱼公主杀疯了!水下跳舞美到失语,这哪是春晚这是深海幻境

动物奇奇怪怪
2026-02-16 22:53:28
哥伦比亚飞行员高空拍下史上最清晰UFO,3810米高空无翼无声飞行

哥伦比亚飞行员高空拍下史上最清晰UFO,3810米高空无翼无声飞行

老马拉车莫少装
2026-02-14 16:44:34
王晶没撒谎!退出春晚、和沈腾决裂,性格大变的贾玲印证他说的话

王晶没撒谎!退出春晚、和沈腾决裂,性格大变的贾玲印证他说的话

胡一舸南游y
2026-01-25 14:54:04
离过年仅3天!29岁关晓彤高调官宣喜讯,全网恭喜,鹿晗后悔吗?

离过年仅3天!29岁关晓彤高调官宣喜讯,全网恭喜,鹿晗后悔吗?

喜欢历史的阿繁
2026-02-14 22:12:26
莫斯科遭大规模袭击,俄罗斯将马斯克告上联合国

莫斯科遭大规模袭击,俄罗斯将马斯克告上联合国

史政先锋
2026-02-16 16:50:29
中国欢喜过大年,1亿多日本人却迎来噩耗,高市被紧急送往医院

中国欢喜过大年,1亿多日本人却迎来噩耗,高市被紧急送往医院

大鱼简科
2026-02-16 09:33:17
央视春晚主持人:龙洋总看提词器,撒贝宁笑点太多,刘心悦很惊喜

央视春晚主持人:龙洋总看提词器,撒贝宁笑点太多,刘心悦很惊喜

古希腊掌管月桂的神
2026-02-16 20:56:33
太抠了!网友怒斥表哥月工资14000块,每次拜年都是一桶油一袋米

太抠了!网友怒斥表哥月工资14000块,每次拜年都是一桶油一袋米

火山詩话
2026-02-15 11:03:31
诡异,春联上没有汉字!越南去汉字化确实很成功

诡异,春联上没有汉字!越南去汉字化确实很成功

魔都姐姐杂谈
2026-02-15 14:12:14
看了观众对王菲央视马年春晚的评价,李健的话,终于有人信了

看了观众对王菲央视马年春晚的评价,李健的话,终于有人信了

娱最资讯
2026-02-16 22:32:42
2026-02-16 23:56:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11238文章数 116972关注度
往期回顾 全部

科技要闻

阿里除夕发布千问3.5,性能媲美Gemini 3

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

体育要闻

全明星正赛美国星辰队夺冠 爱德华兹MVP

娱乐要闻

王菲六登春晚献唱 水滴钻石耳环再出圈

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

叫停纯屏操作 工信部拟推车内实体操作件强制国标

态度原创

游戏
教育
旅游
数码
公开课

CDPR为中国玩家送上春节祝福!新春贺图送上

教育要闻

国家急需20万“造芯人”!高中生选对这5个专业,毕业即抢手

旅游要闻

巨型“彩马”驰骋上海夜空 上千架无人机浪漫烟花交相辉映

数码要闻

B站上架AIPIAIPI洛天依甜甜圈蓝牙耳机礼盒,129元

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版