网易首页 > 网易号 > 正文 申请入驻

斯坦福报告:AI透明度集体倒退!IBM夺冠,马斯克xAI垫底

0
分享至

最近,美国斯坦福大学等团队发布了一份名为《2025 年基础模型透明度指数》(FMTI,The 2025 Foundation Model Transparency Index)的报告。其中,IBM 以透明度得分最高夺冠,xAI 和 Midjourney 则垫底。

该报告揭示了一种令人担忧的趋势:随着技术的发展,尽管基础模型在性能等各方面持续进步,但其在数据使用、模型训练和下游影响等方面的透明度却出现了集体倒退。

这是该报告自 2023 年以来发布的第三个年度版本,就像通过量化透明度为各大基础模型开发者做一次“体检”。

本次评估共包括 13 家基础模型公司,其中既有阿里巴巴、DeepSeek 和马斯克的 xAI 等首次纳入报告的企业,也有 IBM、OpenAI 等老牌科技巨头。为使评估更全面,今年的报告中还涵盖了数据获取、使用数据和监控等方面的新指标。


(来源:The 2025 Foundation Model Transparency Index)

从报告的整体结果来看,尽管 2024 年报告显示模型透明度有短暂的改善,但 2025 年的报告指出,透明度指数正呈现倒退:各基础模型的平均得分从 2024 年的 58 分下降到 2025 年的 40 分,几乎与 2023 年报告首次发布时的水平相当(备注:100 分为满分)。

报告显示,公司在其旗舰模型的训练数据、训练计算以及模型部署后的使用和影响方面信息披露最为有限。尽管公司在模型能力评估和风险评估方面披露较多,但在方法透明度、第三方参与、可复现性和训练-测试数据重叠报告方面仍存在挑战。


(来源:The 2025 Foundation Model Transparency Index)

从各公司的表现来看差异明显,其中 IBM 以 95 分获得透明度最高得分,xAI 和 Midjourney 得分最低,仅 14 分。中国的两家公司 DeepSeek 和阿里巴巴在透明度的得分则位于中下游。

可以看到的是,公司特征和透明度指数在某些程度上存在着一些有趣的关联,例如开放模型开发者、以企业为中心的 B2B 公司、自行准备透明度报告的公司以及签署欧盟 AI 法案通用目的 AI 行为准则的公司得分高于平均水平。


(来源:The 2025 Foundation Model Transparency Index)

那么,透明度越高就意味着模型越好吗?

清华大学邱寒副教授告诉 DeepTech,“这里的透明度不等同于我们常识认为的开源,而是由一系列明确的打分表组成的量化指标——如果不按照这个指标披露相关的数据(而不是什么都没披露),那么这项指标得分就是 0。”


以阿里巴巴 Qwen 和 DeepSeek 得分均为 0 的使用数据、影响、部署后监控三项指标为例:它们都各自含有更详细的评测指标,得分为 0 并不等于什么都没有披露,而这些计算指标的方法与开源、安全、性能并不能直接划等号。

需要了解的是,透明或开源也并不意味着模型性能更好。从这份报告来看,透明度得分最高的模型(IBM 的 Granite 3.3),在实际应用场景种的性能表现并不是最顶尖的那批模型。

试想一下,如果有一个任务要做,你是会去选择微调 Qwen3 或 Claude 的 API,还是会因为透明度得分更高而选择 Granite 3.3?

邱寒认为,透明度是安全的前提,但必须明确不一定是报告中定义的透明:如果公司拒绝披露任何模型生产相关的信息,比如版权内容、隐私数据的滥用确实难以发掘和确认;模型的偏见和价值观更难评测,确实会给安全和治理带来一定的影响。更糟的是,一旦严重安全事故发生,还可能引发更粗暴的安全监管策略落地,反而进一步限制了大模型技术的进步。

该报告提到,随着全球政策制定者越来越多地要求某些类型的透明度,这项工作揭示了基础模型开发者的当前透明度状态,透明度可能如何变化,以及需要更积极的政策干预来解决哪些关键信息问题。

正如邱寒所指出的那样,黑盒模型的评测技术可以在一定程度上弥补不透明的问题,而当前的透明与否也只是暂时状态。随着模型落地的深化和监管机制的完善,最终目标是“公司不需完全公开,但模型行为可测、声明可证、安全可控”。

总之,表面上看公司信息披露程度影响透明度,但本质上这需要一种权责归属的清晰界定。通过这份报告对透明度倒退的警示,我们需要看到,未来需要构建一种综合的激励机制,来理解、评估并最终确保模型的安全与可信。

参考资料:

https://arxiv.org/abs/2512.10169

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
老朱家血统可能不干净……

老朱家血统可能不干净……

汉周读书
2026-01-31 12:55:06
汪小菲又曝大瓜!葛思齐称其半夜给自己打电话,不理解大S离婚

汪小菲又曝大瓜!葛思齐称其半夜给自己打电话,不理解大S离婚

不八卦掌门人
2026-02-01 15:46:12
什么叫洗钱?网友:比亚迪造卫星一年20亿,拍一个减肥电影要3亿

什么叫洗钱?网友:比亚迪造卫星一年20亿,拍一个减肥电影要3亿

夜深爱杂谈
2025-12-11 20:39:39
2014年,黄海波刚走出收容所的大门,曲栅栅迎了上来

2014年,黄海波刚走出收容所的大门,曲栅栅迎了上来

忠于法纪
2026-01-20 18:30:40
备战同曦!李弘权参加踩场,卢伟单独执教小偰,郭昊文与众人叙旧

备战同曦!李弘权参加踩场,卢伟单独执教小偰,郭昊文与众人叙旧

篮球资讯达人
2026-02-01 15:36:50
“真正的中国人是付钱的!”日本人竟冒充国人在巴基斯坦骗吃骗喝

“真正的中国人是付钱的!”日本人竟冒充国人在巴基斯坦骗吃骗喝

有书
2026-01-31 16:45:03
92岁前法官独居上海养老院,独子留英40年开公司,他竟说不后悔

92岁前法官独居上海养老院,独子留英40年开公司,他竟说不后悔

大鱼简科
2026-01-23 16:41:32
反向收割?印度人把中国网贷当作“国家补贴”,坏账率高达80%!

反向收割?印度人把中国网贷当作“国家补贴”,坏账率高达80%!

胖哥不胡说
2026-01-20 11:47:25
昨日贵金属现史诗级暴跌不减市民抢购热潮,上海豫园老铺黄金门前有人裹着羽绒服带着露营椅彻夜排队,部分畅销款式已断货

昨日贵金属现史诗级暴跌不减市民抢购热潮,上海豫园老铺黄金门前有人裹着羽绒服带着露营椅彻夜排队,部分畅销款式已断货

纵相新闻
2026-02-01 03:17:02
千万别姐弟恋,很累!

千万别姐弟恋,很累!

果粉之家
2026-01-06 11:26:21
宋朝富裕全靠这个行业政策,连元朝都不愿废除,却让朱元璋给废了

宋朝富裕全靠这个行业政策,连元朝都不愿废除,却让朱元璋给废了

历史大学堂
2026-01-31 19:34:36
成人片单!五部被低估的“伦理神作”,把禁忌拍成了艺术

成人片单!五部被低估的“伦理神作”,把禁忌拍成了艺术

得心电影
2026-02-01 17:35:18
江苏南京一校花,身高162CM,体重47公斤,五官精致到无懈可击

江苏南京一校花,身高162CM,体重47公斤,五官精致到无懈可击

奇思妙想生活家
2026-01-31 14:53:58
金晨事件后续,内部聊天曝光,太抠门没谈拢,多段绯闻记者放实锤

金晨事件后续,内部聊天曝光,太抠门没谈拢,多段绯闻记者放实锤

不写散文诗
2026-01-30 15:15:56
勇士消息:库里最新伤情出炉,格林离队概率增加,悍将回归倒计时

勇士消息:库里最新伤情出炉,格林离队概率增加,悍将回归倒计时

冷月小风风
2026-02-01 11:48:45
华为宣布:最高降4000元!此前苹果开启大降价

华为宣布:最高降4000元!此前苹果开启大降价

每日经济新闻
2026-01-29 18:19:05
郭凤莲感叹:要是按照陈永贵书记的设想继续发展,大寨会走向何处

郭凤莲感叹:要是按照陈永贵书记的设想继续发展,大寨会走向何处

悄悄史话
2026-01-26 18:00:42
“流氓有文化更可怕”,退休老干部频繁联系女幼师,聊天记录曝光

“流氓有文化更可怕”,退休老干部频繁联系女幼师,聊天记录曝光

妍妍教育日记
2026-01-27 19:58:28
黄国昌成立竞选总部,柯文哲刚放狂言,民众党生变,美女博士暴怒

黄国昌成立竞选总部,柯文哲刚放狂言,民众党生变,美女博士暴怒

靓仔情感
2026-02-01 16:34:47
贵州毕节临街门面被砌墙封堵?官方通报:业主矛盾,已全部拆除

贵州毕节临街门面被砌墙封堵?官方通报:业主矛盾,已全部拆除

新京报
2026-02-01 17:34:07
2026-02-01 18:15:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16205文章数 514576关注度
往期回顾 全部

科技要闻

腾讯元宝宣布:10亿现金红包,今日开抢

头条要闻

开年首月连打张又侠等十"虎" 反腐没有"禁区特区盲区"

头条要闻

开年首月连打张又侠等十"虎" 反腐没有"禁区特区盲区"

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

马年春晚第三次联排,多位明星现身

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

房产
家居
艺术
公开课
军事航空

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

家居要闻

蓝调空舍 自由与个性

艺术要闻

明代隐藏的“草书高手”,他的字无人能模仿

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗民众:伊朗不会屈服于美国霸权

无障碍浏览 进入关怀版