网易首页 > 网易号 > 正文 申请入驻

斯坦福报告:AI透明度集体倒退!IBM夺冠,马斯克xAI垫底

0
分享至

最近,美国斯坦福大学等团队发布了一份名为《2025 年基础模型透明度指数》(FMTI,The 2025 Foundation Model Transparency Index)的报告。其中,IBM 以透明度得分最高夺冠,xAI 和 Midjourney 则垫底。

该报告揭示了一种令人担忧的趋势:随着技术的发展,尽管基础模型在性能等各方面持续进步,但其在数据使用、模型训练和下游影响等方面的透明度却出现了集体倒退。

这是该报告自 2023 年以来发布的第三个年度版本,就像通过量化透明度为各大基础模型开发者做一次“体检”。

本次评估共包括 13 家基础模型公司,其中既有阿里巴巴、DeepSeek 和马斯克的 xAI 等首次纳入报告的企业,也有 IBM、OpenAI 等老牌科技巨头。为使评估更全面,今年的报告中还涵盖了数据获取、使用数据和监控等方面的新指标。


(来源:The 2025 Foundation Model Transparency Index)

从报告的整体结果来看,尽管 2024 年报告显示模型透明度有短暂的改善,但 2025 年的报告指出,透明度指数正呈现倒退:各基础模型的平均得分从 2024 年的 58 分下降到 2025 年的 40 分,几乎与 2023 年报告首次发布时的水平相当(备注:100 分为满分)。

报告显示,公司在其旗舰模型的训练数据、训练计算以及模型部署后的使用和影响方面信息披露最为有限。尽管公司在模型能力评估和风险评估方面披露较多,但在方法透明度、第三方参与、可复现性和训练-测试数据重叠报告方面仍存在挑战。


(来源:The 2025 Foundation Model Transparency Index)

从各公司的表现来看差异明显,其中 IBM 以 95 分获得透明度最高得分,xAI 和 Midjourney 得分最低,仅 14 分。中国的两家公司 DeepSeek 和阿里巴巴在透明度的得分则位于中下游。

可以看到的是,公司特征和透明度指数在某些程度上存在着一些有趣的关联,例如开放模型开发者、以企业为中心的 B2B 公司、自行准备透明度报告的公司以及签署欧盟 AI 法案通用目的 AI 行为准则的公司得分高于平均水平。


(来源:The 2025 Foundation Model Transparency Index)

那么,透明度越高就意味着模型越好吗?

清华大学邱寒副教授告诉 DeepTech,“这里的透明度不等同于我们常识认为的开源,而是由一系列明确的打分表组成的量化指标——如果不按照这个指标披露相关的数据(而不是什么都没披露),那么这项指标得分就是 0。”


以阿里巴巴 Qwen 和 DeepSeek 得分均为 0 的使用数据、影响、部署后监控三项指标为例:它们都各自含有更详细的评测指标,得分为 0 并不等于什么都没有披露,而这些计算指标的方法与开源、安全、性能并不能直接划等号。

需要了解的是,透明或开源也并不意味着模型性能更好。从这份报告来看,透明度得分最高的模型(IBM 的 Granite 3.3),在实际应用场景种的性能表现并不是最顶尖的那批模型。

试想一下,如果有一个任务要做,你是会去选择微调 Qwen3 或 Claude 的 API,还是会因为透明度得分更高而选择 Granite 3.3?

邱寒认为,透明度是安全的前提,但必须明确不一定是报告中定义的透明:如果公司拒绝披露任何模型生产相关的信息,比如版权内容、隐私数据的滥用确实难以发掘和确认;模型的偏见和价值观更难评测,确实会给安全和治理带来一定的影响。更糟的是,一旦严重安全事故发生,还可能引发更粗暴的安全监管策略落地,反而进一步限制了大模型技术的进步。

该报告提到,随着全球政策制定者越来越多地要求某些类型的透明度,这项工作揭示了基础模型开发者的当前透明度状态,透明度可能如何变化,以及需要更积极的政策干预来解决哪些关键信息问题。

正如邱寒所指出的那样,黑盒模型的评测技术可以在一定程度上弥补不透明的问题,而当前的透明与否也只是暂时状态。随着模型落地的深化和监管机制的完善,最终目标是“公司不需完全公开,但模型行为可测、声明可证、安全可控”。

总之,表面上看公司信息披露程度影响透明度,但本质上这需要一种权责归属的清晰界定。通过这份报告对透明度倒退的警示,我们需要看到,未来需要构建一种综合的激励机制,来理解、评估并最终确保模型的安全与可信。

参考资料:

https://arxiv.org/abs/2512.10169

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普时隔9年再度访华;首次访华两国曾签下2535亿美元大单,今年2月特朗普还在赞叹访华期间中国仪仗队强大阵容、整齐划一

特朗普时隔9年再度访华;首次访华两国曾签下2535亿美元大单,今年2月特朗普还在赞叹访华期间中国仪仗队强大阵容、整齐划一

极目新闻
2026-05-11 10:22:20
王曼昱负蒯曼,孙颖莎挽颜面,日本教练评价更显分量

王曼昱负蒯曼,孙颖莎挽颜面,日本教练评价更显分量

七七自驾游
2026-05-10 22:01:08
实锤了!俄媒公布俄军真实伤亡数字,比利时向乌克兰提供53架F16

实锤了!俄媒公布俄军真实伤亡数字,比利时向乌克兰提供53架F16

史政先锋
2026-05-10 21:05:57
特斯拉降价,扯下电动汽车成本的遮羞布——电动车的成本有多低?

特斯拉降价,扯下电动汽车成本的遮羞布——电动车的成本有多低?

社会日日鲜
2026-05-10 09:26:48
马刺极致三后卫:福克斯卡斯尔哈珀合砍68+17 全轰20+虽败犹荣

马刺极致三后卫:福克斯卡斯尔哈珀合砍68+17 全轰20+虽败犹荣

醉卧浮生
2026-05-11 10:26:04
NBA乐透抽签揭晓!奇才状元爵士榜眼灰熊探花 快船幸运获得5号签

NBA乐透抽签揭晓!奇才状元爵士榜眼灰熊探花 快船幸运获得5号签

罗说NBA
2026-05-11 04:54:29
25三分追平历史纪录!尼克斯4-0横扫76人进东决 恩比德空砍24分

25三分追平历史纪录!尼克斯4-0横扫76人进东决 恩比德空砍24分

醉卧浮生
2026-05-11 06:13:45
​围观也能赔上千亿:中东这把火,把印度烧成了最惨的局外人

​围观也能赔上千亿:中东这把火,把印度烧成了最惨的局外人

局势帝
2026-05-10 18:00:40
拉什福德任意球破门,费兰建功定乾坤,巴萨2-0复仇皇马勇夺29冠

拉什福德任意球破门,费兰建功定乾坤,巴萨2-0复仇皇马勇夺29冠

钉钉陌上花开
2026-05-11 05:10:06
世乒赛女团落幕:孙颖莎拿2分,国乒翻盘日本夺冠,马琳现场落泪

世乒赛女团落幕:孙颖莎拿2分,国乒翻盘日本夺冠,马琳现场落泪

侃球熊弟
2026-05-10 21:06:23
事态升级!三亚海鲜商户集体愤怒,官方协会发声,游客仍有条退路

事态升级!三亚海鲜商户集体愤怒,官方协会发声,游客仍有条退路

观察鉴娱
2026-05-10 09:44:36
Lisa贡献姐妹给欧美大佬!

Lisa贡献姐妹给欧美大佬!

八卦疯叔
2026-05-11 09:30:10
国内砍一刀没人管,海外直接罚3亿多,Temu 给所有电商上了一课

国内砍一刀没人管,海外直接罚3亿多,Temu 给所有电商上了一课

干史人
2026-05-09 15:30:03
法国正式颁布关于归还非法所获文物的法律:将1815至1972年间以偷盗、掠夺等方式所得的外国文物,从“公共领域”中“移出”

法国正式颁布关于归还非法所获文物的法律:将1815至1972年间以偷盗、掠夺等方式所得的外国文物,从“公共领域”中“移出”

封面新闻
2026-05-11 05:24:07
孙颖莎拒绝沾光!让日本输得心服口服,张本美和对王曼昱成功祛魅

孙颖莎拒绝沾光!让日本输得心服口服,张本美和对王曼昱成功祛魅

三十年莱斯特城球迷
2026-05-10 19:59:48
曝华为“白嫖”开源团队技术方案!踢了对方转头低价找外包!

曝华为“白嫖”开源团队技术方案!踢了对方转头低价找外包!

爆角追踪
2026-05-11 09:54:53
惨遭国乒男团3:0横扫!张本智和赛后与赛前采访对比,狠狠被打脸

惨遭国乒男团3:0横扫!张本智和赛后与赛前采访对比,狠狠被打脸

田先生篮球
2026-05-11 06:20:39
他套现百亿,留下27万股民和一张ST废纸,闻泰科技给投资者上了一课

他套现百亿,留下27万股民和一张ST废纸,闻泰科技给投资者上了一课

A活着
2026-05-09 20:47:26
仅一夜!NBA状元签出炉,快船队成最大赢家,下赛季超级黑马诞生

仅一夜!NBA状元签出炉,快船队成最大赢家,下赛季超级黑马诞生

篮球扫地僧
2026-05-11 10:51:55
是谁在偷换了世界杯转播权之争的逻辑?

是谁在偷换了世界杯转播权之争的逻辑?

鲁先生的笔
2026-05-10 21:12:47
2026-05-11 11:04:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16685文章数 514940关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

牛弹琴:美伊又谈崩了 特朗普发飙美军出动数十艘军舰

头条要闻

牛弹琴:美伊又谈崩了 特朗普发飙美军出动数十艘军舰

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

谢霆锋没想到,王菲靠张艺谋重返巅峰

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

全球化成国内车企未来胜负手,谁是出海最强"水手"?

态度原创

健康
艺术
旅游
手机
公开课

干细胞能让人“返老还童”吗

艺术要闻

三位神经科学研究者:年轻人的脑子太累了

旅游要闻

新疆克州:游客骑牦牛骆驼游览白沙河景区

手机要闻

首台单核突破4000分大关的安卓手机:红魔11S Pro+跑分曝光

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版