网易首页 > 网易号 > 正文 申请入驻

斯坦福报告:AI透明度集体倒退!IBM夺冠,马斯克xAI垫底

0
分享至

来源:市场资讯

(来源:DeepTech深科技)

最近,美国斯坦福大学等团队发布了一份名为《2025 年基础模型透明度指数》(FMTI,The 2025 Foundation Model Transparency Index)的报告。其中,IBM 以透明度得分最高夺冠,xAI 和 Midjourney 则垫底。

该报告揭示了一种令人担忧的趋势:随着技术的发展,尽管基础模型在性能等各方面持续进步,但其在数据使用、模型训练和下游影响等方面的透明度却出现了集体倒退。

这是该报告自 2023 年以来发布的第三个年度版本,就像通过量化透明度为各大基础模型开发者做一次“体检”。

本次评估共包括 13 家基础模型公司,其中既有阿里巴巴、DeepSeek 和马斯克的 xAI 等首次纳入报告的企业,也有 IBM、OpenAI 等老牌科技巨头。为使评估更全面,今年的报告中还涵盖了数据获取、使用数据和监控等方面的新指标。


(来源:The 2025 Foundation Model Transparency Index)

从报告的整体结果来看,尽管 2024 年报告显示模型透明度有短暂的改善,但 2025 年的报告指出,透明度指数正呈现倒退:各基础模型的平均得分从 2024 年的 58 分下降到 2025 年的 40 分,几乎与 2023 年报告首次发布时的水平相当(备注:100 分为满分)。

报告显示,公司在其旗舰模型的训练数据、训练计算以及模型部署后的使用和影响方面信息披露最为有限。尽管公司在模型能力评估和风险评估方面披露较多,但在方法透明度、第三方参与、可复现性和训练-测试数据重叠报告方面仍存在挑战。


(来源:The 2025 Foundation Model Transparency Index)

从各公司的表现来看差异明显,其中 IBM 以 95 分获得透明度最高得分,xAI 和 Midjourney 得分最低,仅 14 分。中国的两家公司 DeepSeek 和阿里巴巴在透明度的得分则位于中下游。

可以看到的是,公司特征和透明度指数在某些程度上存在着一些有趣的关联,例如开放模型开发者、以企业为中心的 B2B 公司、自行准备透明度报告的公司以及签署欧盟 AI 法案通用目的 AI 行为准则的公司得分高于平均水平。


(来源:The 2025 Foundation Model Transparency Index)

那么,透明度越高就意味着模型越好吗?

清华大学邱寒副教授告诉 DeepTech,“这里的透明度不等同于我们常识认为的开源,而是由一系列明确的打分表组成的量化指标——如果不按照这个指标披露相关的数据(而不是什么都没披露),那么这项指标得分就是 0。”

以阿里巴巴 Qwen 和 DeepSeek 得分均为 0 的使用数据、影响、部署后监控三项指标为例:它们都各自含有更详细的评测指标,得分为 0 并不等于什么都没有披露,而这些计算指标的方法与开源、安全、性能并不能直接划等号。

需要了解的是,透明或开源也并不意味着模型性能更好。从这份报告来看,透明度得分最高的模型(IBM 的 Granite 3.3),在实际应用场景种的性能表现并不是最顶尖的那批模型。

试想一下,如果有一个任务要做,你是会去选择微调 Qwen3 或 Claude 的 API,还是会因为透明度得分更高而选择 Granite 3.3?

邱寒认为,透明度是安全的前提,但必须明确不一定是报告中定义的透明:如果公司拒绝披露任何模型生产相关的信息,比如版权内容、隐私数据的滥用确实难以发掘和确认;模型的偏见和价值观更难评测,确实会给安全和治理带来一定的影响。更糟的是,一旦严重安全事故发生,还可能引发更粗暴的安全监管策略落地,反而进一步限制了大模型技术的进步。

该报告提到,随着全球政策制定者越来越多地要求某些类型的透明度,这项工作揭示了基础模型开发者的当前透明度状态,透明度可能如何变化,以及需要更积极的政策干预来解决哪些关键信息问题。

正如邱寒所指出的那样,黑盒模型的评测技术可以在一定程度上弥补不透明的问题,而当前的透明与否也只是暂时状态。随着模型落地的深化和监管机制的完善,最终目标是“公司不需完全公开,但模型行为可测、声明可证、安全可控”。

总之,表面上看公司信息披露程度影响透明度,但本质上这需要一种权责归属的清晰界定。通过这份报告对透明度倒退的警示,我们需要看到,未来需要构建一种综合的激励机制,来理解、评估并最终确保模型的安全与可信。

参考资料:

https://arxiv.org/abs/2512.10169

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
50万负债逼疯上海土著女生,该如何翻身?评论区上海网友炸锅了

50万负债逼疯上海土著女生,该如何翻身?评论区上海网友炸锅了

火山詩话
2026-03-12 15:25:36
张艺兴被曝封杀大结局!国家话剧院证实,这次终于真相大白了

张艺兴被曝封杀大结局!国家话剧院证实,这次终于真相大白了

离离言几许
2026-03-12 16:55:07
史上最幽默的十首打油诗,令人笑掉大牙

史上最幽默的十首打油诗,令人笑掉大牙

长风文史
2026-03-12 14:07:03
山东省人大监察和司法委员会原副主任委员苏立科接受纪律审查和监察调查

山东省人大监察和司法委员会原副主任委员苏立科接受纪律审查和监察调查

界面新闻
2026-03-13 10:03:37
伊朗男足回应特朗普:没人能让我们退出世界杯!美国不配当东道主

伊朗男足回应特朗普:没人能让我们退出世界杯!美国不配当东道主

念洲
2026-03-13 06:45:59
特朗普懵了!伊朗海峡布雷、连炸油轮,要美国认输“赔款”?

特朗普懵了!伊朗海峡布雷、连炸油轮,要美国认输“赔款”?

宋鸿兵
2026-03-12 19:16:44
绝不是迷信,房地产若救不起来,今年必遇5个大难题,人人受影响

绝不是迷信,房地产若救不起来,今年必遇5个大难题,人人受影响

老特有话说
2026-03-12 16:40:58
美国也想要的乌克兰“大杀器”,到底什么样?

美国也想要的乌克兰“大杀器”,到底什么样?

网易新闻出品
2026-03-12 22:34:37
扬州女司机挨打后续:交警已跟进,男方赔了3万,女方身份被扒

扬州女司机挨打后续:交警已跟进,男方赔了3万,女方身份被扒

社会日日鲜
2026-03-13 03:36:28
“四个季度考核都是C,年度考核等级D”女子差1分合格,失去12.9万年终奖,仲裁赢了官司输了已上诉

“四个季度考核都是C,年度考核等级D”女子差1分合格,失去12.9万年终奖,仲裁赢了官司输了已上诉

大风新闻
2026-03-12 18:40:43
苏宁张近东资产清零,2387亿债务震惊全网!

苏宁张近东资产清零,2387亿债务震惊全网!

新零售参考Pro
2026-03-12 18:48:50
C刊论文:《论哈梅内伊的科技观》

C刊论文:《论哈梅内伊的科技观》

必记本
2026-03-13 00:17:55
扬州一女子车祸被打后续:长相曝光,人无赖嘴恶毒,全家受到舆论

扬州一女子车祸被打后续:长相曝光,人无赖嘴恶毒,全家受到舆论

奇思妙想草叶君
2026-03-11 22:56:10
埃梅里杯的含金量,英超本周欧战9队仅维拉取胜,总战绩1胜3平5负

埃梅里杯的含金量,英超本周欧战9队仅维拉取胜,总战绩1胜3平5负

懂球帝
2026-03-13 06:20:07
巴拿马媒体发出警告,中资撤离或重创经济,金融界批巴政府鲁莽

巴拿马媒体发出警告,中资撤离或重创经济,金融界批巴政府鲁莽

谛听骨语本尊
2026-03-12 18:10:38
什么才是真的?究竟是谁炸了伊朗女子小学?

什么才是真的?究竟是谁炸了伊朗女子小学?

孟德斯韭
2026-03-12 22:27:47
济州航空空难调查发现9块疑似遇难者遗骸,韩国航空业总体调查结果显示有62名飞行员隐瞒抑郁症在内的精神病史继续执飞

济州航空空难调查发现9块疑似遇难者遗骸,韩国航空业总体调查结果显示有62名飞行员隐瞒抑郁症在内的精神病史继续执飞

扬子晚报
2026-03-12 23:30:09
嘴硬如铁,腿软如纸!伊朗新领袖首份声明,连脸都不敢露

嘴硬如铁,腿软如纸!伊朗新领袖首份声明,连脸都不敢露

老马拉车莫少装
2026-03-12 21:39:10
曝光张津瑜不雅视频的吕总,到底是谁?

曝光张津瑜不雅视频的吕总,到底是谁?

听风听你
2026-03-12 21:12:05
台湾GDP和大陆比值,1960年为2.9%,1993年为52%,现在是多少?

台湾GDP和大陆比值,1960年为2.9%,1993年为52%,现在是多少?

壹号股权
2026-03-12 15:45:31
2026-03-13 11:12:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2462369文章数 5846关注度
往期回顾 全部

科技要闻

龙虾热卷到AI硬件 “无脑”硬件或被淘汰

头条要闻

牛弹琴:全世界必须放弃幻想了 美国高层倒吸一口凉气

头条要闻

牛弹琴:全世界必须放弃幻想了 美国高层倒吸一口凉气

体育要闻

建议将“出球型门将”纳入反诈app

娱乐要闻

小S复工录制 感谢贾永婕陪大S走到最后

财经要闻

"短剧"苦抄袭

汽车要闻

本田汽车全年业绩由盈转亏 高管们降薪3个月以担责

态度原创

游戏
教育
房产
公开课
军事航空

谁能拒绝毛茸茸机宝呢?《杀戮尖塔2》官方周边发布

教育要闻

家风润心 习惯筑梦 家国铸魂——段霞家教好故事

房产要闻

唏嘘!三亚又一房企巨头破产,狂欠43亿甩卖资产!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普自行宣布对伊朗战争胜利

无障碍浏览 进入关怀版