网易首页 > 网易号 > 正文 申请入驻

AI行业透明度持续下降趋势显著

0
分享至


一项新研究显示,AI行业正在隐瞒关键信息。

AI公司以及整个AI产业从未如此重要。包括谷歌和Meta在内的七家知名AI公司占标准普尔500指数总市值的35%以上。OpenAI和Anthropic等初创公司是历史上最有价值的私人公司。数十亿人正在使用基础模型搜索信息、协助写作以及生成图像、视频和音频。但构建我们共同未来的这些公司到底有多透明?

今天,我们来自斯坦福、伯克利、普林斯顿和麻省理工学院的研究团队发布了2025年基础模型透明度指数,这是年度基础模型透明度指数的第三版。我们发现,自2024年以来透明度有所下降,各公司在透明度方面存在巨大差异。

2025年基础模型透明度指数对13家公司进行了评分,发现各公司在优先考虑透明度方面存在巨大差异。

基础模型透明度指数是一份年度报告,全面评估主要AI公司在其旗舰模型方面的透明度。每家公司都按100分制进行评分,涵盖训练数据、风险缓解和经济影响等主题。今年的指数表明,整个行业的透明度水平较低。在100分制中,公司平均得分仅为40分。

虽然平均分较低,但各公司的做法差异很大。出现了三个集群:表现最佳的公司得分约75分,中等水平的约35分,得分较低的平均约15分。

在榜首位置,IBM以95/100的分数创下了该指数历史上的最高分。值得注意的是,IBM通过在多个指标上披露信息树立了行业先例,这些信息其他公司都没有分享。例如,IBM是唯一一家为外部研究人员提供足够详细信息以复制其训练数据,并允许审计员等外部实体访问这些数据的公司。

另一方面,xAI和Midjourney的14/100分数是该指数历史上最低的分数之一。它们没有分享任何关于构建模型所用数据、模型相关风险或缓解这些风险所采取步骤的信息。总体而言,我们评估的13家公司几乎没有分享关于构建和部署基础模型对环境或社会影响的信息。

这些模式表明,当前的透明度实践主要取决于各个公司选择优先考虑透明度的程度,而非行业范围内对透明度的激励(或抑制)机制。

自2023年开始跟踪透明度的基础模型透明度指数在2025年整体下降,顶级公司排名发生重大变化。

这项工作揭示了企业透明度的变化状态。由于AI生态系统本身在过去三年中发生了重大变化,2025年指数是首次更新2023年版本中引入的原始指标的版本。考虑到标准的这一变化,分数已从2024年的平均58/100下降到2025年的40/100。各个公司的透明度都显著下降:Meta的得分从60分降至31分,Mistral从55分降至18分。2025年版还首次纳入了四家公司(阿里巴巴、DeepSeek、Midjourney、xAI),包括首次纳入中国主要公司。这些公司的得分都在指数的后半部分。

伴随透明度普遍下降,公司排名也发生了变化。在我们每年评分的六家公司中,Meta和OpenAI在2023年分别排名第一和第二,但现在分别排名倒数第一和倒数第二。相比之下,AI21 Labs从2023年的倒数第二上升到2025年的第一。这些得分变化反映了透明度实践的重大变化。Meta没有为其Llama 4旗舰模型发布技术报告。谷歌在发布Gemini 2.5的模型卡和技术报告方面严重延误,引起了英国立法者对其公开承诺发布这些文件的审查。

基础模型透明度指数在15个主要领域对公司进行评分,包括数据获取、模型访问和部署后监控。

基础模型透明度指数澄清了当前信息生态系统的复杂地形。整个行业在四个关键主题上系统性不透明:训练数据、训练计算、模型使用方式以及对社会的影响。这些领域中的每一个都将基础模型开发者与更广泛的AI供应链联系起来。考虑到这些领域中的许多在过去三年中一直不透明,今年的指数突出表明这些领域亟需政策干预。

公司对构建基础模型的环境影响高度不透明。10家公司没有披露与环境影响相关的任何关键信息:AI21 Labs、阿里巴巴、亚马逊、Anthropic、DeepSeek、谷歌、Midjourney、Mistral、OpenAI和xAI。这包括没有关于能源使用、碳排放或用水量的信息。公司隐瞒这些信息尤其重要,因为对数据中心的大规模投资已经使能源网络紧张,导致美国和其他地方的能源价格上涨。

开放性并不保证透明度;像DeepSeek和Meta这样的主要开放开发者相当不透明。

开放性和透明度是相互关联的概念,经常被同义使用。为了区分这些术语,我们说如果模型权重公开可用,则模型是开放的;如果公司向公众披露有关其实践的重要信息,则公司是透明的。模型权重的开放发布并不保证在训练计算、风险评估和下游使用等许多主题上的透明度。从经验上看,开放开发者往往比其封闭对手更透明。

但这种总体效应容易被误解。虽然IBM和AI21 Labs两个开放模型开发者非常透明,但三个最具影响力的开放开发者——DeepSeek、Meta和阿里巴巴——相当不透明。在假设开发者选择发布开放模型权重将带来关于公司实践或社会影响的更广泛透明度时应当谨慎。

分享AI公司内部封存的信息是确保公司治理、缓解AI危害以及促进对这一前沿技术强有力监督的基本公共产品。对更大透明度的总体需求是许多司法管辖区AI政策的首要任务。加利福尼亚州和欧盟已通过法律,要求就前沿AI的风险进行透明披露。前白宫AI顾问、美国AI行动计划主要作者Dean Ball提出透明度措施作为AI监管的常识性组成部分。基础模型透明度指数可以为政策制定者提供指导,既确定AI行业的当前信息状态,也识别在没有政策的情况下哪些领域更难以随时间改善。

了解更多关于2025年基础模型透明度指数的信息,探索每家公司的透明度报告,或阅读描述方法、分析和发现的报告。

Q&A

Q1:基础模型透明度指数是什么?如何评分?

A:基础模型透明度指数是一份年度报告,全面评估主要AI公司在其旗舰模型方面的透明度。每家公司都按100分制进行评分,涵盖训练数据、风险缓解和经济影响等主题。2025年版对13家公司进行评估,平均得分仅为40分。

Q2:哪些公司在透明度方面表现最好和最差?

A:IBM以95/100的分数创下历史最高分,是唯一提供足够详细信息供外部研究人员复制训练数据的公司。而xAI和Midjourney的14/100分数是历史最低分之一,它们没有分享任何关于数据使用、模型风险或风险缓解措施的信息。

Q3:AI公司在哪些方面最不透明?

A:整个AI行业在四个关键主题上系统性不透明:训练数据、训练计算、模型使用方式以及对社会的影响。特别是环境影响方面,有10家公司完全没有披露能源使用、碳排放或用水量等关键环境信息。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
学医后才知道,高血压最危险的信号,不是头晕眼花,而是这5症状

学医后才知道,高血压最危险的信号,不是头晕眼花,而是这5症状

健康科普365
2026-01-25 12:55:09
不吹不黑,韩国羽绒服“四大天王”,确实比波司登、大鹅性价比高

不吹不黑,韩国羽绒服“四大天王”,确实比波司登、大鹅性价比高

冒泡泡的鱼儿
2026-01-26 09:02:15
以防你没有见过出生2天的长颈鹿

以防你没有见过出生2天的长颈鹿

今日日本
2026-01-24 08:32:11
Lululemon新款瑜伽裤因易走光下架后重新上架,中国电商渠道暂未销售,创始人发声:公司已经完全迷失方向

Lululemon新款瑜伽裤因易走光下架后重新上架,中国电商渠道暂未销售,创始人发声:公司已经完全迷失方向

鲁中晨报
2026-01-24 21:59:13
拿600万顶薪,7战一共得9分!CBA头号“混子”,惨不忍睹

拿600万顶薪,7战一共得9分!CBA头号“混子”,惨不忍睹

弄月公子
2026-01-26 08:53:27
房东慌了!身份被实锤,真实目的被扒,嫣然医院新址确定后着急了

房东慌了!身份被实锤,真实目的被扒,嫣然医院新址确定后着急了

有范又有料
2026-01-24 16:26:39
美或一周内到10天开始动伊:美空军开始在中东演习,过程中或开始

美或一周内到10天开始动伊:美空军开始在中东演习,过程中或开始

邵旭峰域
2026-01-26 11:58:04
泰国政坛风云巨变!多地政治家族集体“倒戈”,选战格局大洗牌!

泰国政坛风云巨变!多地政治家族集体“倒戈”,选战格局大洗牌!

说宇宙
2026-01-26 10:54:34
下赛季加盟广东队?法耶可能被杜锋看中,这可是五号位的理想人选

下赛季加盟广东队?法耶可能被杜锋看中,这可是五号位的理想人选

绯雨儿
2026-01-26 14:30:24
10球10助!巴萨愿续约核心至2031:年薪大涨50% 下周完成

10球10助!巴萨愿续约核心至2031:年薪大涨50% 下周完成

叶青足球世界
2026-01-25 16:27:10
中国轰6J“安上天眼”,从此打得更远了,美航母再进台海试试?

中国轰6J“安上天眼”,从此打得更远了,美航母再进台海试试?

栗子评述
2026-01-26 15:10:20
一个军走出三位大区司令,连警卫员都干到正国级,老军长见面却只喊他小王

一个军走出三位大区司令,连警卫员都干到正国级,老军长见面却只喊他小王

老杉说历史
2025-12-11 19:56:06
澎湃:欧洲球队对李昊最多报50万欧,薪水也只有国内五分之一

澎湃:欧洲球队对李昊最多报50万欧,薪水也只有国内五分之一

懂球帝
2026-01-25 10:51:06
澳网卫冕冠军遭淘汰出局,还得吃闺蜜指定的“黑暗料理”

澳网卫冕冠军遭淘汰出局,还得吃闺蜜指定的“黑暗料理”

极目新闻
2026-01-26 11:38:12
被问是否担心女儿婚事,邓小平直言:有那样的爹,儿子也差不了

被问是否担心女儿婚事,邓小平直言:有那样的爹,儿子也差不了

大运河时空
2026-01-25 13:35:03
大冷!广厦无缘30分逆转遭山东终结7连胜 布朗38分末节21分

大冷!广厦无缘30分逆转遭山东终结7连胜 布朗38分末节21分

醉卧浮生
2026-01-25 21:34:49
库里轰26+7+4仍无缘今日最佳!对不起,你碰到创纪录的小卡了

库里轰26+7+4仍无缘今日最佳!对不起,你碰到创纪录的小卡了

世界体育圈
2026-01-26 14:13:45
满载40吨黄金的日本“阿波丸”,中国打捞上岸后,所有人都愣住了

满载40吨黄金的日本“阿波丸”,中国打捞上岸后,所有人都愣住了

鉴史录
2026-01-23 10:46:34
豪门悲喜夜 阿森纳2-3曼联遭主场首败 巴萨3-0重返榜首 切尔西3-1

豪门悲喜夜 阿森纳2-3曼联遭主场首败 巴萨3-0重返榜首 切尔西3-1

狍子歪解体坛
2026-01-26 02:35:11
原子弹炸后百年内寸草不生,今广岛却住满了人,看看专家怎么说?

原子弹炸后百年内寸草不生,今广岛却住满了人,看看专家怎么说?

浩渺青史
2026-01-23 05:38:56
2026-01-26 15:47:00
至顶AI实验室 incentive-icons
至顶AI实验室
一个专注于探索生成式AI前沿技术及其应用的实验室。
1332文章数 157关注度
往期回顾 全部

科技要闻

印奇再上牌桌,阶跃融资50亿

头条要闻

高市早苗:若执政党阵营在选举中未过半数 将即刻辞职

头条要闻

高市早苗:若执政党阵营在选举中未过半数 将即刻辞职

体育要闻

叛逆的大公子,要砸了贝克汉姆这块招牌

娱乐要闻

张雨绮被实名举报代孕、插足婚姻

财经要闻

从美式斩杀线看中国社会的制度韧性构建

汽车要闻

宾利第四台Batur敞篷版发布 解锁四项定制创新

态度原创

时尚
艺术
亲子
本地
军事航空

伊姐周日热推:电视剧《太平年》;电视剧《暗恋者的救赎》......

艺术要闻

溥心畬的花鸟,淡雅清新

亲子要闻

你们听,287天,9个多月的昂萨梅朵是开口喊爸爸妈妈吗?

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

军事要闻

委代总统称遭美威胁:马杜罗已死

无障碍浏览 进入关怀版