网易首页 > 网易号 > 正文 申请入驻

Anthropic掌门人炮轰中国AI模型针对测试进行优化,实际能力有限

0
分享至



2026年2月25日,Anthropic首席执行官达里奥·阿莫迪在知名播客主持人尼基尔·卡马斯的节目上抛出了一颗重磅炸弹。

他直言,大量来自中国的人工智能模型在基准测试上存在刷分行为,其能力更多源于对美国大型实验室的"提炼",而非真正意义上的自主研发。

这或许是迄今为止,美国AI头部实验室现任CEO对中国同行最为公开、最为尖锐的一次指控。

阿莫迪的核心论据是一个颇为具体的例子。他表示,某些中国模型在公开软件工程基准测试中表现亮眼,但一旦换成未公开发布的私有测试集,分数便出现明显下滑,这一落差恰恰暴露了"针对题目刷分"与"真实解题能力"之间的本质区别。他总结道,"这些模型针对基准测试的优化,远大于针对实际应用的优化"。

值得一提的是,阿莫迪同时给出了自己的经济学判断:在人工智能这个行业里,质量的优先级远高于价格。他以雇佣员工打比方,认为能力的分布遵循幂律规律,最顶尖的人才与排名一万开外的人才之间存在不可忽视的差距,AI模型亦然。

这套逻辑当然不是随机说出来的。DeepSeek早些时候以极低的训练成本宣称达到了前沿性能,直接冲击了Anthropic和OpenAI赖以维系高价定价体系的核心叙事,阿莫迪此时的表态,显然有一定的防御性商业考量在里面。

Anthropic对华的一贯敌视强硬姿态

理解这次发言,有一个不可忽略的背景,那就是Anthropic长期以来对中国AI持有系统性的强硬立场。

早在2025年初,阿莫迪便公开撰文,将对华芯片出口管制称为"决定AI未来走向最重要的政策变量",并游说美国政府进一步收紧管制。他甚至在达沃斯公开批评英伟达向中国出售H200芯片的决定,称此举"简直疯了",引发业界广泛关注,也与英伟达CEO黄仁勋产生了罕见的公开分歧。

更早之前,Anthropic在2025年正式指控中国三家AI公司:DeepSeek、Moonshot AI和Minimax,称这三家机构通过约24000个虚假账号对Claude系统实施"提炼攻击",涉嫌非法窃取模型能力。这一指控措辞严厉,直接将商业竞争上升到了知识产权侵犯的法律层面。

然而,这一系列指控也受到了来自多方的质疑。批评者指出,Anthropic本身也曾在2025年就未经授权使用700万册版权书籍进行模型训练一事达成了15亿美元的和解,这一前科使其在道德高地上的站位颇显尴尬。

此次播客上的言论,不过是这条强硬路线的最新延伸。

指控是否成立,谁来验证

如果剥去商业博弈的外壳,阿莫迪提出的问题本身是有一定合理性的。

基准测试数据污染,是整个AI行业面临的普遍困境。随着公开测试集被大规模引用,相关数据不可避免地渗透进各类训练集,这一问题并非中国实验室独有,美国实验室同样深陷其中。阿莫迪刻意将矛头单独指向中国模型,本身就是一种选择性叙述,值得审慎对待。

在实际部署层面,数据也并不完全支持他的判断。在OpenRouter等开发者平台上,中国开源模型的调用量持续攀升,这意味着不少开发者在实际生产环境中选择了这些模型,而非停留在"测试阶段"。

当然,这也不能简单地推翻阿莫迪的论断。基准测试优化与真实能力之间的张力,确实是当前AI评估体系的核心矛盾之一,行业确实需要更透明、更系统的第三方验证机制来厘清这一边界。

从更宏观的视角看,这场争论折射出的是中美AI竞争进入深水区之后,竞争者们在商业利益、技术叙事与地缘政治之间愈发复杂的纠缠关系。阿莫迪对中国AI的持续施压,究竟有多少是出于对真实技术差距的判断,又有多少是服务于Anthropic自身商业生态的防御性策略?这个问题,或许比基准测试本身更难给出一个清晰的答案。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
连爆大冷世界第4与第5赵心童2-4憾负,8强对阵及赛程出炉中国德比

连爆大冷世界第4与第5赵心童2-4憾负,8强对阵及赛程出炉中国德比

求球不落谛
2026-02-27 06:32:28
中领馆提醒: 18-65岁在俄长期居留男性 须同意在俄军事单位等至少服役1年

中领馆提醒: 18-65岁在俄长期居留男性 须同意在俄军事单位等至少服役1年

闪电新闻
2026-02-26 12:46:48
李岩益已任浙江省委常委、宣传部部长

李岩益已任浙江省委常委、宣传部部长

极目新闻
2026-02-27 09:04:10
2026年,各国领导人都多少岁了,马克龙48,普京73,特朗普近80

2026年,各国领导人都多少岁了,马克龙48,普京73,特朗普近80

小陆搞笑日常
2026-02-26 18:24:58
北京卖豆汁大爷爆火,小伙质疑里面掺粪,现场直接举报,当场带走

北京卖豆汁大爷爆火,小伙质疑里面掺粪,现场直接举报,当场带走

离离言几许
2026-02-26 16:20:55
BBA集体 “大跳水”!奥迪跌破10万,宝马降27万...网友:感谢新能源!

BBA集体 “大跳水”!奥迪跌破10万,宝马降27万...网友:感谢新能源!

极果酷玩
2026-02-26 16:49:51
美军航母“炸”了,史诗级灾难,把脸都丢光了

美军航母“炸”了,史诗级灾难,把脸都丢光了

毛豆论道
2026-02-26 19:32:00
女子捡到手机藏了4个月,失主通过Wi-Fi定位找上门,发现手机已被重置,对方还索要“保管费”!法院判了

女子捡到手机藏了4个月,失主通过Wi-Fi定位找上门,发现手机已被重置,对方还索要“保管费”!法院判了

都市快报橙柿互动
2026-02-27 00:35:31
河南项城15岁女孩离家失联16天被找到,已不幸遇难,其母亲称孩子平时成绩优秀,性格开朗

河南项城15岁女孩离家失联16天被找到,已不幸遇难,其母亲称孩子平时成绩优秀,性格开朗

极目新闻
2026-02-26 18:32:28
高市早苗有麻烦了

高市早苗有麻烦了

第一财经资讯
2026-02-26 21:47:44
对比《供应商行为准则》:苹果165页涵盖方方面面,华为仅7页全是官话

对比《供应商行为准则》:苹果165页涵盖方方面面,华为仅7页全是官话

爆角追踪
2026-02-26 13:51:08
8打5?日本主场裁判逆天明着黑 让人想起韩日世界杯 杨毅:无法无天

8打5?日本主场裁判逆天明着黑 让人想起韩日世界杯 杨毅:无法无天

风过乡
2026-02-26 21:38:22
恐怖统治力!英超9队参加3级别欧战,全部晋级16强:6队踢欧冠

恐怖统治力!英超9队参加3级别欧战,全部晋级16强:6队踢欧冠

风过乡
2026-02-27 06:50:28
独生子女家庭一定要立遗嘱,而且遗嘱里一定要“加上这3句话”

独生子女家庭一定要立遗嘱,而且遗嘱里一定要“加上这3句话”

娱乐圈见解说
2026-02-26 19:40:20
世预赛-中国台北男篮爆冷大胜韩国 陈盈骏13+5+4林庭谦18分

世预赛-中国台北男篮爆冷大胜韩国 陈盈骏13+5+4林庭谦18分

醉卧浮生
2026-02-26 20:55:30
Shams:李凯尔与灰熊达成买断协议 将在澄清期后加盟森林狼

Shams:李凯尔与灰熊达成买断协议 将在澄清期后加盟森林狼

北青网-北京青年报
2026-02-27 09:20:10
金与正,“转正”了

金与正,“转正”了

中国新闻周刊
2026-02-26 17:01:40
东北人的宿命:离开东北

东北人的宿命:离开东北

快刀财经
2026-02-25 22:13:17
概率六千万分之一!新疆24岁产妇在武汉诞下“一兄四妹”五胞胎

概率六千万分之一!新疆24岁产妇在武汉诞下“一兄四妹”五胞胎

互联网大观
2026-02-26 19:28:11
输球又输人!随着日本男篮惨遭中国逆转,不得不承认的四大事实!

输球又输人!随着日本男篮惨遭中国逆转,不得不承认的四大事实!

田先生篮球
2026-02-26 21:51:17
2026-02-27 09:35:00
冒泡泡的鱼儿
冒泡泡的鱼儿
每天带来社会资讯
380文章数 15331关注度
往期回顾 全部

科技要闻

英伟达业绩亮眼仍跌5% 两大因素成核心隐忧

头条要闻

牛弹琴:中国的两个邻国大打出手 伤亡相当惨重

头条要闻

牛弹琴:中国的两个邻国大打出手 伤亡相当惨重

体育要闻

从排球少女到冰壶女神,她在米兰冬奥练出6块腹肌

娱乐要闻

向华强公开表态 财产留给儿媳妇郭碧婷

财经要闻

魅族手机,终成弃子?

汽车要闻

40岁的吉利,不惑于内外

态度原创

家居
旅游
艺术
时尚
手机

家居要闻

归隐于都市 慢享自由

旅游要闻

建在180米高的“烟囱”上,上海唯一的高空秋千运营即将满月

艺术要闻

紫气东来,好运一整年!

今年春天最美搭配:西装+半裙,怎么穿都好看!

手机要闻

苹果iPhone和iPad首批获准处理北约机密信息

无障碍浏览 进入关怀版