网易首页 > 网易号 > 正文 申请入驻

被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了

0
分享至

henry 发自 凹非寺
量子位 | 公众号 QbitAI

离职掀桌!Mistral被曝“蒸馏”DeepSeek。

网友在推特上爆料,一位Mistral离职女员工群发邮件,直指公司多项黑幕。

其中最劲爆的就是:Mistral最新模型疑似直接蒸馏自DeepSeek,却对外包装成RL成功案例,并刻意歪曲基准测试结果。

说到Mistral,这家公司被誉为欧洲版OpenAI,是全球开源明星玩家之一,模型性能一直备受好评。

也正因为声誉突出,这次爆料才显得格外震撼。

早在今年6月,就有博主通过“语言指纹”分析,发现Mistral-small-3.2和DeepSeek-v3很像。

有意思的是——今年2月,还有网友调侃DeepSeek是“中国的Mistral”。

结果半年过去,剧情反转:Mistral不仅没跑赢DeepSeek,还被曝“借”了人家的成果。

这波啊,这波叫回旋镖自带GPS,绕半圈又精准扎回自己身上。

Mistral蒸馏DeepSeek实锤

就像我们开头提到的,推特博主Sam Peach通过分析模型输出中过度使用的词汇模式(Slop),发现了Mistral-small-3.2与DeepSeek-v3之间令人惊讶的高度相似性。

这种相似性通常很难通过独立训练偶然出现,所以很可能就是蒸馏(distillation)的结果:

  • Mistral-small-3.2“学习”了DeepSeek-v3的输出风格。

具体来说,Sam Peach是这样做的。

他先统计了模型在创意写作(creativewriting)的输出中,比人类文本更常出现的词和n-gram(词组)。

然后他把这些大数据整合起来,形成一个特征集。

最后把这些高频特征进行层次聚类(hierarchicalclustering),生成了一张“相似性图”。

通过比较相似性图中模型的远近位置,就可以发现Mistral-small-3.2和DeepSeek-v3在图中非常接近,这就表明了它们的输出模式高度相似。

最新的爆料则进一步指明,Mistral模型和DeepSeek相似不是巧合,而是可能使用了蒸馏。

由于爆料人Susan Zhang的推特设置可见范围,更多爆料信息暂时无从得知。

但这里需要说明,蒸馏并不是一件违规的事,现在很多模型都是通过这一方法快速提升能力。

Mistral的问题在于,可能隐藏了这部分事实。

离职员工说,Mistral这样做是在假装自家模型的强化学习有效,这不仅歪曲了基准测试结果,而且误导公众。

不少人也认同这一观点:蒸馏模型必须标注,保持透明性才是关键。

此外还有网友表示,蒸馏实际上为模型开发开辟了一条捷径,好让大家不用再重复造轮子。

官方暂无回应

这事儿颇具争议,除了事件本身,主要还在于Mistral在开源AI圈的地位不低。

它成立于2023年,base法国巴黎,一直被称为欧洲版OpenAI。由前Google DeepMind的Arthur Mensch和前Meta的Guillaume Lample与Timothée Lacroix联合创立。

在今年8月,Mistral被曝估值达到100亿美元,且正在筹集新一轮10亿美元融资。

而在上一轮融资中(2024年6月),Mistral完成了一轮由General Catalyst领投的6亿欧元(6.45亿美元)的融资,这使其估值上升至58亿欧元(62亿美元),排名全球第四(美国湾区外排名第一)。

从公司成立以来,Mistral一直保持开源路线,今年开源的模型就包括轻量级模型Mistral Small和主打编程的Mistral Code等。

相较于主流的大语言模型,主打开源、小快灵的Mistral,在多语言处理和推理能力方面具备相当的竞争力,在大模型市场中占据着独特的地位。

同时他们也推出了自家聊天机器人LeChat,对标ChatGPT,内置深度研究模式、原生多语言推理和高级图像编辑等功能。

截至目前,Mistral官方还没有回应,就在昨天他们还发布了新模型Mistral Medium V3.1。

[1]https://x.com/sam_paech/status/1937786948380434780

[2]https://github.com/sam-paech/slop-forensics

[3]https://techcrunch.com/2025/07/18/what-is-mistral-ai-everything-to-know-about-the-openai-competitor/

[4]https://github.com/sam-paech/slop-forensics

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
放弃幻想,若中日开战,世界各国的立场如何

放弃幻想,若中日开战,世界各国的立场如何

孝沛与世界
2026-04-20 01:24:36
打蛇打七寸!中国全面断供开始,日本多行业停摆,高市真慌了

打蛇打七寸!中国全面断供开始,日本多行业停摆,高市真慌了

来科点谱
2026-04-19 07:17:32
被苹果、华为干倒的诺基亚,又杀回来了!

被苹果、华为干倒的诺基亚,又杀回来了!

大佬灼见
2026-04-19 10:28:53
斯诺克名宿:丁俊晖现在比赵心童更强大,听说他在没日没夜的练球

斯诺克名宿:丁俊晖现在比赵心童更强大,听说他在没日没夜的练球

杨华评论
2026-04-20 10:29:47
特朗普第一任期的白宫律师突然爆猛料:特朗普已经撑不下去了

特朗普第一任期的白宫律师突然爆猛料:特朗普已经撑不下去了

西楼知趣杂谈
2026-04-19 21:25:23
中国航司大面积取消日本航班,武汉已无直飞日本航班

中国航司大面积取消日本航班,武汉已无直飞日本航班

极目新闻
2026-04-19 19:55:25
他一生纵情酒色,47岁遗憾离世,却留下70多部价值连城的经典作品

他一生纵情酒色,47岁遗憾离世,却留下70多部价值连城的经典作品

云霄纪史观
2026-04-19 15:49:37
国际油价飙涨7%,黄金白银、美股期指全线下挫,加密货币16万人爆仓,美军向伊朗商船开火

国际油价飙涨7%,黄金白银、美股期指全线下挫,加密货币16万人爆仓,美军向伊朗商船开火

21世纪经济报道
2026-04-20 06:46:08
与孔令辉分手12年,被黑人托在肩上的马苏,终是为自己的风流买单

与孔令辉分手12年,被黑人托在肩上的马苏,终是为自己的风流买单

情感大头说说
2026-04-18 21:06:00
越领导坐了12个小时高铁回国,直言落后太多,这是最狠的一次拒绝

越领导坐了12个小时高铁回国,直言落后太多,这是最狠的一次拒绝

田园小归
2026-04-19 08:40:30
不愧是广西第一美人,确实美若天仙

不愧是广西第一美人,确实美若天仙

陈意小可爱
2026-04-20 07:53:22
这个90后女演员凭什么击败章子怡、马丽,夺得金像影后桂冠

这个90后女演员凭什么击败章子怡、马丽,夺得金像影后桂冠

新民周刊
2026-04-20 11:37:22
这张照片绝对是李宇春最想删掉的照片!

这张照片绝对是李宇春最想删掉的照片!

可乐谈情感
2026-04-20 03:34:03
28年前失踪的女老板终于被找到:被谋杀后埋尸天台花坛28年,嫌疑人改名、变年龄、整容,还主动发短信催警察“还我清白”

28年前失踪的女老板终于被找到:被谋杀后埋尸天台花坛28年,嫌疑人改名、变年龄、整容,还主动发短信催警察“还我清白”

大风新闻
2026-04-20 09:25:10
世锦赛战报:16强决出5席!中国2胜2负1领先,世界亚军4-10一轮游

世锦赛战报:16强决出5席!中国2胜2负1领先,世界亚军4-10一轮游

球场没跑道
2026-04-20 05:38:54
卖了80多座万达广场,还欠6000亿!万达的债为啥永远还不完?

卖了80多座万达广场,还欠6000亿!万达的债为啥永远还不完?

科学发掘
2026-04-17 00:52:53
19日凌晨,大批导弹密集射向日本海,高市早苗这下尝到后果了!

19日凌晨,大批导弹密集射向日本海,高市早苗这下尝到后果了!

荆楚寰宇文枢
2026-04-19 23:37:05
确定!英超争冠不会有附加赛,如果同分,曼城比阿森纳多一个优势

确定!英超争冠不会有附加赛,如果同分,曼城比阿森纳多一个优势

嗨皮看球
2026-04-20 11:23:17
《最强大脑》水哥现状:46岁不上班,住热带雨林,靠脑子年入千万

《最强大脑》水哥现状:46岁不上班,住热带雨林,靠脑子年入千万

子芫伴你成长
2026-04-19 23:08:37
1999年,69岁禹作敏狱中难耐孤寂,死前曾向李瑞环提出:我想回家

1999年,69岁禹作敏狱中难耐孤寂,死前曾向李瑞环提出:我想回家

华人星光
2026-04-20 09:59:15
2026-04-20 13:59:01
量子位 incentive-icons
量子位
追踪人工智能动态
12498文章数 176456关注度
往期回顾 全部

科技要闻

蓝色起源一级火箭完美回收 客户卫星未入轨

头条要闻

媒体:伊朗刚说不谈 美国立即开打

头条要闻

媒体:伊朗刚说不谈 美国立即开打

体育要闻

七大奖项候选官宣!文班或全票DPOY

娱乐要闻

鹿晗生日上热搜,被关晓彤撕下体面

财经要闻

月之暗面IPO迷局

汽车要闻

把天门山搬进厂?开仰望U8冲上45度坡的那刻 我腿软了

态度原创

家居
艺术
数码
游戏
教育

家居要闻

自然慢调 慢享时光

艺术要闻

王羲之《换鹅帖》尚在人间,惊艳无比!

数码要闻

EPOMAKER推出全配列磁轴键盘HE108,10000mAh电池续航500hr

颁奖台上动手 《反恐精英》选手袭击对手被禁赛10年

教育要闻

都说惯子如杀子,这3种隐形溺爱,希望你一件都没做过……

无障碍浏览 进入关怀版