网易首页 > 网易号 > 正文 申请入驻

被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了

0
分享至

henry 发自 凹非寺
量子位 | 公众号 QbitAI

离职掀桌!Mistral被曝“蒸馏”DeepSeek。

网友在推特上爆料,一位Mistral离职女员工群发邮件,直指公司多项黑幕。

其中最劲爆的就是:Mistral最新模型疑似直接蒸馏自DeepSeek,却对外包装成RL成功案例,并刻意歪曲基准测试结果。

说到Mistral,这家公司被誉为欧洲版OpenAI,是全球开源明星玩家之一,模型性能一直备受好评。

也正因为声誉突出,这次爆料才显得格外震撼。



早在今年6月,就有博主通过“语言指纹”分析,发现Mistral-small-3.2和DeepSeek-v3很像。



有意思的是——今年2月,还有网友调侃DeepSeek是“中国的Mistral”。



结果半年过去,剧情反转:Mistral不仅没跑赢DeepSeek,还被曝“借”了人家的成果。

这波啊,这波叫回旋镖自带GPS,绕半圈又精准扎回自己身上。

Mistral蒸馏DeepSeek实锤

就像我们开头提到的,推特博主Sam Peach通过分析模型输出中过度使用的词汇模式(Slop),发现了Mistral-small-3.2与DeepSeek-v3之间令人惊讶的高度相似性。

这种相似性通常很难通过独立训练偶然出现,所以很可能就是蒸馏(distillation)的结果:

  • Mistral-small-3.2“学习”了DeepSeek-v3的输出风格。

具体来说,Sam Peach是这样做的。

他先统计了模型在创意写作(creativewriting)的输出中,比人类文本更常出现的词和n-gram(词组)。

然后他把这些大数据整合起来,形成一个特征集。

最后把这些高频特征进行层次聚类(hierarchicalclustering),生成了一张“相似性图”。

通过比较相似性图中模型的远近位置,就可以发现Mistral-small-3.2和DeepSeek-v3在图中非常接近,这就表明了它们的输出模式高度相似。



最新的爆料则进一步指明,Mistral模型和DeepSeek相似不是巧合,而是可能使用了蒸馏。

由于爆料人Susan Zhang的推特设置可见范围,更多爆料信息暂时无从得知。

但这里需要说明,蒸馏并不是一件违规的事,现在很多模型都是通过这一方法快速提升能力。



Mistral的问题在于,可能隐藏了这部分事实。

离职员工说,Mistral这样做是在假装自家模型的强化学习有效,这不仅歪曲了基准测试结果,而且误导公众。

不少人也认同这一观点:蒸馏模型必须标注,保持透明性才是关键。



此外还有网友表示,蒸馏实际上为模型开发开辟了一条捷径,好让大家不用再重复造轮子。



官方暂无回应

这事儿颇具争议,除了事件本身,主要还在于Mistral在开源AI圈的地位不低。

它成立于2023年,base法国巴黎,一直被称为欧洲版OpenAI。由前Google DeepMind的Arthur Mensch和前Meta的Guillaume Lample与Timothée Lacroix联合创立。

在今年8月,Mistral被曝估值达到100亿美元,且正在筹集新一轮10亿美元融资。

而在上一轮融资中(2024年6月),Mistral完成了一轮由General Catalyst领投的6亿欧元(6.45亿美元)的融资,这使其估值上升至58亿欧元(62亿美元),排名全球第四(美国湾区外排名第一)。



从公司成立以来,Mistral一直保持开源路线,今年开源的模型就包括轻量级模型Mistral Small和主打编程的Mistral Code等。

相较于主流的大语言模型,主打开源、小快灵的Mistral,在多语言处理和推理能力方面具备相当的竞争力,在大模型市场中占据着独特的地位。

同时他们也推出了自家聊天机器人LeChat,对标ChatGPT,内置深度研究模式、原生多语言推理和高级图像编辑等功能。

截至目前,Mistral官方还没有回应,就在昨天他们还发布了新模型Mistral Medium V3.1。

[1]https://x.com/sam_paech/status/1937786948380434780

[2]https://github.com/sam-paech/slop-forensics

[3]https://techcrunch.com/2025/07/18/what-is-mistral-ai-everything-to-know-about-the-openai-competitor/

[4]https://github.com/sam-paech/slop-forensics

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
依依向北风大结局:比乔正君惨,比王潇苦,他们两个才是最可悲的

依依向北风大结局:比乔正君惨,比王潇苦,他们两个才是最可悲的

阿废冷眼观察所
2025-11-03 08:19:21
莫斯科附近军用油管被炸!俄罗斯老人涉嫌“诋毁俄军”,绝不屈服

莫斯科附近军用油管被炸!俄罗斯老人涉嫌“诋毁俄军”,绝不屈服

鹰眼Defence
2025-11-02 16:03:37
5胜2负排第3,湖人有4个变化,最强组合基本确认,雷迪克也涨球了

5胜2负排第3,湖人有4个变化,最强组合基本确认,雷迪克也涨球了

体坛大辣椒
2025-11-03 13:40:19
“苏超”冠军的牌面,泰州市委书记和市长更衣室祝贺泰州夺冠

“苏超”冠军的牌面,泰州市委书记和市长更衣室祝贺泰州夺冠

懂球帝
2025-11-02 14:13:07
1968年,周总理签署命令逮捕周恩寿,7年后周恩寿出狱时说:他没错

1968年,周总理签署命令逮捕周恩寿,7年后周恩寿出狱时说:他没错

帝哥说史
2025-11-02 06:35:03
国民党主席位置坐稳,郑丽文摊牌了:两岸若不能回归,其他都免谈

国民党主席位置坐稳,郑丽文摊牌了:两岸若不能回归,其他都免谈

娱乐小可爱蛙
2025-11-03 11:32:04
王诗龄何超莲同框,16岁妹妹气场全开,赌王千金这次真被比下去了

王诗龄何超莲同框,16岁妹妹气场全开,赌王千金这次真被比下去了

柠檬有娱乐
2025-11-03 11:32:57
马斯克,最新预言!

马斯克,最新预言!

每日经济新闻
2025-11-02 14:32:04
厦门女士存了1500万,去取钱时被告知剩50元,警方的话让女子懵了

厦门女士存了1500万,去取钱时被告知剩50元,警方的话让女子懵了

牛魔王与芭蕉扇
2025-03-31 15:49:22
57万元/平方米!深圳一别墅被神秘富豪3.65亿元“捡漏”拍下,刷新全国纪录

57万元/平方米!深圳一别墅被神秘富豪3.65亿元“捡漏”拍下,刷新全国纪录

每日经济新闻
2025-11-02 09:13:03
4-6!斯诺克再爆冷门:世界冠军首轮出局,丁俊晖赵心童齐头并进

4-6!斯诺克再爆冷门:世界冠军首轮出局,丁俊晖赵心童齐头并进

观察鉴娱
2025-11-03 09:56:41
太离谱了!美国情报表示霹雳-15射程远是因为华为窃取AI技术

太离谱了!美国情报表示霹雳-15射程远是因为华为窃取AI技术

朔方瞭望
2025-11-03 11:30:53
零跑破7万,蔚来破4万,鸿蒙智行创新高!10月销量谁最猛?

零跑破7万,蔚来破4万,鸿蒙智行创新高!10月销量谁最猛?

电动星球News
2025-11-01 22:44:52
全红婵伤愈首秀夺冠后,不到24小时,评论区却各种吐槽:吃太胖了

全红婵伤愈首秀夺冠后,不到24小时,评论区却各种吐槽:吃太胖了

古木之草记
2025-11-03 12:09:31
太涩了?日本真人影游被Steam下架!只能另寻出路

太涩了?日本真人影游被Steam下架!只能另寻出路

游民星空
2025-11-01 15:10:11
上海专家发现:吃甜食的老人,健康指数是吃蔬菜的人的8倍不止?

上海专家发现:吃甜食的老人,健康指数是吃蔬菜的人的8倍不止?

霹雳炮
2025-10-17 21:31:29
4.25万/平!北京二手房加速俯冲?

4.25万/平!北京二手房加速俯冲?

跟着拆哥看房
2025-11-03 12:58:51
又一内鬼被抓!惊动央视,大量国家机密被泄露,作案人身份被曝光

又一内鬼被抓!惊动央视,大量国家机密被泄露,作案人身份被曝光

春秋论娱
2025-09-16 07:50:48
后续!女孩校门口吃烤肠被收走钥匙,女孩哭求归还,学校紧急回应

后续!女孩校门口吃烤肠被收走钥匙,女孩哭求归还,学校紧急回应

鋭娱之乐
2025-11-03 11:25:29
张紫妍:被迫陪睡31人近百次,遭道具虐待,29岁自杀留230页遗书

张紫妍:被迫陪睡31人近百次,遭道具虐待,29岁自杀留230页遗书

银河史记
2025-10-01 14:52:35
2025-11-03 14:28:49
量子位 incentive-icons
量子位
追踪人工智能动态
11619文章数 176322关注度
往期回顾 全部

科技要闻

余承东内部信:鸿蒙下一步要实现上亿覆盖

头条要闻

媒体:高市早苗发表涉台错误言行 中方直接"亮剑"

头条要闻

媒体:高市早苗发表涉台错误言行 中方直接"亮剑"

体育要闻

开拓者官宣召回杨瀚森 队记解析核心原因

娱乐要闻

录音彻底揭露知名导演王家卫的体面

财经要闻

马斯克:未来5-6年传统手机与App将消失

汽车要闻

超跑同款磁流变减振 深蓝L06包你开得爽

态度原创

本地
数码
教育
家居
军事航空

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

数码要闻

梦幻跨界产品:微波炉改造成PC整机!门作为显示屏、主板置于转盘

教育要闻

火花思维荣获艾瑞咨询权威确认,领跑数理思维真人小班直播课赛道

家居要闻

岁月柔情 现代品质轻奢

军事要闻

美总统威胁对尼日利亚动武 尼方回应

无障碍浏览 进入关怀版