网易首页 > 网易号 > 正文 申请入驻

核心模型被曝蒸馏DeepSeek?前女友一纸控诉,曝出欧版OpenAI塌房真相!

0
分享至


新智元报道

编辑:Aeneas KingHZ

【新智元导读】曾被誉为「欧洲OpenAI」的Mistral AI,陷入「抄袭」丑闻!在分手小作文中,前员工爆料核心技术是蒸馏DeepSeek,却误导外界称为自主RL成果。

Mistal套壳DeepSeek,被当场抓现行了?

几天前就有人在X上爆料:Mistral的新模型是直接蒸馏自DeepSeek,而且基准测试结果还被歪曲了。

这个被视为欧洲版OpenAI「全村希望」的公司,地位就如同中国的DeepSeek一般,如今居然塌房了?

这实在是太魔幻了。


更为劲爆的是,这个重磅大瓜还是从一篇Mistral女员工的「分手小作文」里曝出来的。


原话是这样的——

你早知道Mistral做事不讲道德:把DeepSeek蒸馏后当成自己的模型,使用OpenAI的数据,对外却误导称是RL在发挥作用,但它实际上只是DS3的产物,还歪曲基准测试结果。

你不仅明知这些,还积极参与其中。当我指出这些问题时,你没有承担任何责任,反而选择无视我、对我冷处理。

情感纠纷小作文

曝出套壳大瓜

也就是说,这位Mistral离职的女员工,不仅在小作文中曝光了自己和前男友、Mistral同事的感情纠葛,还爆出Mistral套壳DeepSeek的丑闻。

这个消息一曝光,立马在全网引起了轩然大波。

DeepMind研究员Susan Zhang转发并评论,直接点名Mistral AI的不道德行为。


在「小作文」里,这位Mistral前员工痛诉自己如何接连遭遇上司排挤、伴侣出轨、求职无望,还要靠抗抑郁药物试图让情感生活重回正轨。


关键节点在2025年4月初, Mistral把她解雇了,原因在于工作分歧:

她明确反对通过蒸馏DeepSeek来误导用户。

这加剧了她对Mistral高层的不满——而她的伴侣又和高层关系密切。

在职业前途未卜、经济压力加剧、感情关系又充满不确定的三重打击下,她开始崩溃。

这让DeepMind研究科学家Andreas Kirsch非常同情。

Mistral的「秘方」竟是DeepSeek,这一事实让人无语。


火眼金睛博主

早发现Mistral蒸馏DeepSeek

其实早在今年6月,就有一位火眼金睛的AI行内人发现,Mistral Small 3.2写的东西,它怎么这么像DeepSeek呢!

这位名为Sam Paech的行内人,同时还是EQ-Bench基准的维护者,可谓十分有眼光。


为了比较Mistral-small-3.2和DeepSeek-v3之间的相似性,这位博主在模型的创意写作输出中,提取了跟人类基线相比最过度呈现的单词和n-gram词组。


通过对这些词/n-gram中的前几百个数据特征进行层次聚类,生成了一张如下的相似性图。

肉眼可见,Mistral-small-3.2和DeepSeek-v3在谱系图中的位置非常接近,从而表明它们的特征是极其相似的。


这个过程中,他使用了一个生物信息学工具,基于slop特征谱的相似性,推断出了谱系树。


Susan Zhang对此直接表示,Mistral这身皮被扒下来,原来是DeepSeek啊!


甚至还有人发现,连Gemini Pro 2.5都和DeepSeek-R1之间有非常相似的感觉。

比如DeepSeek-R1非常擅长在对话中保持角色的一致性,而Gemini Pro 2.5也是如此,简直惊人的相似。


蒸馏不是错

HuggingFace联合创始人兼首席执行官表示,蒸馏开源模型有错吗?


毕竟,开源的意义之一就是让大家「自由使用」源代码,所以DeepSeek并不会禁止蒸馏。

而且蒸馏大模型也不简单,DeepSeek蒸馏自己的R1模型就不太成功。Paech本人也表示,其实蒸馏也不算什么大错,现在很多模型都是这么干的。


技术上,蒸馏是通过让小模型模仿大模型的输出结果来实现的。

大模型会把自己的「经验」(比如语言模式、写作风格)以一种简单的方式传给小模型。小模型通过大量练习,逐渐学会了类似的表现,但用更少的计算资源。

这种方法在AI领域很流行,因为这项技术很实用,比如能让大模型跑在手机或其他低性能设备上。

蒸馏本身不是错,编造谎言才是问题的实质!


说到头来,Mistral的问题不在于蒸馏DeepSeek,而在于把模型的进步归功于自家的RL方法,甚至蓄意改变基准测试。

没有清楚标注模型是蒸馏的,缺乏透明度,才是最关键的问题。


Mistral好像不止一次这么干,博士生Regi Kusumaatmadjia就发现Mistral的OCR功能与Mineru的OCR出奇的相似。


Mistral过去的高光时刻

想当初,Mistral可是深夜发一条磁力链接,就能让整个开源圈震撼的存在。

在今年2月,才成立一年多的Mistral AI已经估值62亿美金,成为法国的骄傲,欧洲的骄傲。

欧洲的开发者们一度欢呼:恭喜Mistral AI,让欧洲在AI竞赛中终于有了一席之地。



Mistral AI的超级应用助手Le Chat,还一度登顶法国免费APP的榜首。


马克龙一直以来也积极支持Mistral,称其为:「法国人工智能产业的皇冠上瑰宝」。


2023年,这三位来自谷歌DeepMind、Meta的前员工希望打造一家遵循欧洲模式的AI公司——开源、高效、注重隐私。


随后,他们就用自己的方式,颠覆了硅谷的传统。

在当时,当OpenAI斥资超1亿美金训练GPT-4时,Mistral仅用2200万美元就打造出了最具竞争力的AI模型。


甚至马克龙还信誓旦旦表示,法国未来几年将投资1090亿欧元用于建设AI,尽最大努力为包括Mistral在内的公司创造空间。


在成立仅仅七个月的时间里,Mistral就在两个主要「权重级别」上发布了SOTA开源大语言模型(mistral-7b 和 mixtral)。

Mistral在底层架构持续取得突破(如sparse mixture-of-experts,稀疏专家混合架构)。

这对一家初创公司而言,成就非凡。

刚刚,他们还推出了Mistral Medium 3.1,表示整体性能提升巨大。


不过,这次推文底下质疑声不断。





谁都没想到,当初承载了多少人希望的Mistral,如今竟发展到了这一步。

参考资料:

https://x.com/ns123abc/status/1955044877110071480

https://x.com/gmmvg/status/1955002717698658719

https://x.com/paulopacitti/status/1955003793927524717


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
依依向北风大结局:比乔正君惨,比王潇苦,他们两个才是最可悲的

依依向北风大结局:比乔正君惨,比王潇苦,他们两个才是最可悲的

阿废冷眼观察所
2025-11-03 08:19:21
莫斯科附近军用油管被炸!俄罗斯老人涉嫌“诋毁俄军”,绝不屈服

莫斯科附近军用油管被炸!俄罗斯老人涉嫌“诋毁俄军”,绝不屈服

鹰眼Defence
2025-11-02 16:03:37
5胜2负排第3,湖人有4个变化,最强组合基本确认,雷迪克也涨球了

5胜2负排第3,湖人有4个变化,最强组合基本确认,雷迪克也涨球了

体坛大辣椒
2025-11-03 13:40:19
“苏超”冠军的牌面,泰州市委书记和市长更衣室祝贺泰州夺冠

“苏超”冠军的牌面,泰州市委书记和市长更衣室祝贺泰州夺冠

懂球帝
2025-11-02 14:13:07
1968年,周总理签署命令逮捕周恩寿,7年后周恩寿出狱时说:他没错

1968年,周总理签署命令逮捕周恩寿,7年后周恩寿出狱时说:他没错

帝哥说史
2025-11-02 06:35:03
国民党主席位置坐稳,郑丽文摊牌了:两岸若不能回归,其他都免谈

国民党主席位置坐稳,郑丽文摊牌了:两岸若不能回归,其他都免谈

娱乐小可爱蛙
2025-11-03 11:32:04
王诗龄何超莲同框,16岁妹妹气场全开,赌王千金这次真被比下去了

王诗龄何超莲同框,16岁妹妹气场全开,赌王千金这次真被比下去了

柠檬有娱乐
2025-11-03 11:32:57
马斯克,最新预言!

马斯克,最新预言!

每日经济新闻
2025-11-02 14:32:04
厦门女士存了1500万,去取钱时被告知剩50元,警方的话让女子懵了

厦门女士存了1500万,去取钱时被告知剩50元,警方的话让女子懵了

牛魔王与芭蕉扇
2025-03-31 15:49:22
57万元/平方米!深圳一别墅被神秘富豪3.65亿元“捡漏”拍下,刷新全国纪录

57万元/平方米!深圳一别墅被神秘富豪3.65亿元“捡漏”拍下,刷新全国纪录

每日经济新闻
2025-11-02 09:13:03
4-6!斯诺克再爆冷门:世界冠军首轮出局,丁俊晖赵心童齐头并进

4-6!斯诺克再爆冷门:世界冠军首轮出局,丁俊晖赵心童齐头并进

观察鉴娱
2025-11-03 09:56:41
太离谱了!美国情报表示霹雳-15射程远是因为华为窃取AI技术

太离谱了!美国情报表示霹雳-15射程远是因为华为窃取AI技术

朔方瞭望
2025-11-03 11:30:53
零跑破7万,蔚来破4万,鸿蒙智行创新高!10月销量谁最猛?

零跑破7万,蔚来破4万,鸿蒙智行创新高!10月销量谁最猛?

电动星球News
2025-11-01 22:44:52
全红婵伤愈首秀夺冠后,不到24小时,评论区却各种吐槽:吃太胖了

全红婵伤愈首秀夺冠后,不到24小时,评论区却各种吐槽:吃太胖了

古木之草记
2025-11-03 12:09:31
太涩了?日本真人影游被Steam下架!只能另寻出路

太涩了?日本真人影游被Steam下架!只能另寻出路

游民星空
2025-11-01 15:10:11
上海专家发现:吃甜食的老人,健康指数是吃蔬菜的人的8倍不止?

上海专家发现:吃甜食的老人,健康指数是吃蔬菜的人的8倍不止?

霹雳炮
2025-10-17 21:31:29
4.25万/平!北京二手房加速俯冲?

4.25万/平!北京二手房加速俯冲?

跟着拆哥看房
2025-11-03 12:58:51
又一内鬼被抓!惊动央视,大量国家机密被泄露,作案人身份被曝光

又一内鬼被抓!惊动央视,大量国家机密被泄露,作案人身份被曝光

春秋论娱
2025-09-16 07:50:48
后续!女孩校门口吃烤肠被收走钥匙,女孩哭求归还,学校紧急回应

后续!女孩校门口吃烤肠被收走钥匙,女孩哭求归还,学校紧急回应

鋭娱之乐
2025-11-03 11:25:29
张紫妍:被迫陪睡31人近百次,遭道具虐待,29岁自杀留230页遗书

张紫妍:被迫陪睡31人近百次,遭道具虐待,29岁自杀留230页遗书

银河史记
2025-10-01 14:52:35
2025-11-03 14:28:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13772文章数 66236关注度
往期回顾 全部

科技要闻

余承东内部信:鸿蒙下一步要实现上亿覆盖

头条要闻

媒体:高市早苗发表涉台错误言行 中方直接"亮剑"

头条要闻

媒体:高市早苗发表涉台错误言行 中方直接"亮剑"

体育要闻

开拓者官宣召回杨瀚森 队记解析核心原因

娱乐要闻

录音彻底揭露知名导演王家卫的体面

财经要闻

马斯克:未来5-6年传统手机与App将消失

汽车要闻

超跑同款磁流变减振 深蓝L06包你开得爽

态度原创

艺术
亲子
数码
本地
公开课

艺术要闻

90后跨国夫妻,到浙江山居:花20万租20年,值了!

亲子要闻

双喜临门!她官宣结婚怀孕

数码要闻

梦幻跨界产品:微波炉改造成PC整机!门作为显示屏、主板置于转盘

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版