网易首页 > 网易号 > 正文 申请入驻

对标中国模型失利,欧洲AI旗舰遭痛批,小模型藏翻盘希望

0
分享至

哈喽大家好,今天老张带大家聊聊最近AI圈的瓜有点意思,欧洲那匹叫Mistral AI的独角兽,憋了大半年终于放大招——推出新一代Mistral 3系列模型。本以为是欧洲AI扬眉吐气的时刻,结果呢?一盆冷水直接浇了下来。





定位刁钻

先说说这家公司的家底,总部在法国,拿过英伟达三轮投资,现在估值直奔135亿美元,妥妥是欧洲AI圈的牌面。

按常理,新模型该去跟OpenAI的GPT-5.1、谷歌的Gemini 3掰掰手腕,结果它偏不——枪口直接对准了咱们中国的DeepSeek-V3.1和Kimi-K2。



你说这波操作迷不迷?后来琢磨琢磨也懂了,现在AI开源赛道早不是美国一家独大,咱们的DeepSeek、Qwen靠着性价比和更新速度,圈了一大波全球开发者粉。

Mistral这是想“避强击弱”,主打一个“我参数量才Kimi的一半,性能却能跟你打平”,以此证明欧洲AI的实力。可这算盘打得再响,也得有硬实力撑着,不然就是搬起石头砸自己的脚





冰火两重天

最先掉链子的就是系列里的“大哥”——旗舰模型Mistral Large 3。你猜参数多夸张?总参数量飙到675B,活跃参数也有41B,还是Mistral自2023年底以来首款开放权重的混合专家模型,本应是全场焦点。



可跑分一出来就露怯了:MMMLU考了85.5分,AMC拿了52.0分,比DeepSeek-V3.1略强一点;但到了程序员最看重的LiveCodeBench和SimpleQA测试,直接被Kimi-K2按在地上打,输赢各半的成绩,实在说不上亮眼。



更要命的是实际用起来的糟心体验:工具调用总出岔子,要么格式错得离谱,要么吐一堆无效指令,图像测试也平平无奇。

有科技博主直接在社交平台开喷,列了它三大罪状——智能不如DeepSeek,价格却是人家3倍,推理速度比GPT-5还慢,末了甩下一句“Mistral这是在缓慢死亡”。



这话真不是空口黑,数据摆在那儿:Artificial Analysis最新的AI指数榜里,它才得38分,跟第一梯队Gemini 3 Pro(73分)、Claude Opus 4.5(70分)、GPT-5.1(70分)差了快一倍,说是“断层差距”都不夸张。



就算在LMArena榜单排到开源非推理模型第二、总榜第六,也远没到能“屠榜”的程度。

不过,这出戏也不是全是糟心事儿,谁能想到,救场的居然是系列里的小模型Ministral 3。三款分别是3B、8B、14B参数的模型,硬是把“性价比”三个字玩明白了。





处境尴尬

不管参数大小,基础版、指令版、推理版全都给配齐,还自带图像理解能力,再也不是“AI睁眼瞎”。

最关键的是,它们全基于Apache 2.0许可证开源——这意味着企业和开发者能免费商用,还能随便改,14B推理版在AIME’25测试里准确率飙到85%,说它是当前开源模型里的性价比之王,真不算吹。



Mistral这波明显是把劲儿使错了地方,把资源全堆给旗舰模型做“噱头”,反倒忽略了用户最需要的实用体验。

客观讲,Mistral 3系列确实有进步,至少证明欧洲还有能跟上中国开源模型脚步的企业,但问题也摆得明明白白:它至今没推出推理器,实际性能本就落后主流;现在DeepSeek又把价格压得极低,AI用户要么要极致智能,要么要极致便宜,卡在中间的Mistral,可不就尴尬了?



想真当上“欧洲之光”,它得赶紧做选择题:要么把旗舰模型的技术短板补上,要么深耕小模型赛道把优势焊死。

总在中间晃悠,迟早被市场淘汰。至于最后能不能翻盘,就得看它下一轮迭代能不能拿出真东西了。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗发射近1200枚导弹报复美国和以色列

伊朗发射近1200枚导弹报复美国和以色列

中国网
2026-03-01 16:43:10
3月1日起全国执行!这些费用全取消,家家都能省!

3月1日起全国执行!这些费用全取消,家家都能省!

达文西看世界
2026-03-02 15:40:41
前总统生死不明 伊朗人的“脊梁”会被打断吗?

前总统生死不明 伊朗人的“脊梁”会被打断吗?

看看新闻Knews
2026-03-02 23:07:07
伊朗外长这番话,可能暗示一个大问题

伊朗外长这番话,可能暗示一个大问题

观察者网
2026-03-02 19:11:48
祖国遭受战乱,伊朗女足在奏国歌时集体保持缄默

祖国遭受战乱,伊朗女足在奏国歌时集体保持缄默

懂球帝
2026-03-03 10:15:09
1胜9负,夺冠热门慢慢倒下!作为联盟第一人,或许你被高估了

1胜9负,夺冠热门慢慢倒下!作为联盟第一人,或许你被高估了

老梁体育漫谈
2026-03-02 23:30:56
以色列全境发布防空警报

以色列全境发布防空警报

环球网资讯
2026-03-03 07:04:52
新华时评:当炸弹落在校园,文明底线何在

新华时评:当炸弹落在校园,文明底线何在

澎湃新闻
2026-03-01 22:32:48
美媒爆:美国正为未来24小时内“大幅增加”对伊朗袭击做准备

美媒爆:美国正为未来24小时内“大幅增加”对伊朗袭击做准备

环球网资讯
2026-03-03 09:45:10
特朗普称不排除对伊派地面部队

特朗普称不排除对伊派地面部队

财联社
2026-03-03 08:59:08
越南女子远嫁广西农村,生下女儿后“跑”了,22年后女儿跨国寻亲

越南女子远嫁广西农村,生下女儿后“跑”了,22年后女儿跨国寻亲

谈史论天地
2026-03-02 19:45:03
高官确认:伊朗不会退出世界杯!有权参加 在美国踢比赛也没问题

高官确认:伊朗不会退出世界杯!有权参加 在美国踢比赛也没问题

念洲
2026-03-03 06:31:52
全国政协委员刘永好:建议全民发放500元通用消费券 可拉动消费近2万亿元

全国政协委员刘永好:建议全民发放500元通用消费券 可拉动消费近2万亿元

财联社
2026-03-02 10:57:04
36岁副镇长开会时脑出血晕倒,除夕当天不幸离世:上任仅10余天,最后一条动态为督促社火排练,留下3个孩子

36岁副镇长开会时脑出血晕倒,除夕当天不幸离世:上任仅10余天,最后一条动态为督促社火排练,留下3个孩子

极目新闻
2026-03-02 15:45:15
伊拉克武装参战!“发动28次袭击”

伊拉克武装参战!“发动28次袭击”

扬子晚报
2026-03-03 07:20:25
午评:沪指探底回升 “三桶油”再度全线涨停

午评:沪指探底回升 “三桶油”再度全线涨停

财联社
2026-03-03 11:37:46
“伊朗德黑兰飞乌鲁木齐航班进入中国领空 机舱内传来广播”视频热传 川航:未开通伊朗航线

“伊朗德黑兰飞乌鲁木齐航班进入中国领空 机舱内传来广播”视频热传 川航:未开通伊朗航线

闪电新闻
2026-03-02 17:29:47
伊朗人拿的清末剧本,答案在我们中学课本

伊朗人拿的清末剧本,答案在我们中学课本

鉴茶院
2026-03-03 08:03:31
特朗普称将很快宣布报复措施

特朗普称将很快宣布报复措施

界面新闻
2026-03-03 09:19:08
李雨桐发文“和解但不原谅”,晒出与薛之谦的聊天片段,

李雨桐发文“和解但不原谅”,晒出与薛之谦的聊天片段,

东方不败然多多
2026-03-03 10:09:14
2026-03-03 12:04:49
快看张同学 incentive-icons
快看张同学
晨起暮落,初心不改
4761文章数 316关注度
往期回顾 全部

科技要闻

手机AI在MWC上卷出了新高度

头条要闻

牛弹琴:多国对轰炸保持沉默 西班牙首相确实是条汉子

头条要闻

牛弹琴:多国对轰炸保持沉默 西班牙首相确实是条汉子

体育要闻

35轮后积分-7,他们遭遇史上最早的降级

娱乐要闻

谢娜霸气护夫:喊话薛之谦给张杰道歉

财经要闻

霍尔木兹海峡近乎停摆 布油直逼80美元

汽车要闻

长安汽车2月销量151922辆 环比逆势增长12.8%

态度原创

健康
数码
亲子
本地
时尚

转头就晕的耳石症,能开车上班吗?

数码要闻

小米Xiaomi Tag防丢器国内开售:仅重10克续航一年,69元起

亲子要闻

科普|带您认识儿童小肠增强CT检查

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

普通人穿衣真的很简单!单品选对、搭配合理,大方舒适又得体

无障碍浏览 进入关怀版