网易首页 > 网易号 > 正文 申请入驻

Mistral发布新一代开放权重模型挑战科技巨头

0
分享至


法国AI初创公司Mistral于周二发布了全新的Mistral 3系列开放权重模型,旨在证明其在公开AI技术和服务企业客户方面能够超越科技巨头竞争对手。

此次发布包含10个模型,其中有一个具备多模态和多语言能力的大型前沿模型,以及九个可离线运行、完全可定制的小型模型。

Mistral开发开放权重语言模型和面向欧洲的AI聊天机器人Le Chat,此前似乎一直在追赶硅谷一些闭源前沿模型的步伐。开放权重模型会公开发布其模型权重,任何人都可以下载和运行。而闭源模型如OpenAI的ChatGPT则保持权重专有,仅通过API或受控接口提供访问。

这家成立两年的初创公司由前DeepMind和Meta研究人员创立,迄今已筹集约27亿美元资金,估值137亿美元。相比之下,竞争对手OpenAI筹集570亿美元、估值5000亿美元,Anthropic筹集450亿美元、估值3500亿美元。

但Mistral试图证明,更大并不总是更好,特别是对于企业用例。

Mistral联合创始人兼首席科学家Guillaume Lample表示:"我们的客户有时乐于从无需微调的大型闭源模型开始,但当他们部署时,会发现成本高昂且速度缓慢。然后他们会找我们微调小型模型来更高效地处理用例。"

"实际上,绝大多数企业用例都可以通过小型模型解决,特别是经过微调后。"Lample继续说道。

Lample表示,将Mistral小型模型与闭源竞争对手进行的初步基准比较可能具有误导性。大型闭源模型可能在开箱即用时表现更好,但真正的收益来自定制化。

"在许多情况下,你实际上可以匹配甚至超越闭源模型的性能。"他说。

Mistral的大型前沿模型名为Mistral Large 3,在重要能力方面追上了OpenAI的GPT-4o和Google的Gemini 2等大型闭源AI模型,同时与多个开放权重竞争对手不相上下。Large 3是首批集多模态和多语言能力于一体的开放前沿模型之一,与Meta的Llama 3和阿里巴巴的Qwen3-Omni处于同一水平。

Large 3还采用"细粒度专家混合"架构,拥有410亿活跃参数和6750亿总参数,能够在256,000上下文窗口内进行高效推理。这种设计兼顾速度和能力,可以处理长篇文档并充当复杂企业任务的智能体助手。

Mistral推出的新小型模型系列名为Ministral 3,公司大胆声称小型模型不仅足够,而且更优秀。

该系列包括九个不同的高性能密集模型,涵盖三种规模(140亿、80亿和30亿参数)和三种变体:Base(预训练基础模型)、Instruct(针对对话和助手式工作流优化的聊天模型)和Reasoning(针对复杂逻辑和分析任务优化)。

Mistral表示,这种范围为开发者和企业提供了灵活性,可以根据确切的性能需求匹配模型。公司声称Ministral 3的得分与其他开放权重领导者相当或更好,同时更高效,在执行同等任务时生成更少的Token。所有变体都支持视觉,处理128,000-256,000上下文窗口,并支持多种语言。

实用性是推广的重要部分。Lample强调Ministral 3可以在单个GPU上运行,使其能够部署在经济实惠的硬件上——从本地服务器到笔记本电脑、机器人和其他可能连接有限的边缘设备。这不仅对保持数据内部的企业很重要,对寻求离线反馈的学生或在偏远环境中操作的机器人团队也很重要。

"确保AI对每个人都可访问是我们使命的一部分,特别是那些没有互联网接入的人。我们不希望AI仅由几个大型实验室控制。"他说。

这种可访问性推动了Mistral日益增长的物理AI关注。今年早些时候,公司开始致力于将其小型模型集成到机器人、无人机和车辆中。Mistral正在与新加坡内政部科技局合作开发机器人、网络安全系统和消防安全的专用模型;与德国国防科技初创公司Helsing合作开发无人机的视觉-语言-行动模型;与汽车制造商Stellantis合作开发车载AI助手。

对Mistral而言,可靠性和独立性与性能同样重要。

"使用竞争对手每两周就会宕机半小时的API——如果你是大公司,无法承受这种情况。"Lample说。

Q&A

Q1:Mistral 3系列模型有什么特点?

A:Mistral 3系列包含10个模型,有一个具备多模态和多语言能力的大型前沿模型Mistral Large 3,以及九个可离线运行、完全可定制的小型模型Ministral 3。这些模型采用开放权重设计,任何人都可以下载和运行。

Q2:为什么Mistral认为小型模型比大型模型更好?

A:Mistral认为大型闭源模型虽然开箱即用效果好,但部署时成本高昂且速度缓慢。而小型模型经过微调后,在许多企业用例中可以匹配甚至超越闭源模型性能,同时更高效、成本更低。

Q3:Ministral 3模型可以在什么设备上运行?

A:Ministral 3可以在单个GPU上运行,能够部署在经济实惠的硬件上,包括本地服务器、笔记本电脑、机器人和其他边缘设备,特别适合连接有限或需要离线运行的环境。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日本专家:中国新材料实验室再多,也造不出一瓶能在我们实验室达标的光刻胶

日本专家:中国新材料实验室再多,也造不出一瓶能在我们实验室达标的光刻胶

芯火相承
2025-12-29 22:11:01
-7℃!雨夹雪!小雪!中雪!江西下雪时间表来了

-7℃!雨夹雪!小雪!中雪!江西下雪时间表来了

江西工人报
2025-12-29 22:27:11
你见过最清闲的事业编是啥?网友:还有一个供销社,闲出病来

你见过最清闲的事业编是啥?网友:还有一个供销社,闲出病来

带你感受人间冷暖
2025-12-16 00:20:09
美国国务院发火,要求中国大陆“必须停止”,岛内一个时代或终结

美国国务院发火,要求中国大陆“必须停止”,岛内一个时代或终结

南宫一二
2025-12-27 13:04:40
皇马球星两年来都没找到状态,他知道6月30日后需要走人

皇马球星两年来都没找到状态,他知道6月30日后需要走人

星耀国际足坛
2025-12-29 23:47:39
皇马,再见!7000万“顶星”正式获准离队!1亿后腰+顶级中卫来投

皇马,再见!7000万“顶星”正式获准离队!1亿后腰+顶级中卫来投

头狼追球
2025-12-29 13:56:56
慢慢你就知道,越是独来独往、不合群的人,人品往往越没问题

慢慢你就知道,越是独来独往、不合群的人,人品往往越没问题

诗词中国
2025-12-28 18:09:15
阿姨这身打扮有一种80年代港风电影女明星的感觉

阿姨这身打扮有一种80年代港风电影女明星的感觉

美女穿搭分享
2025-12-21 10:52:57
工地上的临时夫妻生活,是农民工在城市边缘的温情还是生存的无奈

工地上的临时夫妻生活,是农民工在城市边缘的温情还是生存的无奈

小鱼滑
2024-04-26 00:25:56
胡塞武装:以色列在索马里兰存在将成为打击目标

胡塞武装:以色列在索马里兰存在将成为打击目标

财联社
2025-12-29 16:42:06
交换位置!英超三强争两个欧冠名额,曼联比切尔西多一个优势

交换位置!英超三强争两个欧冠名额,曼联比切尔西多一个优势

嗨皮看球
2025-12-29 18:41:36
郭子仪功高震主,临终前主动交出兵权!三日后,郭家满门保全

郭子仪功高震主,临终前主动交出兵权!三日后,郭家满门保全

铭记历史呀
2025-12-30 00:29:16
突发!利物浦放弃截胡!6500 万神锋一心投瓜帅

突发!利物浦放弃截胡!6500 万神锋一心投瓜帅

奶盖熊本熊
2025-12-30 01:10:05
实锤!一种你认为健康且爱喝的无糖饮料,正在偷偷伤害你的肝脏

实锤!一种你认为健康且爱喝的无糖饮料,正在偷偷伤害你的肝脏

方舟健客科普
2025-12-12 18:35:32
特斯拉Cybertruck失败重创供应商 韩电池公司合同额暴降99%

特斯拉Cybertruck失败重创供应商 韩电池公司合同额暴降99%

凤凰网科技
2025-12-29 20:14:08
一旦开启武统,大陆和台湾谁先垮?柯文哲:大陆恐怕撑不过两周。

一旦开启武统,大陆和台湾谁先垮?柯文哲:大陆恐怕撑不过两周。

明月文史
2025-10-10 12:23:09
停牌!600058,重大资产重组!股价今日涨停

停牌!600058,重大资产重组!股价今日涨停

证券时报e公司
2025-12-29 21:32:20
法国传奇女星碧姬芭铎逝世享年91岁

法国传奇女星碧姬芭铎逝世享年91岁

环球趣闻分享
2025-12-29 13:10:07
姜昆风波再升级!拍摄者硬刚,视频不是拼接也不在美国,行程被扒

姜昆风波再升级!拍摄者硬刚,视频不是拼接也不在美国,行程被扒

阿纂看事
2025-12-27 11:02:48
花生再次被关注!调查发现:糖尿病常吃花生,不过半年或有6好处

花生再次被关注!调查发现:糖尿病常吃花生,不过半年或有6好处

蜉蝣说
2025-11-20 14:40:39
2025-12-30 03:39:00
至顶AI实验室 incentive-icons
至顶AI实验室
一个专注于探索生成式AI前沿技术及其应用的实验室。
858文章数 151关注度
往期回顾 全部

科技要闻

肉搏非洲,传音不想只当个卖手机的

头条要闻

东部战区战士:收复宝岛台湾 已做好真打实打准备

头条要闻

东部战区战士:收复宝岛台湾 已做好真打实打准备

体育要闻

“史上最贵”的世界杯,球迷成了韭菜

娱乐要闻

44岁林俊杰官宣恋情 带23岁女友见家长

财经要闻

翁杰明:宏观数据与居民微观感受存在差距

汽车要闻

“路”要越走越深,猛士的智能越野时代来了

态度原创

房产
游戏
数码
健康
家居

房产要闻

中旅・三亚蓝湾展示中心璀璨绽放,共鉴湾心孤品传奇

《侍道》?Acquire称公司希望复活旗下老IP

数码要闻

闪极和中国航母联名新品发布,149元起

这些新疗法,让化疗不再那么痛苦

家居要闻

东方雅韵 温馨恬适

无障碍浏览 进入关怀版