网易首页 > 网易号 > 正文 申请入驻

Mistral AI推出24B开源模型,能运行于32GB RAM苹果MacBook

0
分享至

同样面对 AI 大模型领域的“鲶鱼”DeepSeek,不同于美国 AI 公司 Anthropic CEO 达里奥·阿莫迪(Dario Amodei)用“万字檄文”施压白宫加强管制的敌对态度,法国明星 AI 公司 Mistral AI 则在发布自家新模型的同时在其技术博文中两次“致敬”DeepSeek。

当地时间 1 月 30 日,Mistral AI 发布一款名为 Mistral Small 3 的开源模型。与此同时,其发表了一篇技术博文针对该模型加以详细介绍。

Mistral AI 在博文中表示:“Mistral Small 3 既没有经过强化学习训练,也没有经过合成数据训练,因此比 Deepseek R1(一项伟大而互补的开源技术!)等模型更早进入模型生产流程。”

其还写道:“对于开源社区来说,这是激动人心的日子!和最近发布的 DeepSeek 一样,Mistral Small 3 为大型开源推理模型带来了补充,作为一款强大的基础模型,其推理能力得到了更进一步的发展。”言辞之间,似乎流露着 Mistral AI 对于 DeepSeek 的惺惺相惜。

据介绍,Mistral Small 3 是一个经过预训练和指导的模型,其参数为 240 亿,其在大规模多任务语言理解(MMLU,Massive Multitask Language Understanding)上的准确率超过 81%,延迟为 150 tokens/秒,并可以被部署在任何设备上,甚至能在 32GB RAM 的苹果 MacBook 上运行。

值得一提的是,Mistral Small 3 的层数远少于同类模型,大大减少了每次前向传播的时间。

Mistral Small 3 与 Llama 3.3 70B 的指令相当,但在相同硬件上速度快出 3 倍以上。这让 Mistral Small 3 能与 Llama 3.3 70B 或 Qwen 32B 等参数更大的模型相媲美。

Mistral AI 表示,Mistral Small 3 是 GPT-4o mini 等闭源专有模型的优秀开源替代品,还称 Mistral Small 3 在延迟上得到了优化。

在评估该模型的性能时,Mistral AI 与外部第三方供应商一起针对 1k 多个专有编码和通才提示进行并排评估。这项评估任务旨在从 Mistral Small 3 与从另一个匿名模型生成的内容中,挑选出来更受欢迎的模型响应。

Mistral AI 在博文中写道:“我们意识到在某些情况下,人类判断的基准与公开可用的基准截然不同,但在核实公平评估时我们格外谨慎。因此我们相信,上述基准是有效的。”

评估结果显示,相比三倍于其大小的开源权重模型和专有 GPT4o-mini 模型,Mistral Small 3 的指令调优模型在代码、数学、常识和指令遵循基准测试上更加出色。

由于所有基准测试的性能准确性,均是通过相同的内部评估流程获得。因此,测试结果可能与 Qwen2.5-32B-Instruct、Llama-3.3-70B-Instruct、Gemma-2-27B-IT 这几款模型之前报告的性能略有不同。

而 Wildbench、Arena hard 和 MTBench 等基于评判的评估,均基于 OpenAI 于 2024 年 5 月 13 日发布的 GPT-4o 模型。

Mistral AI 表示,Mistral Small 3 是目前同类产品中最有效的模型,它很好地补全了大型开源推理模型,其还称 Mistral Small 3 极大降低了计算成本,并表示这可能会重塑先进 AI 部署的经济性。

正因此,Mistral AI 在其领英主页上称 Mistral Small 3 是“加速全球各行各业采用生成式 AI 的游戏规则改变者(game-changer)”。

Mistral AI 的联合创始人兼首席科学官纪尧姆·兰普莱(Guillaume Lample)也告诉媒体:“我们认为,它在所有参数小于 700 亿的模型中是最好的。”“我们估计它基本上与几个月前发布的 Meta Llama 3.3 70B 相当,而 Mistral Small 3 却比它小了近三倍。”

据介绍,Mistral AI 之所研发这款新模型,是为了在适合本地部署的规模上拉满模型性能。Mistral AI 的技术方法侧重于效率而非规模,其主要通过迭代模型训练技术来提高模型性能,这样一来无需再投入更多的计算能力。

事实上,不仅 Mistral AI 的模型训练方式有所不同,其模型优化的方式也有所不同。据介绍,Mistral Small 3 在 8 万亿个 tokens 上进行训练,而同类模型的训练量为 15 万亿,这让那些重视计算成本的企业更容易获得先进的 AI 功能。

据该公司称,Mistral Small 3 可以在单个图形处理器(GPU,graphics processing unit)上运行,并能处理 80-90% 的典型业务,这些业务往往需要严格的语言和指令遵循表现、以及对于延迟要求非常低。与此同时,Mistral AI 在 Apache 2.0 协议下发布了预训练和指令调优的检查点。

目前,该模型已经可以在 Hugging Face、Ollama、Kaggle、Together AI、Fireworks AI 等平台下载使用,未来不久开发者也能在 NVIDIA NIM、Amazon SageMaker、Groq、Databricks 和 Snowflake 等平台下载使用。

Mistral Small 3 允许企业自由修改和部署它,因此 Mistral AI 表示它非常期待开源社区来采用 Mistral Small 3 以及基于定制其进行模型性质,并表示非常欢迎开发者通过破解 Mistral Small 3 来使其变得更好。

同时,Mistral AI 还在官网预告称,预计未来几周内 Mistral AI 的小模型和大模型将具有更强的推理能力。

随着 AI 行业的成熟,Mistral AI 对更小、更高效模型的关注,可能会被证明是一种具有先见之明的做法。目前,OpenAI 和 Anthropic 等公司更专注于开发越来越大、越来越昂贵的模型,而 Mistral AI 的做法则和其形成鲜明对比。

该公司的联合创始人兼首席科学官纪尧姆·兰普莱(Guillaume Lample)也预测称:“很多开源模型都可能带有非常宽松的许可证。我们认为,这种‘条件型(conditional)’模型很可能会成为一种商品。”

另据悉,Mistral AI 成立于 2023 年 4 月,一共有三位创始人。他们分别是:担任联合创始人兼 CEO 的阿瑟·曼斯(Arthur Mensch)、担任联合创始人兼首席科学家的纪尧姆·兰普莱(Guillaume Lample)以及担任联合创始人兼 CTO 的蒂莫西·拉克鲁瓦(Timothée Lacroix)。

联合创始人兼 CEO 阿瑟·曼斯(Arthur Mensch)此前曾在 DeepMind 的法国工作室担任研究员。其本科毕业于法国巴黎综合理工学院,硕士毕业于法国巴黎萨克雷高等师范学校,博士毕业于法国巴黎萨克雷大学。

联合创始人兼首席科学家纪尧姆·兰普莱(Guillaume Lample)此前曾在 Meta 法国分公司工作过六年多之久。早年其先后在法国巴黎综合理工学院和美国卡内基梅隆大学获得两个硕士学位,并在法国巴黎第六大学获得博士学位。

联合创始人兼 CTO 蒂莫西·拉克鲁瓦(Timothée Lacroix)此前也在 Meta 法国分公司工作过数年之久,早年其在法国巴黎高等师范学院获得了本科学位。

2024 年夏,Mistral AI 获得 6 亿欧元的融资,投资者中包含微软和英伟达。目前,Mistral AI 公司估值约为 60 亿美元,其将自己定位为全球 AI 竞赛中的“欧洲领头羊”。

2025 年 1 月,Mistral AI 与法新社签署了一项协议,这让用户使用 Mistral AI 的产品能够访问法新社以六种语言发布的新闻。

最近,该公司的联合创始人兼 CEO 阿瑟·曼斯(Arthur Mensch)在参加达沃斯世界经济论坛时,接受了彭博社的采访。采访中其表示,Mistral AI 正在为最终的首次公开募股(IPO,Initial Public Offering)做准备。

在全球 AI 领域,“法国 AI”是一股不可忽视的力量。图灵奖得主&Meta 首席科学家杨立昆(Yann LeCun)、“Keras 之父”& 前谷歌高级工程师弗朗索瓦·肖莱(François Chollet)均出生于法国。

法国现任法国总统马克龙也曾表示希望将法国变为欧洲的一个创业国家,此前马克龙还亲自出席过巴黎一家孵化器的落成典礼。

尽管如此,作为一家 AI 公司要想在全世界都能“吃得开”那就必须拥抱美国市场,此前有报道称 Mistral AI 将在美国加州旧金山湾区帕洛阿托建立办事处。

与此同时,该公司还计划在新加坡开设一个办事处,以便更好地拓展亚太地区业务。总之,Mistral AI 早已不满足于在法国发展而是志在全球。

参考资料:

https://mistral.ai/news/mistral-small-3/

https://venturebeat.com/ai/mistral-small-3-brings-open-source-ai-to-the-masses-smaller-faster-and-cheaper/

https://www.zdnet.com/article/mistral-ai-says-its-small-3-model-is-a-local-open-source-alternative-to-gpt-4o-mini/

https://insiderpaper.com/frances-mistral-hails-deepseeks-ai-model/

https://www.linkedin.com/feed/update/urn:li:activity:7290735119026257921/

https://techcrunch.com/2025/01/21/mistral-ai-plans-ipo/

https://www.ibm.com/think/news/french-ai-goes-west

https://www.pymnts.com/artificial-intelligence-2/2024/mistral-reportedly-eyes-us-expansion-to-take-on-ai-giants/

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
43分6板7助!东契奇一战刷爆多项NBA纪录,追平哈登,致敬乔丹

43分6板7助!东契奇一战刷爆多项NBA纪录,追平哈登,致敬乔丹

世界体育圈
2026-03-26 11:49:39
张雪峰去世后续!暖心一幕公司上演,治丧委员会澄清,有人要遭殃

张雪峰去世后续!暖心一幕公司上演,治丧委员会澄清,有人要遭殃

裕丰娱间说
2026-03-26 11:14:11
巴斯夫(广东)一体化基地全面投产,黄坤明等中外嘉宾共同启动

巴斯夫(广东)一体化基地全面投产,黄坤明等中外嘉宾共同启动

广东发布
2026-03-26 10:57:43
拒邀日本高管参会,人数已经清零,日本叫苦不迭,中方将奉陪到底

拒邀日本高管参会,人数已经清零,日本叫苦不迭,中方将奉陪到底

知鉴明史
2026-03-25 09:08:00
主持人魏笑的最后3天:15号生日,16号领证,17号婚礼成葬礼

主持人魏笑的最后3天:15号生日,16号领证,17号婚礼成葬礼

就一点
2026-03-19 10:47:51
四川多所中学发布严正声明

四川多所中学发布严正声明

四川省教育厅
2026-03-26 10:57:12
医生:一旦到了75岁,就算身体没啥毛病,平时也要注意这4个细节

医生:一旦到了75岁,就算身体没啥毛病,平时也要注意这4个细节

路医生健康科普
2026-03-23 22:20:03
美军主力调走,军火被扣后,台军放话:若解放军登岛,将远程打击

美军主力调走,军火被扣后,台军放话:若解放军登岛,将远程打击

知法而形
2026-03-24 10:45:18
印度偷师不成闹笑话?10亿购入我国8台盾构机,拆解后装不上了

印度偷师不成闹笑话?10亿购入我国8台盾构机,拆解后装不上了

有范又有料
2026-03-25 16:38:02
清末民初:四川总督赵尔丰、冒着热气的小吃摊、末代状元刘春霖

清末民初:四川总督赵尔丰、冒着热气的小吃摊、末代状元刘春霖

历史小破站
2026-03-19 04:05:03
雷军辞任金山云董事长,邹涛接棒,公司2025年净亏损9.44亿元

雷军辞任金山云董事长,邹涛接棒,公司2025年净亏损9.44亿元

红星新闻
2026-03-26 11:18:28
广汽集团,你疯了吗?

广汽集团,你疯了吗?

汽车K线
2026-03-26 09:20:19
爆冷!米切尔28+6莫布里拉胯,阿德巴约17+10,哈登18+9扭头就走

爆冷!米切尔28+6莫布里拉胯,阿德巴约17+10,哈登18+9扭头就走

鱼崖大话篮球
2026-03-26 10:07:22
悲催!怎么会这么巧?张雪峰和曝光眼镜暴利的记者,都是心脏骤停

悲催!怎么会这么巧?张雪峰和曝光眼镜暴利的记者,都是心脏骤停

火山詩话
2026-03-24 18:23:32
独立百年的蒙古国,正在把中国人40年的努力悄悄毁掉

独立百年的蒙古国,正在把中国人40年的努力悄悄毁掉

犀利辣椒
2026-03-19 06:40:31
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
匈牙利外长:即日起逐步停止向乌克兰输送天然气

匈牙利外长:即日起逐步停止向乌克兰输送天然气

财联社
2026-03-26 00:09:09
1971年,陈毅在病房拍了照片,49岁的张茜,一脸憔悴和忧伤

1971年,陈毅在病房拍了照片,49岁的张茜,一脸憔悴和忧伤

抽象派大师
2026-03-26 10:57:02
张雪峰外卖引深思,向华强晚餐成标杆,饮食习惯决定健康

张雪峰外卖引深思,向华强晚餐成标杆,饮食习惯决定健康

记录生活日常阿蜴
2026-03-26 12:17:08
正式确定!CBA名将加盟浙江广厦,重返老东家,全力卫冕总冠军

正式确定!CBA名将加盟浙江广厦,重返老东家,全力卫冕总冠军

体坛瞎白话
2026-03-25 16:52:09
2026-03-26 13:35:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16487文章数 514796关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

亲子
手机
时尚
旅游
房产

亲子要闻

躺平的孩子意外觉醒了,在父母学会当“乌龟”!

手机要闻

华为全面回归官宣!产品全覆盖、麒麟全搭载,国产手机重回巅峰

2026年了,最好看的还是“这件针织”!

旅游要闻

人不算多风景极美 清明假期去这7座宝藏小城

房产要闻

质价比标杆!三亚首创浮岛全景舱亮相,还得是万科!

无障碍浏览 进入关怀版