网易首页 > 网易号 > 正文 申请入驻

产业丨用开源的MoE模型以小博大,Mistral AI建立欧洲自己的OpenAI

0
分享至

·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发

前言

在过去的几年里,整个开源社区已经围绕MoE模型展开了深入的研究和探索,但鲜有性能优异的MoE开源模型问世。

作者| 方文三

图片来源 |网 络

开源MoE模型有点东西

今年9月,Mistral AI推出了其首个语言模型Mistral7B,具备73亿参数,并在基准测试中超越了Meta的Llama2等参数更大的先进开源模型。

Mistral AI为其LLM设计了一种更高效、更具成本效益的训练方法,使得其模型的运营成本不到OpenAI或谷歌最佳大模型的一半。

重要的是,该模型基于Apache2.0许可发布,除了归属之外,使用者无需遵守任何使用或复制限制。

无论是业余爱好者还是数十亿美元的大公司,只要具备在本地运行该系统的能力或愿意支付所需的云资源费用,均可使用。

近日,Mistral AI再次开源了他们的MoE(Mixture of Experts)大模型Mixtral8x7B。

MoE(Mixture of Experts)在Transformer模型中的应用旨在提高模型的处理能力和效率。MoE通过将大型模型分解为多个[专家]子模块实现这一目标。

每个专家负责处理输入数据的一个特定方面或子集。在MoE架构中,每个专家可能是一个小型的Transformer模型,专门处理特定类型的输入数据。

例如,一个专家可能专注于处理自然语言的语法结构,而另一个专家可能专注于理解语义内容。

Mixtral8x7B拥有46.7B的总参数量,但每个token仅使用其中12.9B参数。因此,Mixtral的实际执行速度和所需成本仅相当于一个12.9B的模型。

在性能上,它在大多数基准测试中超越了当前开源大模型的标杆Llama270B,并与GPT3.5不相上下。

Mixtral8x7B采用了与GPT-4相似但更为[精简]的架构:

①专家总数为8个,相较于GPT-4的16个减少了一半。

②每个专家拥有70亿参数,相较于GPT-4的1660亿减少了24倍。

③总参数为46.7亿,远低于GPT-4的1.8万亿,减少了38倍。

④上下文窗口大小与GPT-4相同,均为32K。

它巧妙地平衡了模型的复杂度和推理成本,即使在拥有庞大模型参数的情况下,也能保证高效的推理性能。

使得 MoE 模型在保持强大功能的同时,也具备了更优的实用性和经济性。

创始人的背景影响着企业的特质

Mistral AI的创始人团队源自llama团队和DeepMind,天然具备开源精神,这也一定程度上推动了他们采取开源策略。

CEO Arthur Mensch曾在DeepMind巴黎办公室工作,而CTO Timothée Lacroix和首席科学家Guillaume Lample则在Meta共同参与了Llama系列的研发。

得益于创始团队与技术团队的高素质,Mistral AI的小型模型及MoE模型在性能与参数比例方面表现卓越,推理成本亦具有显著优势。

Mistral AI创始人Mensch强调,小型模型的策略是有意为之。他认为,借助小型模型,Agents的开发和应用将变得更加便捷。

若在GPT-4上运行Agents,高昂的推理成本可能导致资金迅速耗尽。

llama2的开源对生成式AI应用生态构成利好,有助于AI应用公司节省大量模型预训练成本。

Mistral AI坚信其技术以开源软件的形式共享,让任何人都可以自由地复制、修改和再利用这些计算机代码。

这为那些希望迅速构建自己的聊天机器人的外部开发者提供了所需的一切。

值得关注的是,该公司在最新一轮融资中成功筹集3.85亿欧元(约合4.15亿美元),使得这家仅有22名员工的公司估值飙升至约20亿美元。

参与此次投资的企业包括硅谷知名风险投资公司Andreessen Horowitz(a16z)、英伟达以及Salesforce等,金额达到1.2亿欧元。

六个月前,Mistral AI成立仅数周,员工人数仅为6人,尚未推出任何产品,却凭借7页PPT成功斩获1.13亿美元融资。

由Lightspeed Venture Partners领投,欧洲多家投资机构以及前谷歌首席执行官Eric Schmidt、法国亿万富翁Xavier Niel和法国广告巨头JCDecaux参与投资。

自首次亮相以来,其估值已增长超过七倍,成为欧洲最成功的大模型公司。

开源并不意味着回避商业化

欧洲拥有超过100家500强企业,主要集中在汽车、石油和天然气、制药、电信、银行等传统行业。

这些企业具备充足的付费能力,并对先进技术解决方案有强烈需求。

另一方面,欧洲的经营环境具有特殊性,如严格的监管和技术透明度要求,例如GDPR和欧盟AI法案等。

欧洲的AI独角兽更有可能适应这些法规,并有望获得更多支持。

Mistral AI虽提供两款可直接下载的模型,但现阶段最佳之选仅可通过API获取:该公司拟借助基础模型盈利。

故Mistral AI今日推出开发者平台测试版,旨在令其他企业可通过付费API方式使用Mistral AI之模型。

Mistral团队具备打造前沿闭源LLM的实力,与OpenAI、Anthropic比肩,却选择为企业端提供开放模型,满足个性化定制需求,此乃契合企业差异化战略。

展望未来,Mistral AI最佳商业化策略应为服务高价值客户,尤其是注重开放性、数据安全及模型能力之欧洲大型企业。具体商业化形式包括:

①出售开源模型定制版:针对企业实际应用场景,Mistral AI可修改并出售定制化模型,满足其数据IP顾虑及个性化需求。

②标准化商业化API:此路径与闭源厂商产品形态相近。虽开源模型API/平台目前尚无成功商业实践,但MosaicML在该领域收入颇丰。

③模型推理平台:为企业提供模型服务、RAG及定制化服务等能力。此平台与现有模型推理基础设施相似,但Mistral AI对模型训练细节可实现更彻底优化。

结尾:

开源模型的商业化运用尚未经受充分检验,公有云服务提供商完全具备提供开源模型、进入欧洲市场的实力。

尤其是Mistral AI,其目标是一款轻量级的语言模型,企业运用时将不受高门槛限制。

所以当前所面临的最大挑战并非仅在于训练出优秀的模型,更在于寻找关键的企业合作伙伴。

部分资料参考:阿尔法公社:《用MoE技术和开源模型建立差异化 Mistral AI获4.15亿美元融资》,新智元:《8x7B开源MoE击败Llama 2逼近GPT-4》,OpenMMLab:《距离GPT-4更近一步?Mistral AI开源Mixtral MoE模型》,Founder Park:《Mistral AI:欧洲最强大模型团队的现状及商业未来》

本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。

请务必注明:

「姓名 + 公司 + 合作需求」

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“正常男生不会这样坐”,家长晒学霸儿子,被调侃:已预定图灵班

“正常男生不会这样坐”,家长晒学霸儿子,被调侃:已预定图灵班

妍妍教育日记
2026-03-04 18:16:15
母亲去世后与亲舅舅再婚?信息量大到烧脑,当地已介入调查

母亲去世后与亲舅舅再婚?信息量大到烧脑,当地已介入调查

离离言几许
2026-03-04 14:30:04
马上停止使用这3种酱油,已被医生加入黑名单,大人孩子都别吃

马上停止使用这3种酱油,已被医生加入黑名单,大人孩子都别吃

橘子约定
2026-03-04 09:56:59
伊朗一枚导弹,直接击碎价值98.3亿美元贸易链,钻石行业雪上加霜

伊朗一枚导弹,直接击碎价值98.3亿美元贸易链,钻石行业雪上加霜

梦史
2026-03-04 17:06:46
中国稀土磁铁公司,绕开国内管制,向西方继续出口产品

中国稀土磁铁公司,绕开国内管制,向西方继续出口产品

南权先生
2025-12-13 16:48:30
伊朗发起“斩首”行动,76岁内塔死里逃生,中方担心的还是发生了

伊朗发起“斩首”行动,76岁内塔死里逃生,中方担心的还是发生了

知鉴明史
2026-03-03 17:42:25
从霍尔木兹海峡到地中海,伊朗首度攻击欧盟国家

从霍尔木兹海峡到地中海,伊朗首度攻击欧盟国家

上观新闻
2026-03-04 06:57:04
女子假信佛与多位高僧发生不当关系,秘密录制5600段视频。

女子假信佛与多位高僧发生不当关系,秘密录制5600段视频。

特约前排观众
2026-02-09 00:05:05
顶不住了!莫斯科打响财政自救第一枪

顶不住了!莫斯科打响财政自救第一枪

老马拉车莫少装
2026-03-05 00:00:42
做完手术人就废了,这5种手术不需要做,别让无知害了自己

做完手术人就废了,这5种手术不需要做,别让无知害了自己

医学科普汇
2026-01-29 06:25:03
美国突发史无前例撤离令!外界担忧终极空袭来临

美国突发史无前例撤离令!外界担忧终极空袭来临

看看新闻Knews
2026-03-03 20:12:10
炸锅!密歇根学者清真寺公然宣扬征服世界,言论离谱到刷新认知

炸锅!密歇根学者清真寺公然宣扬征服世界,言论离谱到刷新认知

老马拉车莫少装
2026-03-04 21:42:24
小米汽车公布车牌定制专利 开启软营销新路径

小米汽车公布车牌定制专利 开启软营销新路径

知顿
2026-03-04 12:27:56
2亿人的春天来了?两会代表提议:提高灵活就业者最低工资!

2亿人的春天来了?两会代表提议:提高灵活就业者最低工资!

另子维爱读史
2026-03-04 19:25:25
伊朗将为哈梅内伊举行告别仪式,以色列防长:伊朗任何新的最高领袖都将成“清除目标”,“无论他叫什么名字 身在何处”

伊朗将为哈梅内伊举行告别仪式,以色列防长:伊朗任何新的最高领袖都将成“清除目标”,“无论他叫什么名字 身在何处”

每日经济新闻
2026-03-04 18:08:07
演都不演了,刚复出就开演唱会,票价卖到1280,到底谁给的自信?

演都不演了,刚复出就开演唱会,票价卖到1280,到底谁给的自信?

一娱三分地
2026-03-03 13:51:03
伊朗生死关头,一个关键人物走向前台……

伊朗生死关头,一个关键人物走向前台……

补壹刀
2026-03-02 16:08:19
苹果发布 MacBook Neo!配置真的离谱

苹果发布 MacBook Neo!配置真的离谱

花果科技
2026-03-04 23:08:01
美国也没想到,转为中国籍仅6年,谷爱凌竟已成美国头号劲敌

美国也没想到,转为中国籍仅6年,谷爱凌竟已成美国头号劲敌

削桐作琴
2026-02-25 18:15:14
在岸人民币兑美元较周二夜盘收盘涨242点

在岸人民币兑美元较周二夜盘收盘涨242点

财联社
2026-03-05 03:14:12
2026-03-05 03:48:49
AI芯天下
AI芯天下
从芯出发,用心服务
6590文章数 169关注度
往期回顾 全部

科技要闻

多位核心离职,阿里亲手废掉最强AI天团?

头条要闻

外媒称伊朗封锁霍尔木兹海峡只让中俄船通行 中方回应

头条要闻

外媒称伊朗封锁霍尔木兹海峡只让中俄船通行 中方回应

体育要闻

2026年中超,为什么值得你多看一眼?

娱乐要闻

谢谢谢娜 贡献出26年内娱的第一个笑话

财经要闻

人大代表建议:将农民养老金提到500元

汽车要闻

鸿蒙智行首款猎装车 尚界Z7/Z7T首发

态度原创

手机
艺术
家居
数码
房产

手机要闻

一加15T 全面升级,官方剧透来了

艺术要闻

惊艳!她的双眸与微笑让人无法移开视线!

家居要闻

极简无界 静居自安然

数码要闻

苹果发布新款MacBook Air:8499元起 搭载全新M5芯片

房产要闻

400组,30套!聚亿·椰海锦程为何能在春节火出圈?

无障碍浏览 进入关怀版