网易首页 > 网易号 > 正文 申请入驻

成立仅半年,Mistral估值暴涨七倍,开源重塑AI战局

0
分享至

机器之能报道

编辑:Sia

烧钱的闭源,逆袭的开源。

当 LLaMA 被泄露出去、任何人都可以下载时,开源的命运齿轮已经开始转动,并在 Mistral AI 最新一轮融资中达到高潮。

。短短六个月,这家拥有22名员工的初创企业在最近 A 轮融资中筹集了 4.15 亿美元,估值从 2.6 亿美元狂飙到 20 亿美元,涨了七倍多。

同时,公司也低调发布了大模型 Mixtral 8X7B。

Mixtral 8x7B 采用了一种独特的架构方法——专家混合 (MoE) ,可产生流畅的、类似人类的响应,与传统的 LLM 方法形成鲜明对比。

根据公司提供的数据,Mixtral 8X7B 优于一些竞争对手,包括 Meta 的 Llama 2 系列和 OpenAI 的 GPT-3.5。


成立仅四周,获1.13亿美元的种子轮融资,估值约为2.6亿美元。半年后,A轮融资后身价涨到了20亿美元。

与具有讽刺意味的名字 OpenAI 不同,Mixtral-8x7B 是开源的,这意味着它可以免费用于商业用途。开发人员还可以更改、复制或更新源代码,并将其与许可证副本一起分发。

不少网友积极为 Mixtral-8x7B 打 Call,夸赞它有多快、有多有趣。有研究者甚至称:「闭源大模型走到结局了。」

在此之前,他们在 9 月底发布的 Mistral 7B 至今仍被称为「最好的 7B 模型」,在每个基准测试中都优于 Llama-2 13B,并且在代码、数学和推理方面优于 LLaMA-1 34B。


有研究者称:「闭源大模型走到结局了。」

OpenAI 一直保持其最新 LLM 闭源,并因此引发外界一定程度的强烈反对。

OpenAI 和谷歌警告称,在开源领域发布如此强大的模型是非常危险的,因为该技术可用于传播虚假信息。

他们也倾向于防御性发布模式,以便严格控制模型的使用方式。他们花了几个月为自己的 LLM 开发安全护栏,确保不会被用来传播虚假信息和仇恨言论,或者对问题产生有偏见的答案。

Mixtral 专注于开源其所有 AI 软件,坚定站在了日益激烈的文化战争的另一边。

他们坚信,生成式 AI 技术应该是开源的,允许自由复制和修改 LLM 代码,通过这种方式帮助其他用户快速构建自己的聊天机器人。

他们追求的轨迹也很明确:「开放、负责任和去中心化的技术方法」。

广泛分享 AI 的底层代码是最安全的途径,因为更多的人可以审查这项技术,发现它的缺陷,并努力消除或减轻它们。顶级风投 Andreessen Horowitz 普通合伙 Anjney Midha 在接受《纽约时报》采访时说,他领导了对 Mistral AI 的 A 轮投资。

「没有一个工程团队能够找到每一个错误,」他说。「大型社区更擅长构建更便宜、更快、更好、更安全的软件。」

国内大模型初创公司面壁智能也致力于开源 LLM 的商用落地。

面对市场竞争,开源软件的免费使用是非常有吸引力的获客手段,低成本试错也有助于加速创新。「基于开源路线,可以更快触达潜在用户群体,降低企业认知和决策难度。」联合创始人曾国洋曾告诉机器之心。

另外,LLM 涉及许多技术问题,单靠一家企业很难解决,可以通过开放技术,依靠社区力量共同解决,共享 IP,互惠互利。

这种集中与去中心化的博弈力量一直贯穿于现代计算机技术发展史中。

正如网友所言,「开源不仅是未来,也是过去。」


reddit上,网友也就 Mistral最新融资展开了一场关于开源与闭源的讨论,开源会是LLM的未来吗?

开源社区的主流思想之所以被人接受,更大的时代背景正是大公司对于软件业的垄断。推动现代计算的大多数主要技术都是开源的,包括计算机操作系统、编程语言和数据库。


Meta 从一开始也是站在开源大模型这一边,也被视为开源最大的受益者。

不过,谁能赢得这场博弈,仍然仁者见仁。

许多人工智能研究人员、技术高管和风险投资家认为,这场竞赛将由那些构建相同技术然后免费提供出去的公司赢得——即使这意味着没有任何护栏。

一份为人津津乐道、从谷歌内部泄露出来的备忘录(标题是《我们没有护城河》)质疑了东家对专有模型的坚定不移。

「我们无法赢得这场军备竞赛,OpenAI 也一样。当我们争吵不休的时候,第三个派系(开源)却在悄悄地吃掉我们的午餐。」

开源具有一些我们无法复制的显着优势。虽然谷歌的模型在质量方面仍略占优势,但差距正在以惊人速度缩小。


谷歌备忘录作者发现,自从 LLaMA 泄露后,立刻出现了大量的创新,比如羊驼、小羊驼等,都可以在智能终端上运行,重大开发成果之间的间隔也在缩短。Meta 是一个明显的赢家。他们有效地获得了整个星球的免费劳动力,大多数开源创新都发生在他们的架构之上,没有什么能阻止他们将其直接整合到他们的产品中。

开源替代方案可以而且最终会让它们黯然失色。「当免费、不受限制的替代品在质量上具有可比性时,人们就不会为受限制的模型付费。」

这一担心也部分得到了一些验证。

最近,Meta 首席 AI 科学家 Yann LeCun 转发了方舟投资(ARK Invest)制作的一张趋势图,描绘了开源社区与专有模型在生成式 AI 上的发展。

「开源人工智能模型正走在超越专有模型的路上。」他感概道。


不久,方舟投资又更新了这张广为流传的图表,新增了一些模型,包括 Gemini 和 Mixtral Mixtral 8X7B 。


散点图最近有更新,增加了一些模型,如 Gemini和Mixtral,我们可以看到,开源模型的性能在不断追赶专有模型。有网友甚至表示,我们正在接近一个临界点。以目前开源社区项目的发展速度,我们将在未来 12 个月内达到 GPT-4 的水平。

我们可以从图中看到,领先的前沿模型在绝对能力上仍然具有优势,但开源社区研究人员正利用免费线上资源取得可媲美最大的专有模型的成果。

Meta 最初发布 LLaMA 时,参数量从 70 亿到 650 亿不等。这些模型的性能非常优异:

有 130 亿参数的 Llama 模型「在大多数基准上」可以胜过 GPT-3( 参数量达 1750 亿),而且可以在单块 V100 GPU 上运行;

最大的 650 亿参数的 Llama 模型可以媲美谷歌的 Chinchilla-70B 和 PaLM-540B。

Llama 2 开源再一次使大模型格局发生巨变。

相比于 Llama 1,Llama 2 的训练数据多了 40%,上下文长度也翻倍,并采用了分组查询注意力机制。

Falcon-40B 刚发布就冲上了 Huggingface 的 OpenLLM 排行榜首位,改变了 Llama 一枝独秀的场面。目前,最大的公开型号是 Falcon 180B。

还有 Yi 模型,可以一次处理 40 万汉字、中英均霸榜。Yi-34B 也成为迄今为止唯一成功登顶 Hugging Face 开源模型排行榜的国产模型。

Mixtral Mixtral 8X7B 亮点在于模型规模和性能(击败GPT 3.5)的「性价比」——未来,我们更加渴望有更多这样的开源 MoE 模型,而不是更大的模型。

散点图勾勒出一股创新大潮,正改写着大模型战局,开源力量可能在未来 1~2 年与专有模型分庭抗礼。



但并非所有人都认同这一点。

有分析师指出,开源和闭源,各有利弊,但在技术行业的大多数其他方面,例如基础设施即服务(IaaS)和平台即服务 ( PaaS ),开源已成为明显的赢家。

不过,情况并非总是如此,因为在软件即服务领域( SaaS )大多数领先平台仍然是专有(闭源)软件。所以,还是无法确定哪种方法会赢得竞赛。

也有网友认为,开源还是闭源并不是一场非此即彼的零和游戏。

LLM 也许会找到一个类似平衡——就像互联网是基于开源软件运转的,但我们也离不开 Adobe、Windows 这样的付费专有软件。




开源固然迷人,一些网友也在质疑 Mistral AI 这样的公司怎么赚钱?从收益回报上看,投资者为什么要如此重视 Mistral 这样的公司?


开源总是让人和自由分享和免费的互联网精神联系在一起,盈利好像与之天然相悖。但事实上,开源并不意味着公司不能赚钱,最典型例子就是开源软件公司 Red Hat。

被 IBM 收购之前,Red Hat 最后一次报告的收入是 2018 年的 34 亿美元。它的软件基本上是免费的,收入主要来自向企业提供支持服务。

比如,纽交所在用免费的 Linux 系统交易股票。每隔几年芯片硬件都会升级,纽交所也想采用新的处理器提升效率,这就需要部署新的系统和应用程序。

纽交所可以养一个团队自己完成所有系统维护、开发工作,也可以花钱请 Red Hat 来做。相当数量的企业用户都选择了后者。

Mixtral 其实也提供即用即付的 API 访问,迎合那些想要快速轻松地访问其功能而无需管理基础设施来支持它的用户,类似于 OpenAI 的 ChatGPT 和 Anthropic 的 Claude 模型。


reddit网友猜想的开源的商业模式。就像当年的网景浏览器变身为流量入口,带动了广告、游戏等其他业务的兴起。

机器之心采访面壁智能时也曾聊过商业模式——他们形容为一种类似于数据库的生意:

公司负责提供模型库,就像现在比较常见的数据库企业;数据库的工作是打磨数据库性能,面壁智能的任务就是提升大模型性能。政府、企业、小型开发者甚至学生通过标准接口接入基础设施,根据自身需求实现业务所需能力。

不过,《经济学人》曾警告说,一部分开源公司可能是好企业,但投资者必须接受他们不会拥有传统软件公司的经营利润,更不用说微软那样的利润了。因为是「开源」,意味着它们是一种公共财产,不能像微软对 Windows 那样利用专利实施垄断,获得丰厚回报。

反过来,就像《经济学人》曾指出的,虽然短期内对拥有这样一个平台的所有者极其有益,但却违背了该行业中其他所有公司的利益,也拖累了整体技术的创新和发展速度。

无论如何,现在有一点很明确——和一年前相比,LLM 实现民主化使用的可能性大大提高了,技术被少数公司垄断的可能性也在减少。

这是计算领域里的又一个转折点。

https://www.semianalysis.com/p/google-we-have-no-moat-and-neither

© THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“官场小说家”杨克宁被决定逮捕!

“官场小说家”杨克宁被决定逮捕!

正义网
2024-06-03 15:01:04
贝克汉姆拥抱哈珀看球赛,却被网友质疑太过亲密,女儿大了要避嫌

贝克汉姆拥抱哈珀看球赛,却被网友质疑太过亲密,女儿大了要避嫌

麦大人
2024-06-03 13:30:19
看到月球上的五星红旗,美国登月再遭质疑:为何美国国旗会飘扬?

看到月球上的五星红旗,美国登月再遭质疑:为何美国国旗会飘扬?

落笔成佛
2024-06-03 14:04:42
统治者是怎样欺骗民众的?——“假想敌”策略

统治者是怎样欺骗民众的?——“假想敌”策略

黑噪音
2024-06-03 15:17:58
没底线!漫展模仿科比遇难现场,球迷出离愤怒,Cos圈却不知悔改

没底线!漫展模仿科比遇难现场,球迷出离愤怒,Cos圈却不知悔改

末位侃球
2024-06-03 09:12:25
王健林宣布退出:转让全部股权!还清6000亿,成功上岸!

王健林宣布退出:转让全部股权!还清6000亿,成功上岸!

老蒋谈策划
2024-06-03 09:58:44
伊朗外交部竟然向我国提出了抗议!

伊朗外交部竟然向我国提出了抗议!

止戈军是我
2024-06-03 09:49:47
接班100天,宗馥莉急了

接班100天,宗馥莉急了

中国企业家杂志
2024-06-03 09:37:04
风波升级!日本人为了抓铁头,将悬赏金加到1000万,一些华人加入

风波升级!日本人为了抓铁头,将悬赏金加到1000万,一些华人加入

辣条小剧场
2024-06-03 08:00:12
周深演唱会开场空座一片,送票都无人问津,座位上放荧光棒撑场面

周深演唱会开场空座一片,送票都无人问津,座位上放荧光棒撑场面

娱圈小愚
2024-06-03 09:56:23
外媒:美国放宽限制后,乌克兰首次使用“海马斯”袭击俄本土

外媒:美国放宽限制后,乌克兰首次使用“海马斯”袭击俄本土

环球时报国际
2024-06-03 18:26:39
连总部都5折卖了,还有什么能拯救万科?

连总部都5折卖了,还有什么能拯救万科?

市界
2024-06-03 14:34:11
都是低生育率国家,为什么日韩是“不想生”,中国却是“不敢生”?

都是低生育率国家,为什么日韩是“不想生”,中国却是“不敢生”?

小萝卜丝
2024-06-03 11:09:01
“美国出卖了乌克兰,50年后这国家就没了”

“美国出卖了乌克兰,50年后这国家就没了”

观察者网
2024-06-03 14:02:09
广东原省委副书记判“死缓”,家中搜出十几车现金与黄金,曾向周永康递效忠信

广东原省委副书记判“死缓”,家中搜出十几车现金与黄金,曾向周永康递效忠信

天闻地知
2024-06-03 14:48:57
张柏芝被骂忘恩负义,为4000万自认是前经纪人的狗?工作室回应了

张柏芝被骂忘恩负义,为4000万自认是前经纪人的狗?工作室回应了

拾娱先生
2024-06-02 23:16:36
太丢脸了!荷兰海军护卫舰穿越台湾海峡,被两岸当渔船,直接无视

太丢脸了!荷兰海军护卫舰穿越台湾海峡,被两岸当渔船,直接无视

域观天下
2024-06-03 10:13:51
县城工资,重回“3000块”时代

县城工资,重回“3000块”时代

曹多鱼的财经世界
2024-06-03 09:31:28
湖南:小伙捧鲜花表白女技师,做足疗一见钟情,网友:长得很哇塞

湖南:小伙捧鲜花表白女技师,做足疗一见钟情,网友:长得很哇塞

百晓史
2024-06-02 09:09:36
今年养老金调整有点“小意外”,养老金调整细则,会不会提低控高

今年养老金调整有点“小意外”,养老金调整细则,会不会提低控高

社保小达人
2024-06-03 11:48:16
2024-06-03 18:48:49
机器之能
机器之能
探索人工智能应用场景及商业化
1926文章数 4356关注度
往期回顾 全部

科技要闻

特斯拉回应单踏板模式可能被禁止:暂无影响

头条要闻

美国放宽限制后 乌克兰首次使用"海马斯"袭击俄本土

头条要闻

美国放宽限制后 乌克兰首次使用"海马斯"袭击俄本土

体育要闻

万人空巷!皇马举行欧冠夺冠庆典

娱乐要闻

混战升级!编剧赵冬苓力挺王阳遭围攻

财经要闻

接班100天,宗馥莉急了

汽车要闻

搭载华为HiCAR 传祺M6 MAX售14.58万元

态度原创

家居
房产
亲子
健康
军事航空

家居要闻

静谧极简 让空间回归本质

房产要闻

12000+起!海口40+楼盘,最新价格曝光!

亲子要闻

弟弟把姐姐试卷弄坏被教育,直到姐姐离开才敢扔鞋“泄愤”

晚餐不吃or吃七分饱,哪种更减肥?

军事要闻

泽连斯基称俄武器来自中国 外交部回应

无障碍浏览 进入关怀版