网易首页 > 网易号 > 正文 申请入驻

苹果看上的公司,靠量子“邪修”给模型“瘦身”

0
分享至


出品|虎嗅科技组

作者|SnowyM

编辑|陈伊凡

头图|Multiverse Computing官网

“AI原生100”是虎嗅科技组推出针对AI原生创新栏目,这是本系列的第「17」篇文章。

端侧模型和小模型这件事,在人工智能行业如今并不新鲜。

去年,Meta、微软、苹果等就集中发布了一系列小模型,Llama-3、Phi-3、OpenELM等。

2019 年成立的 Multiverse Computing,试图用所谓“量子物理”方式给模型瘦身:它的核心技术 CompactifAI 能将大模型体积压缩 95%,却几乎不损失性能,让原本只能在数据中心运行的 AI,装进手机、汽车里。

这也让这家公司获得了资本的青睐,截至今日,Multiverse Computing已经完成了5轮融资。2024年3月,这家公司完成了2500万欧元的A轮融资,一年多后B轮融资直接冲到1.89亿欧元,估值从2024年的1.08亿美元,涨到5亿美元,一跃成为西班牙最大的AI初创公司之一。

两周多前,这家公司发布了两款“世界最小的模型”——鸡脑(chicken’s brain)和苍蝇脑(a fly’s brain)。“苍蝇脑”是Hugging Face开源模型SmolLM2-135的压缩版本,原始参数是1.35亿,压缩之后只有9400万参数。“鸡脑”则是Llama3.18B模型的压缩版本,可以直接在苹果电脑上运行,无需联网。

这背后藏着太多值得拆解的问题:“量子瘦身” 技术究竟是噱头还是真功夫?当模型被压缩时,是否也会影响其性能?团队推出的 “苍蝇脑”“小鸡脑” 超小模型,又是如何突破硬件限制,甚至吸引苹果、三星等巨头洽谈合作?在 Meta、谷歌、微软纷纷下场做小模型,众多初创公司争抢 AI 效率赛道的当下,Multiverse 凭什么建立技术壁垒,成为西班牙估值最高的 AI 初创企业之一?虎嗅与量子计算领域的业内人士交流,试图理清这些问题。

4年5轮融资,估值一年涨5倍

Multiverse Computing并非一开始就进入模型赛道。

2019年团队成立之初,其聚焦量子计算软件,试图用量子技术解决金融领域的投资组合优化、风险管理等难题,这些在传统IT技术上难以被功克。

凭借技术积累,Multiverse很快被第三方数据分析与咨询机构Gartner评为量子计算领域的“Cool Vender”。Gartner的这份Cool Vendor的报告,主要涵盖科技创新领域,每个领域只有4家-5家公司能上榜,金融人士更是将这份榜单视为“投资宝典”。借此,Multiverse还获得了欧盟加速器EIC 1250万欧元的资金支持,成了欧洲资本最充足的量子初创公司之一。

Multiverse的团队中,40% 成员拥有博士学位,核心成员更是横跨金融、量子物理与科技创业三大领域 ——CEO 恩里克身兼数学、计算机、医学博士与 MBA,有 20 年银行业经验,曾任西班牙 Unnim 银行副 CEO;联合创始人罗曼是欧洲顶尖量子物理学家,专攻张量网络,拿过欧洲物理学会青年研究奖;CTO 塞缪尔则是量子计算与机器学习双料专家,熟悉创业与投资逻辑。

转折点出现在 2023 年。生成式 AI 爆发后,大模型参数规模暴涨,算力成本飙升成了行业普遍痛点 ——OpenAI 每周在 ChatGPT 推理上的支出甚至超过训练成本。恩里克和团队敏锐发现,他们深耕多年的量子张量网络技术,恰好能破解这一困局:量子多体系统中的数学技巧,可用于大模型参数的高效压缩,且能最大程度保留性能。

基于这一判断,团队火速组建 AI 压缩专项组,年底就推出了核心技术 CompactifAI,正式从 “量子 + 金融” 转向 “量子 + AI”。这次转向不仅让 Multiverse 踩中了 “小模型” 风口,更让它在 2024-2025 年迎来爆发,成为西班牙最大的 AI 初创企业之一。


“量子瘦身”靠谱吗?

Multiverse的故事核心,是一套叫做Compactif AI的压缩技术。它不像行业常用的量化、蒸馏技术那样简单削减参数,按照Multiverse自己的介绍,这套技术是用量子物理张量网络方法,融合张量分解、矩阵低秩近似等复杂数学技巧,从模型底层重构参数逻辑。


正如联合创始人奥鲁斯所说:"我们的压缩技术并非计算机科学领域常见的套路,而是源自我们对量子物理的理解,更加微妙而精炼。”

不过,虎嗅询问了量子计算领域的业内人士,Multiverse所使用的这套数学方法虽然是量子中常用的,但其实只是一类数学方法,严格意义上和量子物理无关,因为张量网络问题最初就是物理学家从数学研究中借鉴到量子物理中的。

所谓的张量网络方法,通俗比喻就是,你要拼一个一万平方米的拼图,拼完后为了存放它,需要找一个很大的房子。但如果你把拼图重新打碎,装到罐子中,把维度升高,从二维升高到3维,维度越多越方便压缩,再去掉重复的碎片,就可以装到一个小盒子里,并且保留几乎所有信息,需要的时候可以重新还原成大拼图。

这种方法对大部分模型都适用,因为现在的模型,大多都是神经网络的变体,差别不大,Multiverse的方法有很强的泛化性。

这件事情的难点在于,要把现有的大语言模型基础算子/结构抽象出来,形成一套通用的压缩工作流,这样无论什么模型都可以复用。

CompactifAI通常能将型体积缩小80-95%而准确率只下降2-3个百分点。例如,原本需要数十亿参数的模型压缩后可能只有几亿参数,却在绝大多数基准测试中与原模型表现相当。

目前Multiverse已发布多个压缩模型版本,例如Llama 4 70B模型的精简版"Llama 4 Scout Slim",以及Llama 3系列和Mistral小模型的精简版等。

2025年8月,公司发布了两款号称"史上最小且高性能"的模型,并以动物大脑体积命名——SuperFly(苍蝇脑)和ChickBrain(小鸡脑)。

SuperFly基于135M参数的开源SmolLM模型压缩而成,仅含9400万参数,相当于一只苍蝇的大脑大小;ChickBrain则由Meta的Llama 3.1系列8B模型压缩成3.2B参数(压缩率60%),大小如小鸡大脑,却具备一定推理能力。


ChickBrain(3B)的基准测试结果

这件事的商业价值也很明显,CompactifAI带来的直接好处是成本与效率优化。

根据Multiverse公布的数据,其瘦身版模型推理速度是未压缩模型的4-12倍,对应推理成本降低50-80%。在AWS云服务上,使用CompactifAI压缩后的模型可大大节省费用。

例如,压缩过的Llama 4 Scout Slim在AWS上的调用费用约为每百万tokens 0.10美元,而原版约为0.14美元,也就是说,每处理百万tokens可以节省约30%费用。另外,CompactifAI让此前只能在昂贵服务器上运行的AI模型进入了"平民设备"时代。Multiverse声称其部分精简模型"小到可以在PC、手机、汽车上运行"。

目前,Multiverse提供了3种商业服务模式:(1)通过 AWS API,将压缩后的模型与原始模型均可通过 API 访问;(2)购买私有部署许可,提供企业级授权,允许用户在自己的本地基础设施或云环境中部署 CompactifAI;(3)通过服务提供商交付,让Multiver为用户压缩模型,并交付指定的推理服务提供商。

CompactifAI的用户主要是广泛使用大模型的企业和开发者。大型互联网和软件企业的AI团队是首要客户,他们往往部署开源LLM在自己的应用中,如客服聊天机器人、代码自动补全、文本分析等,但也必然面临高昂的推理开销和延迟问题。CompactifAI可以帮助他们大幅削减算力成本,甚至支持离线部署。

CompactifAI在降本增效和边缘部署方面功能突出。它可以将一个部署在8张A100 GPU上的LLM压缩到1-2张GPU即可运行,甚至压缩到能够在CPU上实时推理。这为客户节省的不仅是每小时数百美元的云GPU租用费,还有巨大的能耗开销。

小模型和端侧模型——巨头云集的赛道

Multiverse 的技术,很快吸引了全球硬件巨头的关注。据其透露,目前已与苹果、三星、Sony、HP 等洽谈合作,核心是将 “苍蝇脑”“小鸡脑” 这类超小模型嵌入下一代终端设备——这恰好契合苹果的战略:2024 年 WWDC 大会上,苹果推出 “Apple Intelligence” 框架,明确表示不追通用巨无霸模型,优先做适配 iOS/macOS 的轻量化本地模型。

不过,赛道竞争也在加剧。2024 年起,科技巨头纷纷下场小模型:Meta 发布 13 亿参数 LLaMA 微型模型,Google DeepMind 推出 2 亿 - 7 亿参数的 Gemma,微软 Phi 系列用 14 亿参数模型在数学、编码任务上超越 50 倍体积的大模型;初创公司中,Neural Magic、Deci 等也在争抢 AI 效率赛道,聚焦模型加速、自动选型等方向。

AI推理优化已经成为创投圈新的竞技场。初创公司阵营也不甘示弱。除了Multiverse外,Neural Magic、Deci、OctoML都在下场大模型效率赛道;还有初创公司专注于模型路由、自动选型等,将不同模型按成本和效果自动分配。 这些公司切入点各异,但都瞄准了"提高AI性能/成本比"这个共同目标。

虎嗅与量子计算领域人士交流,鉴于如今的大语言模型基本架构类似,Multiverse的壁垒并不算太高,端侧模型和小模型不同,虽然都需要模型轻量化,但端侧模型除了需要轻量化,还需要配合不同设备的计算资源(内存、算力),以及能耗、发热等调节小模型,需要有特别设计,是一个工程化的问题。

Multiverse如果能够绑定一家硬件厂商,或许能够在端侧模型上建立自己的生态壁垒。

另一方面,Multiverse如今大部分还是围绕已有模型压缩,而不是自己训一个小模型,在效果上,可能不会达到惊艳的效果,而且极度依赖原有的模型能力。

目前已经有一些专注小模型的初创公司除了压缩模型,还自己训练小模型,达到了不错的效果。Multiverse可能在模型压缩上,通过自身团队积累的技术,能够实现较小的压缩损耗,但后续在端侧模型布局上的工程化问题,以及模型能力本身的技术壁垒,仍然有待观察。



本文来自虎嗅,原文链接:https://www.huxiu.com/article/4761886.html?f=wyxwapp

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
广东“女儿卧室47秒”事件冲上热搜,评论区炸了:这不就是我爸吗?

广东“女儿卧室47秒”事件冲上热搜,评论区炸了:这不就是我爸吗?

脆皮先生
2026-02-02 20:03:58
知名媒体人刘虎疑被抓,曾因多次实名举报高官被羁押346天!

知名媒体人刘虎疑被抓,曾因多次实名举报高官被羁押346天!

兵叔评说
2026-02-02 14:41:43
12306回应“每天都用前任的身份证订票不付款取消3次让他买不了过年回家的票”:锁的是订票账户

12306回应“每天都用前任的身份证订票不付款取消3次让他买不了过年回家的票”:锁的是订票账户

新浪财经
2026-02-02 23:00:39
金刻羽:比起其学术成就,人们更喜欢看一颗优质大白菜被野猪拱了

金刻羽:比起其学术成就,人们更喜欢看一颗优质大白菜被野猪拱了

廖保平
2026-02-03 09:05:59
能抵抗朊病毒的PRNP基因,欧美人比中国人高20倍

能抵抗朊病毒的PRNP基因,欧美人比中国人高20倍

远方青木
2026-02-03 00:11:41
88万粉丝网红评论区“祝贺”豪豪离世,最新消息:网红账号已被封

88万粉丝网红评论区“祝贺”豪豪离世,最新消息:网红账号已被封

极目新闻
2026-02-02 22:17:34
突发交易!哈登被摆上货架,空降东部第一,快船太无情

突发交易!哈登被摆上货架,空降东部第一,快船太无情

阿泰希特
2026-02-03 12:51:04
大S雕像仪式刚结束,葛斯齐深夜爆其猛料,许雅钧表现逆转口碑!

大S雕像仪式刚结束,葛斯齐深夜爆其猛料,许雅钧表现逆转口碑!

古希腊掌管月桂的神
2026-02-03 10:20:14
Shams:哈登下赛季合同只有1300万的部分保障,他仍然想去争冠球队

Shams:哈登下赛季合同只有1300万的部分保障,他仍然想去争冠球队

懂球帝
2026-02-03 14:07:16
一天取消上千航班:印度14.6亿人,为啥只有两家航空公司?

一天取消上千航班:印度14.6亿人,为啥只有两家航空公司?

正解局
2026-02-02 13:03:17
8.7万亿!史上最贵独角兽诞生

8.7万亿!史上最贵独角兽诞生

智东西
2026-02-03 08:50:21
国投白银LOF今日复牌再度跌停

国投白银LOF今日复牌再度跌停

财联社
2026-02-03 10:34:28
曝湖人与詹姆斯准备分道扬镳!离队已成定局?至少三队有兴趣签他

曝湖人与詹姆斯准备分道扬镳!离队已成定局?至少三队有兴趣签他

罗说NBA
2026-02-03 07:13:56
爱泼斯坦档案重现失踪模特控诉:他们吃了人类,派对细节令人不适

爱泼斯坦档案重现失踪模特控诉:他们吃了人类,派对细节令人不适

译言
2026-02-03 05:09:42
春节仅剩14天,社会突现5大“反常现象”,2026年过年彻底变了!

春节仅剩14天,社会突现5大“反常现象”,2026年过年彻底变了!

健身狂人
2026-02-03 08:13:10
1862年陈玉成遭凌迟三日方死,胜保强占其妻并炫耀;慈禧:赐白绫

1862年陈玉成遭凌迟三日方死,胜保强占其妻并炫耀;慈禧:赐白绫

鉴史录
2026-02-02 22:13:07
2死3失联!这座桥为何在众目睽睽之下突然垮塌?

2死3失联!这座桥为何在众目睽睽之下突然垮塌?

民言民语
2026-02-03 08:45:05
马克西29分5篮板6助76人击败快船4连胜,恩比德24分小卡29分6助攻

马克西29分5篮板6助76人击败快船4连胜,恩比德24分小卡29分6助攻

湖人崛起
2026-02-03 13:31:38
恋情实锤?金刻羽曾给前美国财政部长发邮件:你给了我任何女性都需要的安全感与保障

恋情实锤?金刻羽曾给前美国财政部长发邮件:你给了我任何女性都需要的安全感与保障

小萝卜丝
2026-02-03 12:00:15
两男孩玩火点燃狗笼,小狗被活活烧死!主人:萨摩耶养了7年感情很深,不接受私了,要求孩子家长道歉

两男孩玩火点燃狗笼,小狗被活活烧死!主人:萨摩耶养了7年感情很深,不接受私了,要求孩子家长道歉

新民晚报
2026-02-03 08:16:52
2026-02-03 14:48:49
虎嗅APP incentive-icons
虎嗅APP
个性化商业资讯与观点交流平台
25687文章数 687428关注度
往期回顾 全部

科技要闻

1.25万亿美元!xAI员工赢麻了

头条要闻

女子为大17岁老公怀孕11次逃离 首次发生关系时仅14岁

头条要闻

女子为大17岁老公怀孕11次逃离 首次发生关系时仅14岁

体育要闻

“也许我的一小步,会成为中国足球的一大步”

娱乐要闻

小S致词:感谢具俊晔陪伴大S的最后3年

财经要闻

精神病医院骗保内幕调查:住院相当于坐牢

汽车要闻

问界M6官图首发 以年轻化设计叩击25-30万级市场

态度原创

房产
旅游
艺术
公开课
军事航空

房产要闻

顶豪热潮再起!2026抢入城市恒产,一场独属远见者的红利

旅游要闻

来四川,体验冰与火的奇妙旅程|四川省两会特别策划

艺术要闻

2026年,中国最值得期待的20个新建筑

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:庞大兵力将很快抵达伊朗

无障碍浏览 进入关怀版