![]()
在私营公司违约率高达9.2%(多年来最高水平)的背景下,风投公司Lux Capital最近建议依赖AI的公司将其计算资源承诺以书面形式确认。Lux警告称,随着金融不稳定性在AI供应链中蔓延,仅凭握手协议是不够的。
但还有另一个完全不同的选择,那就是停止完全依赖外部计算基础设施。直接在用户设备上运行的小型AI模型——无需数据中心、无需云服务提供商、无对手方风险——正在变得足够优秀,值得考虑。Multiverse Computing正在积极推进这一方向。
这家西班牙初创公司迄今为止保持着比一些同行更低调的姿态,但随着对AI效率需求的增长,这种情况正在改变。在压缩了来自OpenAI、Meta、DeepSeek和Mistral AI等主要AI实验室的模型后,该公司推出了一款展示其压缩模型能力的应用程序和一个API门户——让开发者能够访问和使用这些模型的网关——使这些模型得到更广泛的应用。
CompactifAI应用程序与Multiverse的量子启发压缩技术同名,是一个类似ChatGPT或Mistral Le Chat的AI聊天工具。用户提问,模型回答。不同之处在于,据该公司称,Multiverse嵌入了Gilda,这是一个小到可以在本地离线运行的模型。
对于终端用户来说,这是边缘AI的体验,数据不会离开他们的设备且不需要连接。但有一个限制条件:他们的移动设备必须有足够的RAM和存储空间。如果没有——许多较旧的iPhone都不具备这种条件——应用程序会通过API切换回基于云的模型。本地和云处理之间的路由由Multiverse命名为Ash Nazg的系统自动处理,这个名字对托尔金粉丝来说很熟悉,因为它引用了《指环王》中至尊魔戒的铭文。但当应用程序路由到云端时,它在过程中失去了主要的隐私优势。
这些限制意味着CompactifAI还未完全准备好大规模客户采用,尽管这可能从来都不是目标。根据Sensor Tower的数据,该应用程序在过去一个月的下载量不到5000次。
真正的目标是企业。今天,Multiverse推出了一个自助式API门户,让开发者和企业直接访问其压缩模型——无需AWS Marketplace。
首席执行官Enrique Lizaso在一份声明中表示:"CompactifAI API门户现在为开发者提供了直接访问压缩模型的途径,具备在生产环境中运行所需的透明度和控制权。"
实时使用监控是API的关键功能之一,这并非偶然。除了在边缘部署的潜在优势外,更低的计算成本是企业考虑小型模型作为大语言模型替代方案的主要原因之一。
小型模型比以前限制更少也有所帮助。本周早些时候,Mistral推出了Mistral Small 4,更新了其小型模型系列,据说同时针对通用聊天、编程、智能体任务和推理进行了优化。这家法国公司还发布了Forge系统,让企业能够构建自定义模型,包括可以选择其用例最能容忍的权衡的小型模型。
Multiverse的最新结果也表明与大语言模型的差距正在缩小。其最新的压缩模型HyperNova 60B 2602基于gpt-oss-120b构建——这是一个底层代码公开可用的OpenAI模型。该公司声称,它现在以更低的成本提供比其派生的原始模型更快的响应,这一优势对于智能体编程工作流程特别重要,在这种工作流程中AI自主完成复杂的多步编程任务。
让模型小到能在移动设备上运行同时仍然有用是一个巨大的挑战。Apple Intelligence通过结合设备端模型和云模型来绕过这个问题。Multiverse的CompactifAI应用程序也可以通过API将请求路由到gpt-oss-120b,但其主要目标是展示像Gilda这样的本地模型及其未来替代品具有超越成本节约的优势。
对于关键领域的工作者来说,能够在本地运行且无需连接云端的模型提供了更多隐私和韧性。但更大的价值在于这可以解锁的商业用例——例如,在无人机、卫星和其他无法保证连接性的环境中嵌入AI。
该公司已经为包括加拿大银行、博世和伊贝德罗拉在内的100多家全球客户提供服务,但扩大客户群可以帮助它获得更多资金。在去年筹集了2.15亿美元的B轮融资后,据传该公司现在正在以超过15亿欧元的估值筹集5亿欧元的新一轮融资。
Q&A
Q1:CompactifAI应用程序有什么特殊功能?
A:CompactifAI是一个AI聊天工具,类似ChatGPT,但特殊之处在于它嵌入了名为Gilda的小型模型,可以在设备本地离线运行。这意味着用户数据不会离开设备且不需要网络连接,提供更好的隐私保护。不过设备需要有足够的RAM和存储空间,否则会自动切换到云端模型。
Q2:小型AI模型相比大语言模型有哪些优势?
A:小型AI模型的主要优势包括更低的计算成本、更好的隐私保护(可本地运行)、更高的韧性(无需云连接)以及无对手方风险。Multiverse的最新压缩模型HyperNova 60B 2602声称能以更低成本提供比原始模型更快的响应,特别适合智能体编程等复杂任务。
Q3:Multiverse Computing的商业模式是什么?
A:Multiverse Computing主要面向企业客户,通过自助式API门户让开发者和企业直接访问其压缩模型。该公司已为包括加拿大银行、博世和伊贝德罗拉在内的100多家全球客户提供服务。其技术特别适用于无人机、卫星等无法保证网络连接的环境中嵌入AI应用。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.