![]()
一家靠稳定币年赚62亿美元的公司,突然把开源AI框架甩到了开发者脸上。不收钱,不设限,甚至能让你的旧手机跑起本地大模型。
这听起来像加密货币玩家的又一次概念炒作。但Tether这次拿出的QVAC开发工具包,内核是llama.cpp的分支,代码实打实躺在GitHub上。CEO保罗·阿尔多伊诺的原话是:「当前把所有决策路由到中心化服务器的模式,物理定律本身就决定了这是条死路。」
62亿美元利润背后的「物理定律焦虑」
Tether的财务数据堪称印钞机。2024年上半年净赚52亿美元,全年预计突破62亿。这些钱几乎全部来自USDT稳定币的储备利息——用户存进来100美元,Tether买成美债吃息,自己几乎零风险坐收渔利。
但阿尔多伊诺显然不想只当「 crypto 世界的余额宝」。他在2024年把公司重组为四大板块:稳定币、金融、能源、人工智能。QVAC就是AI板块的拳头产品。
这个命名本身就很Tether风格。QuantumVerse Automatic Computer,量子宇宙自动计算机——典型的加密行业造词癖。但剥开名字看骨架:SDK基于llama.cpp,语音用whisper.cpp,翻译用Firefox开源的Bergamot,全是成熟的开源组件重新打包。
真正的差异化在于peer-to-peer(点对点)层。Tether把区块链时代的去中心化执念,完整移植到了AI架构里。模型分发、推理计算、甚至未来的训练微调,都被设计成节点互助模式。一个节点掉线,其他节点自动补位,「AI云大脑」持续运转。
这种设计直接怼向OpenAI和Anthropic的软肋。GPT-4每轮对话的推理成本约0.01-0.06美元,Claude 3 Opus更贵。用户越多,中心化厂商的算力账单越厚。Tether的解法是让算力成本「社会化」——用你的手机、我的笔记本、他的树莓派,拼成一张去中心化的推理网络。
「写一次,跑到处」的开发者诱惑
跨平台兼容是QVAC的另一个卖点。iOS、Android、Windows、macOS、Linux,同一套代码无需修改。这对独立开发者意味着:再也不用为五个平台维护五个代码库。
Tether列出的消费级功能清单很常规:文本聊天、摘要、邮件读写、图像生成、语音对话。但实现路径完全不同——全部本地运行,或点对点分布式运行,不强制调用云端API。
这里有个微妙的商业暗示。当前AI应用的典型模式是:前端免费或低价,后端绑定OpenAI/Claude的API密钥,成本随用户量线性膨胀。QVAC试图切断这根脐带,让开发者用零边际成本的方式提供AI功能。
当然,理想很丰满。本地大模型的性能天花板明显,7B参数的Llama 3在手机上跑,智力水平约等于GPT-3.5的70%。但Tether的赌注是:足够便宜、足够隐私、足够抗审查,这三张牌能撬动特定场景。
比如医疗咨询。你的症状数据不必上传到OpenAI的服务器,只在本地模型处理。再比如企业内网。银行、军工、政府机构的敏感文档,可以彻底隔绝公网运行。这些场景对模型精度要求不高,但对数据主权极度敏感。
去中心化AI的「冷启动悖论」
Tether的路线图里藏着一句关键承诺:「未来几个月到几年,点对点集群将支持去中心化训练、微调和推理。」
这句话翻译成人话:现在发布的只是推理层,训练层还在画饼。而AI行业的常识是,训练成本才是大头。Llama 3 405B的训练消耗了3.8e25 FLOPs,按AWS按需实例计价超过1亿美元。分布式训练能省多少?理论上有上限,通信开销和梯度同步的瓶颈很难突破。
更现实的挑战是网络效应。一个去中心化推理网络的价值,取决于节点数量和质量。早期节点少,响应慢,体验差,留不住用户。留不住用户,就更吸引不到新节点。这是所有P2P系统的经典死亡螺旋。
Tether的解法是「透明切换」。用户无需感知自己连的是中心化服务还是去中心化网络,框架自动选择最优路径。这降低了尝鲜门槛,但也模糊了产品定位——你到底是OpenAI的替代品,还是OpenAI的备用通道?
阿尔多伊诺的愿景更宏大:「数十亿人类与数十亿自主机器、数万亿AI代理共享星球。」这种表述和Sam Altman的「智能时代」 rhetoric 异曲同工,只是把「中心化AGI」换成了「分布式多智能体」。
开源框架背后的算力暗战
QVAC选择完全开源,许可证是MIT。这比Meta的Llama系列更激进——后者虽然开放权重,但商用超过7亿用户需申请授权。Tether的姿态是:随便用,随便改,不用打招呼。
这种策略的代价是控制力归零。任何人可以fork代码,剥离Tether的品牌和P2P层,做成纯本地AI工具。但收益也明显:快速建立开发者生态,让QVAC成为「设备端AI」的事实标准。
竞争对手不会坐视。苹果有Core ML和Neural Engine的软硬一体优势,谷歌有Gemini Nano和Android生态的渗透力,高通在推AI Stack抢占边缘计算入口。Tether的差异化武器只有一张:真正的去中心化,以及加密货币行业特有的「监管套利」经验。
后者常被低估。Tether在稳定币战场积累了十年与各国监管周旋的经验,知道如何在灰色地带构建全球网络。这种能力移植到AI基础设施,可能意味着:一个更难被封杀、更难被断服的分布式算力市场。
想象一个场景:某国政府屏蔽OpenAI和Anthropic的API。当地开发者用QVAC搭建替代服务,模型权重通过IPFS或类似协议流通,推理任务在境内节点完成。这种抗审查性,中心化厂商永远无法提供。
开发者正在用脚投票
GitHub仓库的星标数和issue活跃度,是检验开源项目生命力的硬指标。QVAC发布首周的社区反馈呈现两极:加密原住民狂热追捧,传统AI开发者冷眼旁观。
一个典型的批评是:「这是llama.cpp套壳加P2P网络层,没有核心技术创新。」支持者反驳:「苹果也是BSD套壳,不影响iOS改变世界。」
更务实的观察来自独立开发者社区。有人用QVAC把Llama 3 8B塞进2019年的iPhone 11,推理速度每秒8个token,堪堪可用。有人在树莓派5上跑通语音助手,延迟3秒,但完全不依赖网络。这些案例验证了Tether的核心主张:旧设备+本地模型=能用的AI。
企业端的试探更谨慎。一家欧洲金融科技公司的CTO在开发者论坛留言:「我们在评估用QVAC处理客户KYC文档的本地预处理,敏感数据不出境是硬需求。但生产环境部署至少要等6个月,看安全审计结果。」
这种观望态度合理。Tether的信用背书是稳定币业务,但稳定币本身就在多国监管显微镜下。2024年,美国财政部、欧盟MiCA框架、香港金管局轮番施压,USDT的合规成本持续攀升。AI框架能否在这种背景下获得企业信任,仍是未知数。
阿尔多伊诺的回应是加速开源节奏。QVAC Fabric的代码提交频率在发布后两周内超过每日一次,文档和示例项目快速扩充。这种「代码说话」的策略,和当年Linux、Android的早期打法一致:先让开发者跑起来,生态自然生长。
一个值得注意的细节是模型分发机制。QVAC内置的「去中心化模型分发」原语,允许节点之间 relay 模型权重文件。这实际上构建了一个抗审查的模型流通网络,大文件传输不依赖中心化CDN。
对于被主流平台封禁的开源模型(比如某些未经RLHF对齐的「原始」版本),这种网络可能成为地下流通渠道。Tether没有公开鼓励这种用途,但技术架构上完全支持。
这种「工具中性」立场,让QVAC在AI安全社区引发争议。支持者认为是保护开源精神的必要代价,反对者担忧成为有害模型扩散的基础设施。争论本身,或许就是Tether想要的话题热度。
当一家稳定币巨头把年利润的零头投入AI基础设施,它买的不是技术领先,而是一张「去中心化叙事」的期权。这张期权能否兑现,取决于多少开发者愿意相信:未来的AI世界,不该只有OpenAI和谷歌两个房东。
你的旧手机里,会住进一个不需要联网、不需要订阅、不会被审查的AI助手吗?还是说,便利性终究会压倒一切,让我们继续把数据喂给硅谷的服务器农场?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.