四两拨千斤，当超级电脑隐身：阿里云无影个人云超算「上手记」|显卡|内存|云端|知名企业

分享至

作者 | 周雅

评测 | 至顶AI实验室

过去大半年，我们一直在做端侧AI算力的评测。从英伟达DGX Spark，到各家厂商的桌面AI超算，跑模型推理、测ComfyUI工作流、试各种AIGC场景。这些产品各有亮点，但测得越多，越能看清一个事实：端侧硬件很强，但并非所有人、所有阶段都适合直接「买一台」来解决问题。

比如你是一个入门级AI开发者，今天的需求只是跑一个7B参数的小模型，但几个月后你也许会想试试70B甚至更大的模型。根源是，算力需求逐级爬升，一步到位买顶配，前期利用率很低，因为你还没入门；先买个够用的，过不了多久又面临升级，因为你已经入门——这个节奏很难踩准。

再比如一个逐渐普遍的现实：你的角色可能不止一种。

这两年有个概念，叫做OPC（One Person Company），是指一个人借助AI工具，可以干传统一整个小团队的活，成为超级个体。似乎听起来很美，但它对算力的要求同样也是“一个人顶一个团队”。上午你是AI开发者，在调模型写代码；下午变成内容创作者，做AI漫剧；晚上可能还想玩一把《黑神话：悟空》放松。每个角色吃的算力完全不同，一台固定配置的机器，很难同时喂饱所有场景。

Gartner曾做过一个预测：在未来5到10年内，DaaS（桌面即服务）将成为主流，云电脑或将成为企业与组织首选的办公计算机。它背后的逻辑，其实是算力供给模式的变革——当摩尔定律的边际效应递减，而AI模型的参数量却在以摩尔定律几倍的速度膨胀时，算力必然向云端迁移。

这就是我们开始关注云端桌面AI的原因，为此我们还在朋友圈玩起了梗，话题叫做 #办公室的新玩具#。

最近，我们又拿到了一台——阿里云无影个人云超算。准确说，是在线上“开通”了一台云端的电脑，我们体验了一周，写了这篇上手记。

可以塞进衣服口袋的个人超算

阿里云无影，简单来说，这是一款可以随时随地接入的云上电脑。

它最大的特点是实现了「算力与终端的彻底解耦」，这种解耦带来了极大便利性。在我们的实际体验中，无论手头上用的是MacBook，还是Windows笔电，甚至是一台 iPad，只要装了无影客户端App，就能瞬间接入同一个云端桌面。

2020年，阿里云展示了第一代无影云电脑，它的终端是一个名片夹大小的C-Key，连接显示屏就能进入云端桌面。当时这个品类还需要反复解释，很多人把它和远程桌面画等号。四年后的2024年，无影个人版亮相，个人玩家能直接跑《黑神话：悟空》，1080P下帧率稳定在60帧。

到了CES 2026，桌面AI超算成了几乎所有PC厂商的标配，惠普把AI PC塞进了键盘里，联想让笔记本屏幕自动旋转跟踪人脸，一大批厂商基于DGX Spark推出了巴掌大的本地AI超算。在这个舞台上，连续第二年参展的阿里云作为云厂商，就拿出了无影个人云超算。

单看起来，它是一个终端硬件，叫「无影魔方ultra」，巴掌大小，比一本精装书还轻，有点像一个接口丰富的“瘦客户机”，塞进口袋也毫不费力。

但别被尺寸骗了，它背后连着的云端配置是这样的：两块RTX 5880（单卡48GB显存，Ada Lovelace架构专业级显卡）、64核vCPU，总共96GB GPU显存。

96GB 显存是什么概念？市面上顶级的消费级显卡RTX 5090也才32G显存，96GB是它的三倍，意味着你可以轻松加载100B以上参数大模型做推理，或者跑视频生成任务也不成问题，不用担心爆显存。在本地，要搭建这样一套硬件环境，成本至少要三万元以上。而在无影上，这种巨大的前期投入被消解了，它变成列表里的一个图标，躺在屏幕里任我支配，让曾经遥不可及的超级算力变得触手可及。

魔方本身不做任何计算，所有算力都在云端，可以理解为一个「无限算力的水龙头」：插上电源、连上屏幕、就能打开云端那台超级电脑、源源不断流出更高的性能。

这是因为我们开通的是双卡配置，顶配还可以选择：4块RTX 5880（合计192GB GPU显存）、96核服务器级CPU、384GB内存，这个性能参数放到大部分场景下应该都够用。

传统个人电脑是一锤子买卖，而无影的算力是弹性的，今天跑轻量任务用小规格，明天做模型训练一键切到顶配，数据通过无影存储中心无缝同步，切换过程不丢进度。

打开后台，我们可以通过「镜像管理」，分别为「云电脑」、「AI学习机」、「工作站」一键镜像多个系统，此次我们主要镜像了Windows、Linux Ubuntu、Kylin三种不同的系统进行测试。

此外，左侧列表中的「无影内容广场」，就像是一个“AI超市”，这里有大量的第三方共享镜像。想做图？选“ComfyUI-含主流模型和节点”镜像。想炼丹？选“AI-Toolkit LoRA训练”镜像。想跑模型推理或搞开发？ PyTorch、TensorFlow基础框架一应俱全。甚至还有ModelScope（魔搭社区）、DiffSynth-Studio等阿里达摩院的独家生态镜像。

光看参数只是纸上谈兵，真正的考验在于实战，我们决定抛弃常规的办公场景评测，直接上强度。

实测：把96GB显存“榨干”

用目前AI圈最主流、同时也最消耗显存的ComfyUI视频生成工作流来进行极限压测，运行阿里开源的Wan 2.2 14B（万相）视频生成模型，这是一个对显存要求极高的任务，尤其是14B参数，在普通家用显卡上几乎无法全血运行。值得一提的是，wan2.2是目前最流行的开源视频大模型，没有之一，在开源领域的占比在40%以上。

我们设定了一个简单明了的提示词“马在行走，丝带飘动，表情灵动（A horse walking, ribbons flowing, vivid expression）”，分辨率设定为1280×720，开启FP8矩阵乘法优化和FLOW流匹配架构，后台日志开始飞速滚动。

模型加载阶段，即便使用了FP8量化优化，光是模型权重就占用了13629MB，将近13.6G显存。如果加上推理过程中的中间变量（KV Cache），24G显存的本地显卡不仅捉襟见肘，甚至直接爆显存。

但在无影上，日志显示当前可用显存28969MB。对于96G的总池子来说，这就像一条大河流过一个小水坝，毫无压力。

生成速度方面，核心采样过程耗时1分20秒，从点击开始到视频生成完毕，总耗时3分34秒。日志里还有一行“lowvram patches: 357”，这是针对低显存环境的自动优化补丁。对96G来说这几乎是多余的，但也说明无影在软件层面的兼容性做得足够细致。

我们至顶AI实验室的小伙伴实测，很明显的两个感受是：快、方便，因为可以直接把ComfyUI配置到自己电脑的Chrome浏览器上使用，可以理解为在你的浏览器上直接挂着ComfyUI。

更值得说的是，镜像市场里预配好的ComfyUI环境。两卡96G显存可以同时加载多个大模型和LoRA权重，不需要反复卸载和重装。这对做AI漫剧的创作者来说尤其关键。一条漫剧工作流往往要串联角色一致性模型、背景生成模型、表情控制LoRA，再接上Wan 2.2做动态视频片段，在24G显存的本地显卡上，光是模型切换就要反复腾挪，96G则可以全部常驻，专心调参出活。对于靠短视频批量生产吃饭的创作者来说，这直接决定了产能，让高端的生产力工具变得平易近人。

当然了，工作之余，这台“怪兽”能不能用来放松？

切换到云电脑模式，无影的内容广场里预置了《黑神话：悟空》、《鸣潮》、《我的世界》、《永劫无间》等15款热门游戏大作，可能之后还会上线更多游戏。

不过，当我进入其中某款游戏，登陆相关账号之后，也能直接通过账号入口登陆更多游戏。

时延，是云游戏最敏感的指标之一。根据官方给出的网络建议，要获得1080p、30fps的流畅基础体验，需要保证15Mbps以上的带宽，网络延迟低于60ms。而若要追求1080p、60fps的电竞级高帧率丝滑体验，带宽门槛则提升至25Mbps，延迟可以达到30ms以内。

这次实测下来，玩《鸣潮》这类动作游戏时操作跟手度极高，延迟基本稳定在16ms上下浮动，几乎感觉不到是在云端。在《我的世界》这种对加载速度要求较高的游戏中，大部分时间也非常流畅，只有极少数复杂场景下，时延会短暂波动到60ms左右，也不影响操作。

前面一直在用无影客户端做测试，但其实无影魔方ultra也支持多端接入，也就是说，当你只带了那一块盒子的情况下，任何一块屏幕也都能成为入口。

这在游戏场景下特别有意思：我在办公室用MacBook玩，回家路上用iPad接着玩，存档和进度无缝衔接。这也就说明，当算力在云端、延迟足够低的时候，你手里那台设备是什么品牌、什么配置，已经不重要了。屏幕就是全部。

尤其用Mac客户端接入的时候，有个细节让我印象很深：本地Mac和云端无影之间可以直接拖拽文件，操作感觉就像在同一台电脑的两个文件夹之间挪东西，用着用着会产生一种错觉，你的MacBook好像突然多长出了几块RTX 5880显卡。

还记得前面说的OPC吗？超级个体的一天可以是这样的：上午用容器模式调模型写代码，下午切到Windows环境做AIGC内容创作，晚上打开云游戏放松。一台固定配置的物理主机很难照顾到每个角色，但在无影上，切换身份就像切换频道。

更进一步而言，超级算力不再是少数专业人士或机构的专属品，而是一个能陪伴用户从好奇、探索到精通的成长伙伴。

算好经济账

性能说完，必须聊钱。无影的核心优势之一，就是将一次性的高昂硬件投资，转化为极致可控的按需付费服务，它采用了一目了然的「核时」计费模式。

根据实测后台数据，「开机」状态下，无论是云电脑还是容器，平均消耗150.82核时/小时。「关机」状态下，云电脑消耗0.06核时/小时，容器消耗0.04核时/小时。

这里有个容易被忽略的细节，如果不手动点击「关机」，后台会持续运行，会持续消耗核时。阿里云架构师告诉我们，无影的设计逻辑是：如果没有手动点击「关机」，系统会默认你可能在后台跑长任务（比如训练模型），它实则是在7*24小时工作状态。想想也合理：你花了几周配置好的炼丹环境，肯定不希望关机一次就全部清空，这些核时买的是数据安全存储和下一次启动的便利。

此外友情提醒，即便你手动点击了「关机」，后台依然会消耗极低的存储费（即上面的0.04-0.06核时），因为你的数据（硬盘、镜像、环境配置）依然占用着云端资源。下图可见，夜间时段也在消耗核时。不过换算下来，关机状态下，24小时消耗的核时总共几毛钱。如果确定不用，点击「销毁」即可。

具体花费怎么算？根据阿里云官方的说法，即便是4卡RTX 5880顶配（192GB显存），每月按量付费也仅在1000元左右。我们手上这台双卡配置，每天高强度用8小时，其余时间关机的话，月费大约500-600元。

作为对比，CES上同台亮相的DGX Spark，搭载GB10 Grace Blackwell超级芯片和128GB统一内存，单台售价3999美元起步。

但两者设计思路完全不同：DGX Spark走本地化路线，一次买断，性能固定，胜在离线可用、数据不出本机；无影走云端弹性路线，按需取用，随时升降，胜在配置天花板高、无硬件折旧。

我们也注意到，在一些公开测评中，无影顶配的综合跑分可以达到DGX Spark的数倍，而月费远低于后者的一次性购入成本。当然，两款产品面向的场景和取舍不同，直接比价未必公平。

比超级电脑多走一步

如果只是把传统PC的算力搬到了云上，无影充其量是“更方便的高性能电脑”，但无影的另一个拳头产品AgentBay，则暗示了一个更大的野心。

AgentBay是无影为AI Agent（智能体）打造的云端基础设施。通俗来说，它让AI助手获得了“手和脚”，AI不再只是坐在聊天框里回答问题，而是可以在云端沙箱里操作浏览器、控制桌面应用、执行代码、甚至操控手机界面。所有操作都在安全隔离的环境中独立运行，不影响用户自己的设备。

想象一个场景：你对AI说“帮我从这五个PDF里提取关键数据，整理成Excel，然后发邮件给团队”。过去，AI只能帮你写出提取脚本，剩下的你自己动手。有了AgentBay，AI可以在云端打开一台完整的电脑，自己操作浏览器下载文件、打开Office处理数据、登录邮箱发送，全程不需要你介入。

是不是很像最近爆火的clawdbot？没错，Agentbay也增加了内置Clawdbot模式，同时还拥有Clawdbot不具备的browser use能力和企业多Clawdbot部署能力。

这就是为什么我们在文章标题里用了「隐身」这个词。无影追求的终极形态，不是让你感觉在使用一台更强的电脑，而是让「电脑」这个概念本身逐渐消失，你只需要说出想做的事，算力、软件、环境、执行，一切在看不见的地方自动发生。

这次上手最让我印象深刻的，不是某个具体的跑分数字或者启动速度，而是一种错位感，手里握着一个比充电宝大不了多少的小方盒，屏幕上却跑着需要服务器机房才能驱动的大模型。没有风扇呼啸，没有机箱发热，连一根多余的线都不需要。

好的计算也许就像好的设计：当你不再需要思考显卡够不够、内存满不满、驱动装没装的时候，就可以把全部注意力放回到你真正想做的事上。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.