网易首页 > 网易号 > 正文 申请入驻

四两拨千斤,当超级电脑隐身:阿里云无影个人云超算「上手记」

0
分享至

作者 | 周雅

评测 | 至顶AI实验室

过去大半年,我们一直在做端侧AI算力的评测。从英伟达DGX Spark,到各家厂商的桌面AI超算,跑模型推理、测ComfyUI工作流、试各种AIGC场景。这些产品各有亮点,但测得越多,越能看清一个事实:端侧硬件很强,但并非所有人、所有阶段都适合直接「买一台」来解决问题。

比如你是一个入门级AI开发者,今天的需求只是跑一个7B参数的小模型,但几个月后你也许会想试试70B甚至更大的模型。根源是,算力需求逐级爬升,一步到位买顶配,前期利用率很低,因为你还没入门;先买个够用的,过不了多久又面临升级,因为你已经入门——这个节奏很难踩准。


再比如一个逐渐普遍的现实:你的角色可能不止一种。

这两年有个概念,叫做OPC(One Person Company),是指一个人借助AI工具,可以干传统一整个小团队的活,成为超级个体。似乎听起来很美,但它对算力的要求同样也是“一个人顶一个团队”。上午你是AI开发者,在调模型写代码;下午变成内容创作者,做AI漫剧;晚上可能还想玩一把《黑神话:悟空》放松。每个角色吃的算力完全不同,一台固定配置的机器,很难同时喂饱所有场景。

Gartner曾做过一个预测:在未来5到10年内,DaaS(桌面即服务)将成为主流,云电脑或将成为企业与组织首选的办公计算机。它背后的逻辑,其实是算力供给模式的变革——当摩尔定律的边际效应递减,而AI模型的参数量却在以摩尔定律几倍的速度膨胀时,算力必然向云端迁移。

这就是我们开始关注云端桌面AI的原因,为此我们还在朋友圈玩起了梗,话题叫做 #办公室的新玩具#。

最近,我们又拿到了一台——阿里云无影个人云超算。准确说,是在线上“开通”了一台云端的电脑,我们体验了一周,写了这篇上手记。


可以塞进衣服口袋的个人超算

阿里云无影,简单来说,这是一款可以随时随地接入的云上电脑。

它最大的特点是实现了「算力与终端的彻底解耦」,这种解耦带来了极大便利性。在我们的实际体验中,无论手头上用的是MacBook,还是Windows笔电,甚至是一台 iPad,只要装了无影客户端App,就能瞬间接入同一个云端桌面。

2020年,阿里云展示了第一代无影云电脑,它的终端是一个名片夹大小的C-Key,连接显示屏就能进入云端桌面。当时这个品类还需要反复解释,很多人把它和远程桌面画等号。四年后的2024年,无影个人版亮相,个人玩家能直接跑《黑神话:悟空》,1080P下帧率稳定在60帧。

到了CES 2026,桌面AI超算成了几乎所有PC厂商的标配,惠普把AI PC塞进了键盘里,联想让笔记本屏幕自动旋转跟踪人脸,一大批厂商基于DGX Spark推出了巴掌大的本地AI超算。在这个舞台上,连续第二年参展的阿里云作为云厂商,就拿出了无影个人云超算。

单看起来,它是一个终端硬件,叫「无影魔方ultra」,巴掌大小,比一本精装书还轻,有点像一个接口丰富的“瘦客户机”,塞进口袋也毫不费力。


但别被尺寸骗了,它背后连着的云端配置是这样的:两块RTX 5880(单卡48GB显存,Ada Lovelace架构专业级显卡)、64核vCPU,总共96GB GPU显存。


96GB 显存是什么概念?市面上顶级的消费级显卡RTX 5090也才32G显存,96GB是它的三倍,意味着你可以轻松加载100B以上参数大模型做推理,或者跑视频生成任务也不成问题,不用担心爆显存。在本地,要搭建这样一套硬件环境,成本至少要三万元以上。而在无影上,这种巨大的前期投入被消解了,它变成列表里的一个图标,躺在屏幕里任我支配,让曾经遥不可及的超级算力变得触手可及。

魔方本身不做任何计算,所有算力都在云端,可以理解为一个「无限算力的水龙头」:插上电源、连上屏幕、就能打开云端那台超级电脑、源源不断流出更高的性能。

这是因为我们开通的是双卡配置,顶配还可以选择:4块RTX 5880(合计192GB GPU显存)、96核服务器级CPU、384GB内存,这个性能参数放到大部分场景下应该都够用。


传统个人电脑是一锤子买卖,而无影的算力是弹性的,今天跑轻量任务用小规格,明天做模型训练一键切到顶配,数据通过无影存储中心无缝同步,切换过程不丢进度。

打开后台,我们可以通过「镜像管理」,分别为「云电脑」、「AI学习机」、「工作站」一键镜像多个系统,此次我们主要镜像了Windows、Linux Ubuntu、Kylin三种不同的系统进行测试。


此外,左侧列表中的「无影内容广场」,就像是一个“AI超市”,这里有大量的第三方共享镜像。想做图?选“ComfyUI-含主流模型和节点”镜像。想炼丹?选“AI-Toolkit LoRA训练”镜像。想跑模型推理或搞开发? PyTorch、TensorFlow基础框架一应俱全。甚至还有ModelScope(魔搭社区)、DiffSynth-Studio等阿里达摩院的独家生态镜像。



光看参数只是纸上谈兵,真正的考验在于实战,我们决定抛弃常规的办公场景评测,直接上强度。

实测:把96GB显存“榨干”

用目前AI圈最主流、同时也最消耗显存的ComfyUI视频生成工作流来进行极限压测,运行阿里开源的Wan 2.2 14B(万相)视频生成模型,这是一个对显存要求极高的任务,尤其是14B参数,在普通家用显卡上几乎无法全血运行。值得一提的是,wan2.2是目前最流行的开源视频大模型,没有之一,在开源领域的占比在40%以上。

我们设定了一个简单明了的提示词“马在行走,丝带飘动,表情灵动(A horse walking, ribbons flowing, vivid expression)”,分辨率设定为1280×720,开启FP8矩阵乘法优化和FLOW流匹配架构,后台日志开始飞速滚动。


模型加载阶段,即便使用了FP8量化优化,光是模型权重就占用了13629MB,将近13.6G显存。如果加上推理过程中的中间变量(KV Cache),24G显存的本地显卡不仅捉襟见肘,甚至直接爆显存。

但在无影上,日志显示当前可用显存28969MB。对于96G的总池子来说,这就像一条大河流过一个小水坝,毫无压力。

生成速度方面,核心采样过程耗时1分20秒,从点击开始到视频生成完毕,总耗时3分34秒。日志里还有一行“lowvram patches: 357”,这是针对低显存环境的自动优化补丁。对96G来说这几乎是多余的,但也说明无影在软件层面的兼容性做得足够细致。


我们至顶AI实验室的小伙伴实测,很明显的两个感受是:快、方便,因为可以直接把ComfyUI配置到自己电脑的Chrome浏览器上使用,可以理解为在你的浏览器上直接挂着ComfyUI。

更值得说的是,镜像市场里预配好的ComfyUI环境。两卡96G显存可以同时加载多个大模型和LoRA权重,不需要反复卸载和重装。这对做AI漫剧的创作者来说尤其关键。一条漫剧工作流往往要串联角色一致性模型、背景生成模型、表情控制LoRA,再接上Wan 2.2做动态视频片段,在24G显存的本地显卡上,光是模型切换就要反复腾挪,96G则可以全部常驻,专心调参出活。对于靠短视频批量生产吃饭的创作者来说,这直接决定了产能,让高端的生产力工具变得平易近人。

当然了,工作之余,这台“怪兽”能不能用来放松?

切换到云电脑模式,无影的内容广场里预置了《黑神话:悟空》、《鸣潮》、《我的世界》、《永劫无间》等15款热门游戏大作,可能之后还会上线更多游戏。


不过,当我进入其中某款游戏,登陆相关账号之后,也能直接通过账号入口登陆更多游戏。


时延,是云游戏最敏感的指标之一。根据官方给出的网络建议,要获得1080p、30fps的流畅基础体验,需要保证15Mbps以上的带宽,网络延迟低于60ms。而若要追求1080p、60fps的电竞级高帧率丝滑体验,带宽门槛则提升至25Mbps,延迟可以达到30ms以内。


这次实测下来,玩《鸣潮》这类动作游戏时操作跟手度极高,延迟基本稳定在16ms上下浮动,几乎感觉不到是在云端。在《我的世界》这种对加载速度要求较高的游戏中,大部分时间也非常流畅,只有极少数复杂场景下,时延会短暂波动到60ms左右,也不影响操作。

前面一直在用无影客户端做测试,但其实无影魔方ultra也支持多端接入,也就是说,当你只带了那一块盒子的情况下,任何一块屏幕也都能成为入口。

这在游戏场景下特别有意思:我在办公室用MacBook玩,回家路上用iPad接着玩,存档和进度无缝衔接。这也就说明,当算力在云端、延迟足够低的时候,你手里那台设备是什么品牌、什么配置,已经不重要了。屏幕就是全部。

尤其用Mac客户端接入的时候,有个细节让我印象很深:本地Mac和云端无影之间可以直接拖拽文件,操作感觉就像在同一台电脑的两个文件夹之间挪东西,用着用着会产生一种错觉,你的MacBook好像突然多长出了几块RTX 5880显卡。

还记得前面说的OPC吗?超级个体的一天可以是这样的:上午用容器模式调模型写代码,下午切到Windows环境做AIGC内容创作,晚上打开云游戏放松。一台固定配置的物理主机很难照顾到每个角色,但在无影上,切换身份就像切换频道。

更进一步而言,超级算力不再是少数专业人士或机构的专属品,而是一个能陪伴用户从好奇、探索到精通的成长伙伴。

算好经济账

性能说完,必须聊钱。无影的核心优势之一,就是将一次性的高昂硬件投资,转化为极致可控的按需付费服务,它采用了一目了然的「核时」计费模式。


根据实测后台数据,「开机」状态下,无论是云电脑还是容器,平均消耗150.82核时/小时。「关机」状态下,云电脑消耗0.06核时/小时,容器消耗0.04核时/小时。


这里有个容易被忽略的细节,如果不手动点击「关机」,后台会持续运行,会持续消耗核时。阿里云架构师告诉我们,无影的设计逻辑是:如果没有手动点击「关机」,系统会默认你可能在后台跑长任务(比如训练模型),它实则是在7*24小时工作状态。想想也合理:你花了几周配置好的炼丹环境,肯定不希望关机一次就全部清空,这些核时买的是数据安全存储和下一次启动的便利。

此外友情提醒,即便你手动点击了「关机」,后台依然会消耗极低的存储费(即上面的0.04-0.06核时),因为你的数据(硬盘、镜像、环境配置)依然占用着云端资源。下图可见,夜间时段也在消耗核时。不过换算下来,关机状态下,24小时消耗的核时总共几毛钱。如果确定不用,点击「销毁」即可。


具体花费怎么算?根据阿里云官方的说法,即便是4卡RTX 5880顶配(192GB显存),每月按量付费也仅在1000元左右。我们手上这台双卡配置,每天高强度用8小时,其余时间关机的话,月费大约500-600元。

作为对比,CES上同台亮相的DGX Spark,搭载GB10 Grace Blackwell超级芯片和128GB统一内存,单台售价3999美元起步。

但两者设计思路完全不同:DGX Spark走本地化路线,一次买断,性能固定,胜在离线可用、数据不出本机;无影走云端弹性路线,按需取用,随时升降,胜在配置天花板高、无硬件折旧。

我们也注意到,在一些公开测评中,无影顶配的综合跑分可以达到DGX Spark的数倍,而月费远低于后者的一次性购入成本。当然,两款产品面向的场景和取舍不同,直接比价未必公平。

比超级电脑多走一步

如果只是把传统PC的算力搬到了云上,无影充其量是“更方便的高性能电脑”,但无影的另一个拳头产品AgentBay,则暗示了一个更大的野心。


AgentBay是无影为AI Agent(智能体)打造的云端基础设施。通俗来说,它让AI助手获得了“手和脚”,AI不再只是坐在聊天框里回答问题,而是可以在云端沙箱里操作浏览器、控制桌面应用、执行代码、甚至操控手机界面。所有操作都在安全隔离的环境中独立运行,不影响用户自己的设备。

想象一个场景:你对AI说“帮我从这五个PDF里提取关键数据,整理成Excel,然后发邮件给团队”。过去,AI只能帮你写出提取脚本,剩下的你自己动手。有了AgentBay,AI可以在云端打开一台完整的电脑,自己操作浏览器下载文件、打开Office处理数据、登录邮箱发送,全程不需要你介入。

是不是很像最近爆火的clawdbot?没错,Agentbay也增加了内置Clawdbot模式,同时还拥有Clawdbot不具备的browser use能力和企业多Clawdbot部署能力。

这就是为什么我们在文章标题里用了「隐身」这个词。无影追求的终极形态,不是让你感觉在使用一台更强的电脑,而是让「电脑」这个概念本身逐渐消失,你只需要说出想做的事,算力、软件、环境、执行,一切在看不见的地方自动发生。

这次上手最让我印象深刻的,不是某个具体的跑分数字或者启动速度,而是一种错位感,手里握着一个比充电宝大不了多少的小方盒,屏幕上却跑着需要服务器机房才能驱动的大模型。没有风扇呼啸,没有机箱发热,连一根多余的线都不需要。

好的计算也许就像好的设计:当你不再需要思考显卡够不够、内存满不满、驱动装没装的时候,就可以把全部注意力放回到你真正想做的事上。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
48小时已过,高市没等到中国贺电,鸠山由纪夫灵魂反问,信号强烈

48小时已过,高市没等到中国贺电,鸠山由纪夫灵魂反问,信号强烈

东极妙严
2026-02-10 20:29:25
唏嘘!38岁中国教练率东道主击败祖国夺金 喜极而泣+跳上挡板庆祝

唏嘘!38岁中国教练率东道主击败祖国夺金 喜极而泣+跳上挡板庆祝

我爱英超
2026-02-10 22:21:35
NBA上演全武行,超大冲突4人驱逐!4号秀20+5破纪录难阻9连胜终结

NBA上演全武行,超大冲突4人驱逐!4号秀20+5破纪录难阻9连胜终结

锅子篮球
2026-02-10 12:14:10
女子故意扮丑去相亲,男子一眼看中,女子吃惊:他是不是太饿了

女子故意扮丑去相亲,男子一眼看中,女子吃惊:他是不是太饿了

丫头舫
2026-02-10 22:18:05
南博事件结果公布:29人被问责,81岁院长玩完,大量内幕首次披露

南博事件结果公布:29人被问责,81岁院长玩完,大量内幕首次披露

乌娱子酱
2026-02-10 13:35:31
湖北17岁女孩高考前确诊脑死亡,父母签完器官捐赠,突然接到来电

湖北17岁女孩高考前确诊脑死亡,父母签完器官捐赠,突然接到来电

明智家庭教育
2026-02-09 19:53:41
别再用现金行贿受贿了!大数据一查就现形,全程 “裸奔” 藏不住

别再用现金行贿受贿了!大数据一查就现形,全程 “裸奔” 藏不住

复转这些年
2026-02-09 23:45:54
香港房东彻底哑火了?李亚鹏和嫣然天使不仅能还上房租还要搬走了

香港房东彻底哑火了?李亚鹏和嫣然天使不仅能还上房租还要搬走了

安宁007
2026-02-10 23:05:12
开年首炸!新机官宣:2月18日,正式全球发布!

开年首炸!新机官宣:2月18日,正式全球发布!

科技堡垒
2026-02-10 12:40:28
雷军宣布初代小米SU7正式停产

雷军宣布初代小米SU7正式停产

界面新闻
2026-02-10 21:41:49
女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

汉史趣闻
2025-11-08 09:27:32
1亿英镑互换!曼联纽卡震撼互换交易将成今夏头条

1亿英镑互换!曼联纽卡震撼互换交易将成今夏头条

夜白侃球
2026-02-10 19:59:14
顾客5年点了餐厅2000次外卖,一年多没点了,餐厅老板担心他出事

顾客5年点了餐厅2000次外卖,一年多没点了,餐厅老板担心他出事

西楼知趣杂谈
2026-02-10 22:41:26
年轻有为:全国第一个90后准副厅!

年轻有为:全国第一个90后准副厅!

微微热评
2026-02-10 11:31:16
四川成都一佳人好漂亮, 身高169cm,体重48kg 美的让人移不开眼

四川成都一佳人好漂亮, 身高169cm,体重48kg 美的让人移不开眼

喜欢历史的阿繁
2026-02-07 14:21:17
女老师与学生长期开房:高颜值照流出,肮脏细节披露,官方回应

女老师与学生长期开房:高颜值照流出,肮脏细节披露,官方回应

博士观察
2026-02-10 09:56:31
北京一男子花千万买保险,105岁才能取,要求退保遭拒,法院:保险公司构成欺诈,撤销合同,退还已缴纳的200万保费

北京一男子花千万买保险,105岁才能取,要求退保遭拒,法院:保险公司构成欺诈,撤销合同,退还已缴纳的200万保费

极目新闻
2026-02-10 20:42:53
正部级易炼红被查:上月还曾露面,曾掀起长沙“史上最大规模拆违控违”行动

正部级易炼红被查:上月还曾露面,曾掀起长沙“史上最大规模拆违控违”行动

界面新闻
2026-02-10 10:40:06
南博事件终于有结果了!万万没想到,徐湖平真是幕后大佬!

南博事件终于有结果了!万万没想到,徐湖平真是幕后大佬!

青青子衿
2026-02-09 22:50:54
成本7亿,上映3天票房26.7万,徐峥懵了:内地观众怎么不买账了?

成本7亿,上映3天票房26.7万,徐峥懵了:内地观众怎么不买账了?

糊咖娱乐
2026-02-09 15:20:05
2026-02-11 04:16:49
科技行者 incentive-icons
科技行者
科技正在如何变革商业世界
7217文章数 550关注度
往期回顾 全部

科技要闻

Seedance刷屏:网友们玩疯 影视圈瑟瑟发抖

头条要闻

28岁小伙年会醉酒 被同事送回宿舍后心脏骤停死亡

头条要闻

28岁小伙年会醉酒 被同事送回宿舍后心脏骤停死亡

体育要闻

NBA上演全武行,超大冲突4人驱逐!

娱乐要闻

章子怡和马丽争影后 金像奖提名太精彩

财经要闻

雀巢中国近千经销商的“追债记”

汽车要闻

应用于190KW四驱Ultra版 方程豹钛7搭载天神之眼5.0

态度原创

本地
家居
手机
公开课
军事航空

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

家居要闻

宁静港湾 灵动与诗意

手机要闻

2026年手机行业剧透:7大信号来袭,要卷出新高度了

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

以军持续在约旦河西岸多地发动突袭

无障碍浏览 进入关怀版