网易首页 > 网易号 > 正文 申请入驻

The Human Spectrum: 在Cloud City中编织全球面孔的AI未来图景

0
分享至

本文授权转自: 阿里云设计中心 (ID: acd_design)

人工智能正以前所未有的深度和广度渗透到创意领域。它既是强大的生产力工具,也是一个向所有设计师和技术人提出新问题的复杂挑战。在刚刚结束的2025年新加坡iLight灯光节,阿里云设计部创新中心与阿里云海外市场部、行业解决方案团队深度参与了由阿里云AI技术打造的Cloud City项目,将创意体验通过AI与城市相连。

这篇复盘,是我们对这次实践的透明化全链路梳理。它记录了我们如何将一个创意通过一系列具体的技术决策和设计思考,最终落地为一个面向全球观众的真实体验。希望能为同样在AI浪潮中探索的同行们,提供一些有价值的参考。

01

从清晰的愿景

到严峻的挑战

1.为每个人讲述一个关于未来的故事


我们的核心目标很明确:将阿里云在可持续科技、可持续生活、可持续城市三大领域的应用案例,从抽象的技术概念,转化为一段与每个参与者都息息相关的个人叙事。

为此,我们设计了一条直观且富有代入感的用户体验链路:旅程从一个二维码开始,用户通过手机进入互动界面。核心步骤是拍下或上传自己的照片,这是将个人身份注入数字世界的关键一步。用户根据自己的向往,选择一个未来主题。随后,通义万相AI会即时启动,将用户的肖像与宏大的未来场景融合,生成一段专属的动态影像。最终,这段影像会投射到现场巨大的LED装置上,汇入由成千上万参与者共同创造的光影画卷——“The Human Spectrum”之中。

2.我们必须解决的四个核心问题

一个看似流畅的体验背后,往往是无数个被解决的难题。在项目启动之初,我们识别出了四个必须攻克的核心挑战:

风格的统一性:AI生成内容具有天然的随机性。我们如何确保18个不同场景的画面,能在视觉风格、色调和细节丰富度上保持高度一致,形成一个有凝聚力的整体艺术作品?

身份的保真度:新加坡是一个多元文化交汇之地,现场观众来自世界各地。我们的换脸技术必须超越“像不像”的层面,做到精准保留不同人种、肤色、面部轮廓的独特性。一个“算法审美”下的平均脸,对这个项目来说是不可接受的失败。

动态的合理性:从静态图片到动态视频,最大的风险是出现不自然、甚至怪诞的动作。如何确保AI生成的动画,其人物动态既符合物理逻辑,又具备美感,而不是简单的“图片会动”?

体验的流畅度:这是一个公共艺术装置,用户的耐心极其有限。整个后台的AI计算流程,包括换脸和视频生成,必须在极短的时间内完成。如何在保证高质量输出的前提下,将等待时间压缩到用户可接受的范围内?

02

在技术与设计之间

寻找最优路径

面对这些挑战,我们设计了一套包含“文生图”、“换脸”、“图生视频”三阶段的AI生产链路。以下是我们解决每个问题的具体思路和决策过程。

第一阶段

文生图——为AI的创造力建立框架

为了解决风格统一性的问题,我们必须给AI的“创造力”设定一个清晰的框架。我们采用的方法是——结构化Prompt工程,这可以理解为我们与AI之间的一份“创作合同”。我们将一个完整的Prompt指令,拆解为七个逻辑清晰的模块:A.通用描述、B.构图、C.景别、D.核心描述、E.画面辅助信息、F.氛围词、G.后缀。

固定模块(A,B,C):这部分内容在所有场景中保持不变,如同合同里的基础条款,规定了画面的最低品质标准、渲染细节和统一的构图语言。

可变模块(D,E,F,G):这部分则像合同的定制条款,允许我们根据每个场景的具体需求,灵活地调整画面内容、光影氛围和艺术风格。


这种方法,让我们从被动等待AI灵感迸发的“抽卡者”,转变为能够主动引导、精准控制产出质量的“对话者”。通过这种系统性的工作方式,我们高效地生成并筛选出18张风格统一、细节丰富、且深度契合主题的核心场景图,为整个项目奠定了坚实的视觉基础。

第二阶段

换脸——在技术选型中注入人文关怀

换脸环节,是整个项目中技术与“保真度”要求结合最紧密的地方。我们的决策过程分为两步:

首先是技术选型。我们对市面上四种主流工作流(如SDXL + ControlNet、SDXL + InstantID 、Flux pulid、Flux Redux + ACE++)进行了横向评测,核心考量指标是:生成效果、处理速度、以及对单张输入图片的友好度。

Flux系列虽然在质感上表现出色,但其处理时长远超我们的要求。InstantID在人脸一致性上很强,但它更依赖多图输入,不符合我们项目的用户流程。最终,SDXL+ControlNet 工作流,以其在速度和单图换脸效果上的综合优势,成为我们的选择。

其次是优化与测试。选定工具后,真正的挑战在于如何让它能公平、准确地处理来自全球的面孔。我们为此建立了一个庞大的测试库。

在测试中我们发现一个关键细节:ControlNet的Lineart模型更适合我们的需求。因为Lineart模型能更好地保留不同人脸轮廓的立体感,这对保持人物特征的真实性至关重要。通过大量的参数调试,我们最终固化了一套鲁棒性极强的工作流。这背后是我们坚守的一个原则:技术不仅要实现功能,更要体现尊重。我们要守护的,正是这幅“人类光谱”中,每一片独一无二的色彩。

第三阶段

图生视频——当遇到AI的不完美,让设计思维来破局

最后一步是将换脸后的静态图生成动态视频。我们的技术基础是WAN 2.1模型,并在ComfyUI中搭建工作流。然而,初步测试就给我们泼了冷水: 采用社区主流的I2V-14B-480P模型,生成一段5秒视频需要5分半钟,这对于现场互动是灾难性的,

不仅生成时间远超预期,更出现了严重的颜色漂移问题。这迫使我们深入开源社区,进行了一次广泛的技术选型和迭代测试。

〇 探索与验证:我们测试了包括 PAI-Wan2.1-Fun 和广受好评的 SkyReels 系列在内的多种社区优化方案。最终,Wan2_1-SkyReels-V2-I2V-14B-540P 模型在速度和效果上达到了我们需要的最佳平衡点。

〇 参数权衡:确定基础模型后,我们对采样步数steps和分辨率进行了精细的成本效益分析。我们发现,将步数从20提升到30,能以可接受的时间成本(约增加30秒)换来肉眼可见的细节改善,这是一个值得的投资。而继续提升分辨率,则会导致耗时急剧增加,性价比不高。

〇 策略创新——“空间换时间”:这是我们实现突破的关键。我们不再执着于直接生成高分辨率、高帧率的视频,而是采用了一种更聪明的组合策略:

I.快速生成核心素材: 我们让模型先生成一个较低分辨率(640x368)、中等帧数(33帧)的视频。这个过程相对快速。

II.高效后处理: 随后,我们利用两个独立的、速度极快的SOTA模型进行增强。使用 GIMM-VFI 进行视频插帧,让画面变得流畅;再使用 Omni-SR 进行超分辨率采样,将画质提升到高清标准。

通过这一系列从模型选型、参数权衡到工作流创新的组合拳,我们最终实现了惊人的效率飞跃:将最初超过320秒的生成时间,优化为仅需151.8秒即可生成一段质量更高(1280x736)的高清视频,效率提升超过47%。这在技术上已是巨大的进步,但对于现场用户的心理感受来说,150秒的等待依然是一个可能导致体验崩塌的巨大风险。

为了保证动作的合理性,我们同样对图生视频的Prompt工程进行了拆解,分为主体场景、运动、镜头语言、氛围词、风格化,进行精细控制,反复调试并记录效果最好的seed值。

我们意识到,当遇到AI的不完美,此时需要设计思维来破局。我们引入了用户体验设计中一个非常重要的原则——“峰终定律”(Peak-End Rule)。 基于此,我们对体验流程做了一次关键的重塑:我们不再让用户被动地等待一个最终结果。而是在他上传照片后的十几秒内,系统会率先生成并展示一张效果惊艳的换脸静态图。

这就是我们为用户精心设计的“峰值体验”,一个即时的、可立即分享的积极反馈。当用户沉浸在获得这张精美图片的喜悦中时,耗时较长的视频生成任务才在后台继续进行。这个方案,本质上是用设计智慧重塑了用户的“心理时间”。它让我们明白,最好的解决方案,有时并非来自更强的算力,而是来自对人更深刻的理解。

03

生成式AI的浪潮

我们走向哪里


这次 iLight 新加坡灯光艺术节AI创新体验,对创新中心国际设计组来说,是一次宝贵的、高强度的综合实践。它让我们对AI时代的设计工作有了更深的思考:

〇 设计师的角色正在演进。 我们正从传统的“视觉创作者”,向“AI沟通者”和“系统设计者”转变。我们不仅要具备审美能力,更需要具备理解技术链路、定义清晰规则、并与AI高效协作的能力。这无疑极大地拓展了我们专业能力的边界。

〇 设计的核心价值愈发凸显。 AI可以高效地执行任务,但它无法定义目标,无法注入价值观,也无法共情用户的感受。在换脸环节对“保真度”的坚持,在体验流程中对“峰终定律”的应用,这些都证明了设计的核心价值——以人为本的思考与决策——在AI时代不仅没有被削弱,反而变得更加重要。

AI不是我们的替代者,而是我们能力的放大器。我们无需焦虑,也无需盲从。关键在于,我们能否驾驭好这个强大的伙伴,用它去解决更复杂的问题,创造更有意义的体验。 我们相信,未来的设计,将属于那些能够深刻理解技术、并始终将人的价值置于首位的设计师。感谢这次宝贵的实践机会,也感谢所有合作伙伴的支持。

在科技浪潮奔涌向前的当下,人工智能正深刻重塑我们的生活与工作。人机之间的关系,也从简单交互迈向深度协作。想知道如何在这一趋势下把握体验设计的新方向吗?2025年10月将在北京举办的IXDC国际体验设计大会聚焦“人机共生:人工智能时代人机协作新范式”,作为全球领先的用户体验创新盛会,它将汇聚前沿理念与实践。一起来关注这场盛会,探索人机协作的无限可能。

文章转载:阿里云设计中心,版权归原作者所有

原文链接:https://mp.weixin.qq.com/s/WLPrWX0bjvNt8QjUr-_Ctw

版权声明:“IXDC”所推送的文章,除非确实无法确认,我们都会注明作者和来源,本公众号对转载、分享的内容、陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完善性提供任何明或暗示的保证,仅供读者参考。部分文章推送时未能与原作者取得联系,若涉及内容或作品等版权问题,烦请原作者联系我们,给出内容所在的网址并提供相关证明资料,我们会核查后立即更正或者删除有关内容!本公众号不承担任何责任,并拥有对此声明的最终解释权。

联系微信:18802086168

联系电话:18802086168

编排 | 罗家玉

终审 | 苏 菁

点这里,学习更多设计知识!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
世体:若有合适报价库库会考虑离队,巴萨是他的理想下家之一

世体:若有合适报价库库会考虑离队,巴萨是他的理想下家之一

懂球帝
2026-04-28 19:15:05
金庸最荒唐的设定,把最美容颜给了妖女,却把最丑的脸给了女侠

金庸最荒唐的设定,把最美容颜给了妖女,却把最丑的脸给了女侠

耳东文史
2026-04-28 00:04:21
受贿数额特别巨大,国家铁路局原局长费东斌被提起公诉

受贿数额特别巨大,国家铁路局原局长费东斌被提起公诉

每日经济新闻
2026-04-27 18:07:34
《菩提临世》下架,漫剧迎来大规模整治,业内称上万部受波及

《菩提临世》下架,漫剧迎来大规模整治,业内称上万部受波及

钛媒体APP
2026-04-28 15:41:12
1983年,陈云亲自批示:立即枪毙广东县委书记王仲,原因为何?

1983年,陈云亲自批示:立即枪毙广东县委书记王仲,原因为何?

莫地方
2026-04-20 09:30:18
熬猪油,最忌直接下锅炒,大厨:牢记4步,猪油洁白如玉,很好吃

熬猪油,最忌直接下锅炒,大厨:牢记4步,猪油洁白如玉,很好吃

阿龙美食记
2026-04-22 12:09:11
2.17亿美元首周票房:我们为何为"删减版"买单

2.17亿美元首周票房:我们为何为"删减版"买单

追星雷达站
2026-04-27 16:45:12
C罗时代皇马西甲前33轮进球从未少于80,C罗离队后仅1次超70球

C罗时代皇马西甲前33轮进球从未少于80,C罗离队后仅1次超70球

懂球帝
2026-04-28 11:06:11
美国总统特使:意大利顶替伊朗参加世界杯概率超50%,决定权在我们手上

美国总统特使:意大利顶替伊朗参加世界杯概率超50%,决定权在我们手上

懂球帝
2026-04-28 09:54:01
斯坦丘:现在的中超比之前更难踢了,大连球迷是全世界最好的

斯坦丘:现在的中超比之前更难踢了,大连球迷是全世界最好的

懂球帝
2026-04-28 16:56:08
中方宣布:普雷沃、黄英贤将访华

中方宣布:普雷沃、黄英贤将访华

极目新闻
2026-04-27 15:27:45
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
广州地铁8号线东延段全面开建!167亿打通番禺海珠,这些板块要火

广州地铁8号线东延段全面开建!167亿打通番禺海珠,这些板块要火

周哥一影视
2026-04-28 18:05:41
1998年我吹牛说要娶女老师为妻,最后她真的成了我的妻子

1998年我吹牛说要娶女老师为妻,最后她真的成了我的妻子

千秋文化
2026-04-17 20:06:49
宠物狗撕咬居民羊羔,玉龙雪山景区:已报警

宠物狗撕咬居民羊羔,玉龙雪山景区:已报警

上观新闻
2026-04-28 14:51:03
三年抱两!香港豪门千金宣布二胎平安产子,亿万豪门血脉稳固延续

三年抱两!香港豪门千金宣布二胎平安产子,亿万豪门血脉稳固延续

章眽八卦
2026-04-28 09:59:19
做完手术人就废了,这5种手术不需要做,别让无知害了自己

做完手术人就废了,这5种手术不需要做,别让无知害了自己

医学科普汇
2026-01-29 06:25:03
美国唯一一位六星上将,现代美国陆军之父潘兴,究竟有多牛?

美国唯一一位六星上将,现代美国陆军之父潘兴,究竟有多牛?

阿器谈史
2026-04-28 09:56:42
人活着,其实就3件事,能想通了,一辈子都顺了

人活着,其实就3件事,能想通了,一辈子都顺了

金沛的国学笔记
2026-04-27 16:53:55
广州一公园3对黑水鸡夫妇产下16枚鸟蛋,一窝产在水中的龙船船头,街坊:这个家很广东

广州一公园3对黑水鸡夫妇产下16枚鸟蛋,一窝产在水中的龙船船头,街坊:这个家很广东

新浪财经
2026-04-28 16:52:03
2026-04-28 19:40:49
美啊教育
美啊教育
创意设计与生活美学最佳平台
6064文章数 1549关注度
往期回顾 全部

科技要闻

10亿周活目标落空!传OpenAI爆发内部分歧

头条要闻

15岁女儿遭同学性侵杀害 父亲终日借酒浇愁饮酒300斤

头条要闻

15岁女儿遭同学性侵杀害 父亲终日借酒浇愁饮酒300斤

体育要闻

季后赛最新局势:雷霆4-0晋级首队 4队3-1

娱乐要闻

蔡卓妍官宣结婚,老公比她小10岁

财经要闻

政治局会议:加强算力网等规划建设

汽车要闻

拒绝疯狂套娃!现代艾尼氪金星长在未来审美点上

态度原创

健康
旅游
亲子
艺术
公开课

干细胞治疗烧烫伤三大优势!

旅游要闻

文化和旅游部:鼓励各地因地制宜延长热门景区营业时间

亲子要闻

拍了几年的急救视频,模特小朋友长大了!拍到异物卡喉气道梗阻的急救方法更新了,气道完全梗阻五次拍背+五...

艺术要闻

深圳极具未来感的“外星”建筑亮相

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版