本文授权转自: 阿里云设计中心 (ID: acd_design)
人工智能正以前所未有的深度和广度渗透到创意领域。它既是强大的生产力工具,也是一个向所有设计师和技术人提出新问题的复杂挑战。在刚刚结束的2025年新加坡iLight灯光节,阿里云设计部创新中心与阿里云海外市场部、行业解决方案团队深度参与了由阿里云AI技术打造的Cloud City项目,将创意体验通过AI与城市相连。
这篇复盘,是我们对这次实践的透明化全链路梳理。它记录了我们如何将一个创意通过一系列具体的技术决策和设计思考,最终落地为一个面向全球观众的真实体验。希望能为同样在AI浪潮中探索的同行们,提供一些有价值的参考。
01
从清晰的愿景
到严峻的挑战
1.为每个人讲述一个关于未来的故事
我们的核心目标很明确:将阿里云在可持续科技、可持续生活、可持续城市三大领域的应用案例,从抽象的技术概念,转化为一段与每个参与者都息息相关的个人叙事。
为此,我们设计了一条直观且富有代入感的用户体验链路:旅程从一个二维码开始,用户通过手机进入互动界面。核心步骤是拍下或上传自己的照片,这是将个人身份注入数字世界的关键一步。用户根据自己的向往,选择一个未来主题。随后,通义万相AI会即时启动,将用户的肖像与宏大的未来场景融合,生成一段专属的动态影像。最终,这段影像会投射到现场巨大的LED装置上,汇入由成千上万参与者共同创造的光影画卷——“The Human Spectrum”之中。
2.我们必须解决的四个核心问题
一个看似流畅的体验背后,往往是无数个被解决的难题。在项目启动之初,我们识别出了四个必须攻克的核心挑战:
〇风格的统一性:AI生成内容具有天然的随机性。我们如何确保18个不同场景的画面,能在视觉风格、色调和细节丰富度上保持高度一致,形成一个有凝聚力的整体艺术作品?
〇身份的保真度:新加坡是一个多元文化交汇之地,现场观众来自世界各地。我们的换脸技术必须超越“像不像”的层面,做到精准保留不同人种、肤色、面部轮廓的独特性。一个“算法审美”下的平均脸,对这个项目来说是不可接受的失败。
〇动态的合理性:从静态图片到动态视频,最大的风险是出现不自然、甚至怪诞的动作。如何确保AI生成的动画,其人物动态既符合物理逻辑,又具备美感,而不是简单的“图片会动”?
〇体验的流畅度:这是一个公共艺术装置,用户的耐心极其有限。整个后台的AI计算流程,包括换脸和视频生成,必须在极短的时间内完成。如何在保证高质量输出的前提下,将等待时间压缩到用户可接受的范围内?
02
在技术与设计之间
寻找最优路径
面对这些挑战,我们设计了一套包含“文生图”、“换脸”、“图生视频”三阶段的AI生产链路。以下是我们解决每个问题的具体思路和决策过程。
第一阶段
文生图——为AI的创造力建立框架
为了解决风格统一性的问题,我们必须给AI的“创造力”设定一个清晰的框架。我们采用的方法是——结构化Prompt工程,这可以理解为我们与AI之间的一份“创作合同”。我们将一个完整的Prompt指令,拆解为七个逻辑清晰的模块:A.通用描述、B.构图、C.景别、D.核心描述、E.画面辅助信息、F.氛围词、G.后缀。
〇固定模块(A,B,C):这部分内容在所有场景中保持不变,如同合同里的基础条款,规定了画面的最低品质标准、渲染细节和统一的构图语言。
〇可变模块(D,E,F,G):这部分则像合同的定制条款,允许我们根据每个场景的具体需求,灵活地调整画面内容、光影氛围和艺术风格。
这种方法,让我们从被动等待AI灵感迸发的“抽卡者”,转变为能够主动引导、精准控制产出质量的“对话者”。通过这种系统性的工作方式,我们高效地生成并筛选出18张风格统一、细节丰富、且深度契合主题的核心场景图,为整个项目奠定了坚实的视觉基础。
第二阶段
换脸——在技术选型中注入人文关怀
换脸环节,是整个项目中技术与“保真度”要求结合最紧密的地方。我们的决策过程分为两步:
首先是技术选型。我们对市面上四种主流工作流(如SDXL + ControlNet、SDXL + InstantID 、Flux pulid、Flux Redux + ACE++)进行了横向评测,核心考量指标是:生成效果、处理速度、以及对单张输入图片的友好度。
Flux系列虽然在质感上表现出色,但其处理时长远超我们的要求。InstantID在人脸一致性上很强,但它更依赖多图输入,不符合我们项目的用户流程。最终,SDXL+ControlNet 工作流,以其在速度和单图换脸效果上的综合优势,成为我们的选择。
其次是优化与测试。选定工具后,真正的挑战在于如何让它能公平、准确地处理来自全球的面孔。我们为此建立了一个庞大的测试库。
在测试中我们发现一个关键细节:ControlNet的Lineart模型更适合我们的需求。因为Lineart模型能更好地保留不同人脸轮廓的立体感,这对保持人物特征的真实性至关重要。通过大量的参数调试,我们最终固化了一套鲁棒性极强的工作流。这背后是我们坚守的一个原则:技术不仅要实现功能,更要体现尊重。我们要守护的,正是这幅“人类光谱”中,每一片独一无二的色彩。
第三阶段
图生视频——当遇到AI的不完美,让设计思维来破局
最后一步是将换脸后的静态图生成动态视频。我们的技术基础是WAN 2.1模型,并在ComfyUI中搭建工作流。然而,初步测试就给我们泼了冷水: 采用社区主流的I2V-14B-480P模型,生成一段5秒视频需要5分半钟,这对于现场互动是灾难性的,
不仅生成时间远超预期,更出现了严重的颜色漂移问题。这迫使我们深入开源社区,进行了一次广泛的技术选型和迭代测试。
〇 探索与验证:我们测试了包括 PAI-Wan2.1-Fun 和广受好评的 SkyReels 系列在内的多种社区优化方案。最终,Wan2_1-SkyReels-V2-I2V-14B-540P 模型在速度和效果上达到了我们需要的最佳平衡点。
〇 参数权衡:确定基础模型后,我们对采样步数steps和分辨率进行了精细的成本效益分析。我们发现,将步数从20提升到30,能以可接受的时间成本(约增加30秒)换来肉眼可见的细节改善,这是一个值得的投资。而继续提升分辨率,则会导致耗时急剧增加,性价比不高。
〇 策略创新——“空间换时间”:这是我们实现突破的关键。我们不再执着于直接生成高分辨率、高帧率的视频,而是采用了一种更聪明的组合策略:
I.快速生成核心素材: 我们让模型先生成一个较低分辨率(640x368)、中等帧数(33帧)的视频。这个过程相对快速。
II.高效后处理: 随后,我们利用两个独立的、速度极快的SOTA模型进行增强。使用 GIMM-VFI 进行视频插帧,让画面变得流畅;再使用 Omni-SR 进行超分辨率采样,将画质提升到高清标准。
通过这一系列从模型选型、参数权衡到工作流创新的组合拳,我们最终实现了惊人的效率飞跃:将最初超过320秒的生成时间,优化为仅需151.8秒即可生成一段质量更高(1280x736)的高清视频,效率提升超过47%。这在技术上已是巨大的进步,但对于现场用户的心理感受来说,150秒的等待依然是一个可能导致体验崩塌的巨大风险。
为了保证动作的合理性,我们同样对图生视频的Prompt工程进行了拆解,分为主体场景、运动、镜头语言、氛围词、风格化,进行精细控制,反复调试并记录效果最好的seed值。
我们意识到,当遇到AI的不完美,此时需要设计思维来破局。我们引入了用户体验设计中一个非常重要的原则——“峰终定律”(Peak-End Rule)。 基于此,我们对体验流程做了一次关键的重塑:我们不再让用户被动地等待一个最终结果。而是在他上传照片后的十几秒内,系统会率先生成并展示一张效果惊艳的换脸静态图。
这就是我们为用户精心设计的“峰值体验”,一个即时的、可立即分享的积极反馈。当用户沉浸在获得这张精美图片的喜悦中时,耗时较长的视频生成任务才在后台继续进行。这个方案,本质上是用设计智慧重塑了用户的“心理时间”。它让我们明白,最好的解决方案,有时并非来自更强的算力,而是来自对人更深刻的理解。
03
生成式AI的浪潮
我们走向哪里
这次 iLight 新加坡灯光艺术节AI创新体验,对创新中心国际设计组来说,是一次宝贵的、高强度的综合实践。它让我们对AI时代的设计工作有了更深的思考:
〇 设计师的角色正在演进。 我们正从传统的“视觉创作者”,向“AI沟通者”和“系统设计者”转变。我们不仅要具备审美能力,更需要具备理解技术链路、定义清晰规则、并与AI高效协作的能力。这无疑极大地拓展了我们专业能力的边界。
〇 设计的核心价值愈发凸显。 AI可以高效地执行任务,但它无法定义目标,无法注入价值观,也无法共情用户的感受。在换脸环节对“保真度”的坚持,在体验流程中对“峰终定律”的应用,这些都证明了设计的核心价值——以人为本的思考与决策——在AI时代不仅没有被削弱,反而变得更加重要。
AI不是我们的替代者,而是我们能力的放大器。我们无需焦虑,也无需盲从。关键在于,我们能否驾驭好这个强大的伙伴,用它去解决更复杂的问题,创造更有意义的体验。 我们相信,未来的设计,将属于那些能够深刻理解技术、并始终将人的价值置于首位的设计师。感谢这次宝贵的实践机会,也感谢所有合作伙伴的支持。
在科技浪潮奔涌向前的当下,人工智能正深刻重塑我们的生活与工作。人机之间的关系,也从简单交互迈向深度协作。想知道如何在这一趋势下把握体验设计的新方向吗?2025年10月将在北京举办的IXDC国际体验设计大会聚焦“人机共生:人工智能时代人机协作新范式”,作为全球领先的用户体验创新盛会,它将汇聚前沿理念与实践。一起来关注这场盛会,探索人机协作的无限可能。
文章转载:阿里云设计中心,版权归原作者所有
原文链接:https://mp.weixin.qq.com/s/WLPrWX0bjvNt8QjUr-_Ctw
版权声明:“IXDC”所推送的文章,除非确实无法确认,我们都会注明作者和来源,本公众号对转载、分享的内容、陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完善性提供任何明或暗示的保证,仅供读者参考。部分文章推送时未能与原作者取得联系,若涉及内容或作品等版权问题,烦请原作者联系我们,给出内容所在的网址并提供相关证明资料,我们会核查后立即更正或者删除有关内容!本公众号不承担任何责任,并拥有对此声明的最终解释权。
联系微信:18802086168
联系电话:18802086168
编排 | 罗家玉
终审 | 苏 菁
点这里,学习更多设计知识!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.