你是否也曾被一段视频震撼——明明知道是AI生成的,却怎么看都像真人?超写实AI视频正悄然改变内容创作的边界,甚至让人惊呼:“手搓电影”的时代已经到来。今天,我将以自己创作的《李清照的少女时代》为例,一步步拆解这背后的制作秘密。
“虚拟演员”从头演到尾
做短视频,就要用到AI的首尾帧功能。短片或电影都是由一个镜头一个镜头组成的,而用 AI 生成视频也要一个镜头一个镜头地生成。每一段视频又都是由首尾帧图片进行组合,首帧图是镜头的开始,尾帧图是镜头的结束。第一段视频的尾帧图,又是下一段视频的首帧图,以此类推。当把所有小段视频做好后,连缀起来,就成为一个完整视频了。
![]()
比如《李清照的少女时代》,就是用五张图四段视频,制作完成的。
以《如梦令·常记溪亭日暮》这首词为脚本,展开视频场景。
这首词是李清照18岁到达汴京(今开封)不久写的,是对故乡往事的回忆。时间向前推,于是把人物身份设定在一个北宋的16岁少女身上。
根据词义,设定了五张图,分别是傍晚湖中游,沉醉于景色,该回家了,走错路了,惊得白鹭飞起来这五个场景。再按图片首尾相接的方式,完成了视频创作。
在制作AI短视频过程中,最难一点就是保持前后人物的一致性。总不能第一段的角色,到了第二段就面目全非了。可以做到两点:一是在每次图片生成时,就把核心图(或叫原始图,下文会有介绍)作为参考图,这样就不会出错;二是在提示词里,也要明确提及,“严格参考提供的参考图,脸型、五官比例、眉眼结构、鼻子与嘴唇形态高度一致,不要生成陌生面孔,不要偏离参考图人物”。如此一来,就能做到一个人物贯穿始终了。
超写实视频离不开8个要素
说完了人物的一致性,接下来重点就是如何做到画面超写实。如果提示词不够专业,那么再好的AI软件,生成的也都是大陆货。所以,提示词非常重要。
![]()
就拿《李清照的少女时代》来说,首先要通过 AI 生图软件生成一个视频的主角人物,即少年李清照。可以参考历史背景进行描述,中间不断修正,最终确定。这就有点像拍电影之前演员的定妆照。
接下来,就要用 AI 写作工具开始首帧图的提示词。先把照片喂给模型,然后要求它按照人物的核心特征、妆发与表情、服装与造型、动作与位置、环境与道具、镜头、光影色调风格以及负向控制八个要素,逐一进行描述。这个描述越详细,越具体,生成出来的图就会越合理,越逼真。这一步虽然烦琐,但它是整个视频的基础。
核心特征,是指这个角色的国籍、年龄、性别等核心要素。
妆发与表情,是人物什么样的发型,有没有化妆,肤色如何,有没有痘痘,毛孔粗细。表情是不是自然,眼睛向哪里看等等。
服装与造型,是指穿的什么衣服,服装的材质与颜色,整体穿衣风格。
动作与位置,是指人物在哪里,在干什么。人物的脸、身体处于参照物的什么位置,比例如何。
环境与道具,是指人物的背景是什么,观众除了主要人物,还能看到谁?背景装饰是怎样的。
镜头,是远景还是近景,仰拍还是俯拍,微距还是特写。
光影及色调风格,是整体风格暖色还是冷色,科技感还是动漫感,白天还是夜晚等。
负向控制,是指不希望出现的情况。比如背景里的人物、与剧情年代不符的产品等。
从一张“定妆照”开始
了解了超写实提示词,那就可以着手开干了。可事实上,即便告诉你每个要素是什么作用,但实际操作起来还是有难度。那有没有简单办法,在已有的基础上进行调整呢?当然有。
![]()
前面不是已经生成了一张参考图了吗?也就是相当于演员的定妆照。就可以把它喂给AI,反向读取它的内容,再按八个要素提取提示词。
比如把该图片上传到参考图位置,写上如下提示词:按照人物的核心特征、妆发与表情、服装与造型、动作与位置、环境与道具、镜头描述、光影色调与风格 以及负向控制的维度定义,写出合适的提示词。
结果生成如下内容:
### 正向提示词
**核心特征**:一位16岁左右的东亚少女,皮肤细腻带自然雀斑,脸型柔和,五官舒展有清冷疏离感。
**妆发与表情**:黑长直发自然垂落,发丝略带湿意的慵懒凌乱感;无妆感素颜,眼神平静淡漠,嘴唇微抿,表情放空无情绪波动。
**服装与造型**:身着浅豆绿色宋制汉服,内层为棉质交领中衣,外层是半透薄纱对襟短衫,下搭同色系渐变褶裙,面料垂坠柔软,整体风格素净清雅。
**动作与位置**:盘腿稳坐于窄木船船头,双手自然搭在膝上,身体正对镜头,姿态松弛沉静。
**环境与道具**:江南水乡的荷塘湖面,水面漂浮大片荷叶与零星粉白荷花;远处湖岸有一座中式四角凉亭,背景是茂密的林木。
**镜头描述**:中近景人像,镜头平视与人物视线齐平,浅景深突出主体,背景自然虚化。
**光影色调与风格**:黄昏蓝调时刻,低角度暖金色夕阳在水面形成狭长波光,柔和侧逆光勾勒人物发丝轮廓,整体色调以清冷的青蓝为主,点缀暖橙霞光,呈现电影感纪实风格,画面细腻有颗粒感,氛围静谧、惆怅且充满诗意。
### 负向控制提示词
避免浓妆、夸张表情、现代服饰;避免背景出现现代建筑、游客、船只等杂物;避免过度磨皮、高饱和色彩、虚假光影;避免画面模糊、构图倾斜、人物比例失调。
这个生成提示词是通用的,再根据后面每张图片的表情、动作、背景等进行调整即可。
从一张定妆照到五张场景图,从一段提示词到四段连贯视频——超写实AI视频的制作,既是技术,也是艺术。它不仅需要你理解AI的逻辑,更考验你对人物、场景与情感的把握。如果你也想创造属于自己的“数字角色”,不妨从一句清晰的提示词开始。说不定,下一个让人惊叹的AI短片就出自你的手。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.