大家好,我是袋鼠帝
大家最近应该都被云南大神MX-Shell花3000制作的《丧尸清道夫》刷屏了吧。他做的这个抖音400多万点赞的AI视频,真的非常牛逼。
![]()
甚至连PJ Ace(好莱坞AI制片人、Genre.ai创始人)都全网求联系方式,想给它发offer
![]()
AI时代靠的是想象力跟执行力,真的,这句话已经快说烂了,但我觉得就是真理。
我之前看了一下他的直播,他说他今年1月份才开始接触AI这一块东西,都是看着各大博主自学AI视频制作的。并表示这个视频没有使用大量首尾帧,大部分都是用描述(Prompt)。
![]()
这里面最难的其实是一致性的保持,还有,各种角色站位的控制。说实话,难度堪比在LoL里面把把拿5杀。。
MX-Shell在直播中分享的:角色站位控制这块,核心是“脑海中先有画面,再用准确的构图/景别术语把它描述出来”。可以画黑白草图作为辅助工具,但他推崇的依然是强悍的纯文字镜头描述能力。
描述这个东西就很虚了,语言功底不好一点都表达的不到位。“比如主角A站在配角B的东南方,C仰头49度看xxxx...”
这个普通人还真很难学啊,我也没学会。
而且文字描述的话,虽然能释放模型的潜力,但很多时候还是要靠抽卡才行,这也是为什么他最终花了3000块,3000块对于企业来说肯定已经是非常小的投入了,但是对于大部分普通人来说,还是太贵了。
画黑白草图呢,我觉得是比较适合我(普通人)的方法,但有时候AI脑子一抽,会把草图上的铅笔线条当成材质直接贴到最终画面里,搞得成片崩坏..
主要是目前AI视频制作,并不是大家想象的那么容易,在一些场景里面需要反复抽卡,很蓝瘦:
比如,空间关系、人物站位、镜头角度靠 prompt 描述很抽象,AI 经常理解偏。
比如两个人对话,本来想要前后、对面、错位站,AI 生成出来可能肩并肩...
比如 AI 视频切镜头后,背景结构、空间方向、光影容易变。镜头一切就像换了房间
总之就是想法有了,但把脑子里面的画面精准呈现给AI这一步,就能把你卡到怀疑人生。
然后我最近找到了一个适合普通人的,非常方便的新方案。
就是使用3D构图,把脑子里的画面,通过3D构图展示出来,然后通过多视角截图,快速生成可被 AI准确理解的构图参考。
![]()
而且操作也很简单,直接通过搭积木的方式,拖拉拽搭建故事空间就行了。
下面这个视频,是用3D构图来制作的一个多视角机位,多站位的小作品,请大家欣赏:
我用的工具就是LibTV的导演台。
![]()
最重要的是它非常直观,而且据说直接给这种简单的3D构图,在生视频的时候会更节省算力。
这样的方式,可以更精准的把你脑子里面的画面呈现给AI,从而减少跟AI沟通的成本(不管是时间还是金钱成本)。
其实就还是老生常谈的一图胜千言,只不过这个图,不需要我们描述让AI生成,也不需要我们手动画,而是搭积木的形式。拖拉拽就搞定了。
我用导演台深度参与制作了上面那个轻松的小短片。先给大家展示一下今天这个视频我的画布:
![]()
然后,我带大家先简单体验一下我的使用过程(如何使用导演台?)
它真的把AI视频创作中,最令人头疼的问题:空间关系、人物站位、镜头角度给解决了~
完整的使用路径就五步:进入导演台 -> 添加3D角色or模型 -> 调整元素位置 -> 设置拍摄机位&截图 -> 发送到画布,作为参考图生成。
打开导演台之后,左边是元素清单,右边是属性面板。
添加角色的时候支持人体素模、几何模型、群众阵列和本地上传,大部分场景前两种就够了。
![]()
调站位就三个操作:移动(V)、旋转(R)、缩放(S,shift等比),跟3D软件的逻辑差不多,但比Blender简单太多。毕竟不是让你建模,就是搭个积木。
![]()
导演台中人物动作还原度很高还是比较高的,但是偶尔还是会出现风格变化和人设图不统一的情况,要么就是因为融入了背景图,所以人物位置会稍微有一点偏差。
这时我们可以在提示词中加入“保持所有人物角色原本形象和材质不要改变,保持 人物位置不改变"。加上这句话之后效果就好很多了。
![]()
另外,如何添加几何模型道具位置和机位?请看VCR~
机位和截图,我觉得这块是最舒服的
导演视角下随便转,如果觉得某个角度不错,直接点「截图」就一键创建机位+自动截图。
还能切到机位视角预览、调FOV(视野角度)、选不同注视坐标。
![]()
所有截图统一管理,一键就能发送到画布。
并且同一个场景,正面、侧面、俯视、近景,一组分镜需要的角度分分钟全截出来。这个效率还真挺香的。
![]()
然后我发现,提示词的权重高于导演台姿势控制
下面这张我原本在导演台中的设定是机器人坐着烤烧烤,男主站着问路。但输入提示词的时候粗心了,我输成了"机器人站在烧烤炉后烤烧烤",结果恰到好处。主角的挠头姿势也保持住了。
![]()
所以如果你想做的动作在导演台里暂时没有预设姿势,或者空间感不好不知道怎么摆,也没关系。可以先把人物位置摆好,用文字去描述你想要的动作,一样能出效果。
或者,在角色的右边,姿势设定里面,包含了角色任何姿势的精细化设定,你也可以通过调节各个部位的参数,来进一步调整角色的姿势,巨灵活。
![]()
再说几个我觉得特别适合用导演台的场景:
两个人对话的镜头:可能提示词写半天,结果 AI 生成出来俩人肩并肩站着♂️。导演台可以直接把人摆好:谁在前、谁在后、面朝哪、距离多远,AI 看图生成,就很稳了。
复杂构图参考: 车旁对峙、会议室对话、多人围观……这类镜头靠提示词根本描述不清楚。同样可以先在导演台里用素模搭一个"构图草稿"。
![]()
还有多机位分镜:同一个场景可能需要正面、侧面、俯视、近景好几个角度,以前每个角度得重新描述一遍。导演台里搭好一次,切换机位直接截图,一套分镜的参考图两下就搞定了。
我觉得导演台这个功能做出来还挺有意义的。它没有试图解决所有问题,但把"脑子里有画面但表达不出来"这个最难受的环节给打通了。
导演思维还是得自己有,但至少表达的门槛降下来了。
说到LibTV这个平台,导演台只是它画布里的一个节点。但它整个工具链做得确实挺全面的,从图片生成、视频生成到工作流画布,AI视频创作的主要环节基本都覆盖了。
![]()
Seedance 2.0也接进来了,VIP不用排队,最低也只要0.36元/秒。
![]()
还有一个对小白贼友好的功能,我特别推荐:解析视频。
当你看到别人生成了一段非常厉害的视频,你不知道他是怎么做到的。
你可以把视频丢进去解析,它能反向推导出一批详细的分镜脚本。
比如我把《丧尸清道夫》完整视频上传到画布中,然后点击「解析」
![]()
这就像是给了你一份参考答案,你可以顺藤摸瓜去学习别人的运镜和提示词技巧。然后你可以在这基础上内化出自己的东西,这简直就是学习神器!
PS:不过一次大概只能拆解30秒左右的视频,如果比较长,可以分多次
![]()
另外,必须提一句,LibTV不仅仅是一个供人类操作的图形化创作平台。它同样也能给(Agent)使用。
LibTV提供了专属的CLI/Skill:
![]()
这意味着,你可以把它提供给你的龙虾(OpenClaw)、Claude Code、Codex等Agent工具调用。
最近他们还有个活动挺值的,创作会员低至3.7折,最多送160条Seedance 2.0。团队版更猛,最多送2000条。在做AI视频的朋友可以去看看。
我之前也用过不少AI视频相关的工具和平台,LibTV算是在这个方向做得比较好、一直在迭代的那种,想认真搞AI视频创作的朋友深度用一用liblib.tv。
LibTV怎么用? 袋鼠帝、kiki,公众号:袋鼠帝AI客栈
「最后」
我发现当AI越来越强,越来越好用之后,那些有想法,有执行力的人,真的很难被埋没了。
以前会说,是金子总会发光的。
但是在AI时代,是金子,想不发光都难。
MX-Shell 1月份才开始接触AI,3000块做出上亿播放量的作品,靠的是极强的导演思维和文字描述能力。我们不一定有那个文字功底,但导演台这种工具把"构图表达"这个门槛往下打了一截,你不用再跟AI玩文字游戏了,直接搭出来就行。
在AI高速发展的这几年,真的存在太多机会了。只要你善于思考,加上超强的执行力,我觉得一定有机会像MX-Shell一样找到属于自己的发光发热的位置。
我是袋鼠帝,一个致力于帮你把AI变成生产力的博主。我们下期见~
>/ 本期作者:袋鼠帝、KiKi
能看到这里的都是凤毛麟角的存在!
如果觉得不错,随手点个赞、在看、转发三连吧~
如果想第一时间收到推送,也可以给我个星标⭐
谢谢你耐心看完我的文章~
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.