这是苍何的第 474 篇原创!
大家好,我是消失了一段时间的苍何。
1 月 5 号,我写了篇文章,并开源了 AI 漫剧 APP,获得了很多朋友的喜欢。
![]()
然后在 GitHub 上一共获得了 764 星和 181 fork,让我有些吃惊。
![]()
说实话,这个项目远超我们的预期,甚至连歪果哥都来给我们提 issue,希望支持双语。
![]()
甚至还有老板来咨询问我卖不卖这个 APP,我说,大哥,咱都开源了,自己去整吧,不用付费,哈哈哈。
这或许就是开源的魅力吧。
但我发现,APP 还是不大方便,评论区也不少求 web 版本的。
![]()
于是,我们又花了 20 天,开源了个 Web 版本的 AI 漫剧平台,他是长这个样子的。
![]()
主打的人群还是对 AI 漫剧感兴趣的小白群体,能够一句话生成漫剧故事。
如果你不知道生成什么故事,也可以使用系统内置的模板,比如「马到成功送祝福」、「马上有美食」等新年主题的故事。
![]()
为了照顾一些朋友想要自由发挥的需求,我们还添加了自定义工作流选项,也就是从创建角色到分镜编排,再到生成镜头,最后导出,都可以自定义。
![]()
在编排的时候,你可以自定义不同的镜头,比如全景、中景、特写,可以添加镜头和场景。
![]()
可以生成不同的镜头视频。
![]()
在底层,做了很多的处理,能保证角色的一致性。
![]()
做了几个系列,分别对应 2D、3D、写实等场景。
![]()
我们做了非常多深度的调优,在保持人物一致性的同时也添加了不少细节去优化生成的效果。
![]()
下面,我来分享下在开发这个项目过程中,我们踩过的坑,和一些可能算不上什么经验的经验,另外也教下大家怎么使用。
创作和开源不易,如果文章对你有帮助,欢迎点赞转发。经验分享
我感觉最头疼的问题之一是角色一致性问题,也就是角色在不同画面中长得不一样,该如何很好的解决。
我们尝试使用了不少办法,甚至引入了本地 ComfyUI,开启锁定种子,第一张图的种子会被记录,后续所有图使用相同的种子,以保持整体风格的一致性。
![]()
总结出角色一致性最佳实践如下:
- 参考图选择:清晰、无遮挡、多角度
- 描述格式:「性别+年龄+发型+发色+眼睛+服装+特征」
- 示例:「25岁女性,黑色长直发,棕色大眼睛,穿白色衬衫和黑色西装裙,戴细框眼镜」对于镜头,考虑很多像我一样对运镜不大熟悉的小白,我们内置了 9 种标准镜头模板,AI 根据故事自动选择不同分镜的镜头。
![]()
对于生成质量上,有以下几点可以给大家分享:
- 画面描述要具体,避免模糊词汇
- 使用「锁定种子」保持风格统一
- 负面提示词排除不想要的元素
- 多生成几次,选择最满意的在镜头节奏上,建议采用如下方式:
基本原则:
- 全景→中景→特写(渐进式)
- 对话场景用过肩镜头正反打
- 情绪高潮用特写
- 场景转换用全景或框中框示例分镜节奏:
1. T1 全景俯瞰 - 城市远景(建立环境)
2. T2 环境中景 - 主角走在街上(角色入场)
3. T4 标准中景 - 主角看手机(日常动作)
4. T6 特写 - 手机屏幕显示消息(信息传递)
5. T6 特写 - 主角惊讶表情(情绪反应)
6. T8 跟随视角 - 主角奔跑(动态转场)
如何使用
我们整理了一份详细的使用指南,还没放到 GitHub,大家如果需要可以评论区留言,或者等我们推到 GitHub 哈。
先来看下整体流程:
[导入剧本] → [创建角色] → [创建场景] → [编排分镜] → [生成图片] → [生成视频] → [导出]
↓ ↓ ↓ ↓ ↓ ↓
(可选) 上传参考图 上传参考图 选择模板 AI生成 (可选)
填写描述 填写描述 写画面描述 保持一致性 ![]()
生图这里你可以选择本地 ComfyUI 的方式,也可以选择 API 的方式。
这里以 API 为例,如果你希望稳定,性价比高的 API 平台,可以试试 Atlas Cloud。
地址:https://www.atlascloud.ai?ref=AXZ9S7
在漫剧场景中稳定出图出视频很重要,而且对于内容角色的生成,最好避开接口的审查和限制规则。
Atlas Cloud 这个 API 聚合平台能很好的满足漫剧这个场景的需求,毕竟它主打的是企业级 API 聚合,拥有 300+ 知名大模型,总结下来是:稳定、易用、低价。
![]()
那该如何使用呢?注册登录后,打开控制台,新建 API 密钥。
![]()
多说一嘴,Atlas Cloud 目前注册绑卡即可白嫖 1 美元使用额度,可以免费生成不少图了。
填写名称后,点击创建:
![]()
然后复制这个 API,填入到环境变量中:
![]()
需要复制一份 env,然后把改调用方式为使用云端 API 的方式:
![]()
然后就可以启动项目,项目启动后,你可以一句话生成故事,也可以按照流程自定义,你可以先创建一个角色并添加场景:
![]()
角色描述和场景描述都可以用 AI 生成,也可以自定义更改。
然后就是对镜头进行编排,可以添加自定义镜头,描述同样也可以 AI 一键生成,不满意可以改。在这里你可以选择需要出镜的角色:
![]()
可以看到已经添加的镜头列表,有专业分镜格式的标准提示语,对于分镜的生成效果会更好。
![]()
然后就可以生成镜头和对应的分镜视频:
![]()
可以选择一键生成全部视频,这里选择 API 的方式来生成。
![]()
最后,你可以导出所有的图片包、视频包、分镜脚本,做素材备份,最后就是做视频的合成。
![]()
我们做了比较详细的产品特点说明说和使用说明书,目前还在优化中,如果你想提前看看,可以评论区告诉我。
说真的,这套系统,我认为,还是又再次满足了我做漫剧的激情,虽然我们不是专业的漫导,也非该行业的从业者。
但通过 AI 编程,我们也能做出一个,算是能满足我们需求的工具,然后去满足我们做漫剧的心。
因为是开源平台,你可以自定义各种花式玩法,觉得哪儿不满意,甚至可以让 Claude Code 帮你改。
有时候,我觉得 AI 编程最大的价值,或许在于:
满足自己的灵魂,而非取悦别人。
如果你喜欢我们的作品,也欢迎给我们 star,如果你想加入我们平台共建,也欢迎联系我。
目前平台有三个核心贡献者,分别是猫哥,蜗牛和苍何。
我们会在深夜畅聊产品的,沟通如何优化。
![]()
每当在 GitHub 上有新的进步,我们会为此而欢呼,当然,我们今年的目标是破千 star,也不知道能不能完成,哈哈哈。
![]()
当然我知道,我们做的远远不足,很多想要优化的点都还没优化,一方面是因为我们时间精力问题,另一方面,我们对漫剧这个行业的 know how 还有限。
当然了,我也在不断的学习,学习优秀的产品,学习他们如何做出精品的漫剧。
最近也在用 oiioii 来学做精品漫剧,到时候再来和大家分享了。
好啦,最后,如果你有一定的 vibe coding 能力,同时也是 AI 漫剧的热爱者,欢迎加入我们 GitHub 开源项目的共建。
感谢你喜欢我的文章,我们下一期见啦。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.