网易首页 > 网易号 > 正文 申请入驻

好家伙,海螺直接拍了个AI版的《教父》

0
分享至

奇月 发自 凹非寺量子位 | 公众号 QbitAI

家人们,是这样的,前几天上网冲浪,刷到了这样一条视频。

虽然能看出来是AI生成的,但本来就很喜欢《教父》这种暗黑风的我,还是被这短短90秒硬控住了……

话不多说,大家先一起欣赏一下:

https://mp.weixin.qq.com/s/L-RMFzQOLyuKk1EGFhk0qA?token=967695030&lang=zh_CN

这昏暗的环境、严肃的人物表情、还有紧张的剧情,太对味儿了。

这条短片里,一共有四个主人公,还涉及很多复杂的场景和光效,画面竟然一直都没崩。

深扒了背后的AI创作流程之后,结果让我大受震撼啊!

本来以为这片子的工作流可能就和日常的AI生成一样,无限地修改提示词+抽卡,抽出一个能用的首帧图片,再图生视频。

反复上面的流程,凑出所有视频段落,拼起来,这样才能勉强保持跨片段保持人物一致性。

比如主角老头在14秒、1分10秒都出现了,如果你想让人物的脸不崩,就得无限抽卡+图生视频循环,或者是训个LoRA模型,把人物框定好:

但这个短片的制作流程,只用了这四张人物照片,再配上一些文本Prompt,就可以导演出来了。

也就是说,相当于直接给你提供了4位现成的演员,你只用做导演指挥他们就好了??

这比之前靠玄学出片的AI短片制作来说,真的是降维打击了啊。

不卖关子,其实这是MiniMax家的海螺AI最近推出的新功能——主体参考,你只需要上传需要的人物图片,它就可以自动识别出人物,让他们听你的话,帮你演戏!

有了这个功能,短剧制作的成本将会大幅降低,整个制作流程都可能会被AI视频模型颠覆。

怎么做到的?

下面我们来详细了解一下“主体参考”功能的原理。

它最大的创新之处,就在于把“文生视频”和“图生视频”的优点给结合起来了

文生视频的优点,是通用性、泛化性和组合性都不错,可光靠文字来控制,细节上很容易出现偏差。

图生视频虽然能让生成的视频紧紧遵循首帧图片,非常精准,但问题是自由度不高,而且首帧图片的精准信息和文字描述之间也可能存在矛盾。

针对这些问题,MiniMax公司深入分析了自家的三模态自研基座模型,他们认为,这三个模态的智能不是绝对独立的,其实是能互相促进、共同进步的

语言本质上是智能的通用工具,大语言模型对视觉和语言概念的跨模态底层理解能力也是很强的。

在这个想法的基础上,海螺AI自研了基于单张图片的主体参考功能,非常接近人类处理视觉和文字信息的方式。

比如面对一张图片,模型会先把图片里的“主体”这个视觉信息提取出来,然后用户就能用文字自由地去操控,还能把主体的视觉细节还原得特别准。

这样一来,一个主体既能精准地保持原来的样子不变,又能按照用户的想法自由地做出各种行为、表现出各种状态。

经过测试,哪怕只用一张人物图片,也能实现精准复原。

比如只上传一张经典meme人物,就能生成多场景视频:

你可以让金馆长在酒吧里跳舞、或者吃点意大利面:

生成视频的质量,和给到图片的清晰度直接相关,测试下来,即使梗图不算清晰,海螺AI也能保持人物还原,动作自然。

再来和另一条技术路线训练LoRA人像模型对比一下。

MiniMax也研究过LoRA方案,但他们发现,相比于精调的LoRA,主体参考使用的图片参考方案生成效果上限能够更高

此外,主体参考的方案,相较LoRA 方案,也大幅降低了用户输入与计算成本

同样的视频效果,海螺需要1张图片输入+正常一次生成的成本,而使用LoRA方案的,则需数十个特定视频、超100倍计算量来实现微调,外加数十分钟等待时间。

目前海螺AI最先开放的主体参考能力主要针对单个人物,后续还会拓展到多人、物体、场景等更多样化的参考。

外星人风格的也可以生成:

如果你也想尝试一下主体参考的新功能,操作方法也非常简单。

你只需要在海螺AI创意视频平台中选择“主体参考”创作区后,上传一张图片即可创建参考角色。

然后在下面的文本框内输入Prompt,就可以生成富有创意的高质量视频。

而且在使用过程中,我们还注意到它在以下方面生成效果也非常出色。

人物面部细节一致

在用人物特写生成视频时,可以看到人物的面部细节在多个视频中都能得到很好的保留。

不仅是轮廓和五官,甚至包括眉毛、眼影、发型都有很强的一致性。

尤其是角色脸上这三颗痣,在3个视频结果中都保持的固定的位置,且清晰可见,目前只有海螺AI一家模型可以做到这样的细节一致性。

复杂姿势与表情

在动作,环境上,也能够实现自由组合,甚至用表情传递情绪,也可以实现。你可以操控人物生成更多复杂的姿势,比如低头、侧脸等等。

先来让图片中的女士挑战一下低头的动作:

Prompt:在这略显空旷的房间之中,一位长发女人静静地伫立着。光线透过窗户,洒在她的身上,勾勒出一道落寞的身影。只见她身形略显僵硬,双肩微微下沉,仿佛承受着无形的重压。她的头颅缓缓低下,动作缓慢而沉重,如同被岁月的沧桑拖拽着。颈部的肌肉紧绷,青筋隐约浮现,似乎在极力克制着某种情绪。下巴逐渐贴近胸膛,几缕发丝从额前滑落,遮住了她大半的面容,让人难以看清她此刻的神情。

在侧脸这个比较小众的主题上,海螺AI也做到了让镜头的转换和头发的运动非常丝滑:

Prompt:自然风光背景,画面中一位女性线条利落却又不失柔和的侧脸,宛如一幅精美的古典画卷在眼前徐徐展开。她的额头宽阔而平整,长发被风吹动。高挺的鼻梁犹如一座峻峭的山峰,从额头笔直地延伸而下,线条优美。她转过头,对着镜头,优雅地笑了一下。

AI出片,还是要技术解决应用瓶颈

Sora的横空出世点亮了视频生成的赛道。而纵观技术和应用发展现状,目前主要瓶颈在于,技术真正进入生产环境,实现行业应用。而要让视频真正承担起叙事任务,就必须把人物一致性的门槛打下来

可以说,有了“主体参考”功能后 ,突破了跨视频片段的主体一致性的创作痛点,让用户在进行更完整内容表达的视频创作时,可将更多精力放在内容表达上。

对于AI 短剧、AI 广告等以人物为主体的行业,这个功能可以大大提升创作效率,降低创作成本,带来更大的想象空间,推动行业进入 “人人都是会掌镜、懂拍摄的好导演” 的新时代。

MiniMax虽然是一家成立刚刚3年的国内初创公司(成立于2021年12月),但在AI领域已取得显著成就。

海螺AI在海外超 180 个国家和地区也收获了热度与认可,成为海外AI爱好者口中的热词,也被视为代表中国先进 AI 技术的代名词。

视频模型海螺AI,自推出起就表现非常出色,在VBench、Video Arena等多个国际权威评测榜单的第三方独立测试中综合排名第一,在画面质量、连贯性、流畅性等多维度处于领先地位。

######AI产品榜12月榜单

在国内视频模型领域,目前主要流行的产品多是头部互联网大厂 “大力出奇迹” 的成果,包括快手的可灵和未来值得期待的字节即梦AI等。

MiniMax则凭借团队科研实力、前瞻的技术路线选择和多模态并举的策略,成为创业公司中唯一能和大厂掰手腕的一家

未来,视频模型行业的竞争会更加多样化,包括个性化创作的制定、生产流程的专业度、应用的行业、各家公司的技术积累和创新等等。

也将更加注重与其他技术的协同发展,如与智能体、虚拟现实、增强现实技术结合,为用户带来更沉浸式的感受。

期待有更多像MiniMax一样注重技术创新、勇于探索的公司,能为我们带来更加智能和优质的模型体验。

点击官网链接即可体验“主体参考”新功能哦:

国内用户创作入口:hailuoai.com/video/create

海外用户创作入口:hailuoai.video/create

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
青岛农商行因拖欠500万元物业费被起诉 原董事长年薪曾达195.84万

青岛农商行因拖欠500万元物业费被起诉 原董事长年薪曾达195.84万

林子说事
2026-03-26 13:57:35
生育大局已定:如不出意外,2026年起中国人口将迎来3大变化

生育大局已定:如不出意外,2026年起中国人口将迎来3大变化

蜉蝣说
2026-03-17 15:58:31
勇士双杀篮网锁定附加赛,桑托斯生涯之夜,库明加换波神真赚了?

勇士双杀篮网锁定附加赛,桑托斯生涯之夜,库明加换波神真赚了?

司峰阿道
2026-03-26 14:45:09
张雪峰心源性猝死多严重,那个最快护士就有多“牛逼”(张雪峰的惯用词)

张雪峰心源性猝死多严重,那个最快护士就有多“牛逼”(张雪峰的惯用词)

天山箴言录
2026-03-26 16:45:50
中国平安2025年扣非净利润显著增长22.5% 现金分红489亿元连续14年上涨

中国平安2025年扣非净利润显著增长22.5% 现金分红489亿元连续14年上涨

财联社
2026-03-26 18:05:05
兄弟俩同出宁海路,一个资产清零,一个负债率28%稳坐前500强

兄弟俩同出宁海路,一个资产清零,一个负债率28%稳坐前500强

花小猫的美食日常
2026-03-26 07:41:46
特斯拉 Model 3 标准版要来了!配置太离谱

特斯拉 Model 3 标准版要来了!配置太离谱

花果科技
2026-03-25 16:23:07
“公路闪电”终于换代,但我觉得不如丰田

“公路闪电”终于换代,但我觉得不如丰田

差评XPIN
2026-03-26 09:57:20
固态电池神话破灭?比亚迪三款千公里续航实车已杀到!

固态电池神话破灭?比亚迪三款千公里续航实车已杀到!

芭比衣橱
2026-03-26 09:52:41
突然崩了!很多人以为手机坏了!官方紧急回应

突然崩了!很多人以为手机坏了!官方紧急回应

蓬勃新闻
2026-03-25 20:00:43
每吃一次,大脑萎缩就快一步?劝告:这4物是老年痴呆催化剂

每吃一次,大脑萎缩就快一步?劝告:这4物是老年痴呆催化剂

坠入二次元的海洋
2026-03-26 18:16:38
重磅实锤!瓜帅即将告别曼城,下一站彻底跳出英超

重磅实锤!瓜帅即将告别曼城,下一站彻底跳出英超

澜归序
2026-03-26 06:02:38
现实中的大龄剩女最后妥协了吗?网友爆笑评论,真是一言难尽。

现实中的大龄剩女最后妥协了吗?网友爆笑评论,真是一言难尽。

侃神评故事
2026-03-25 11:30:09
真是变态准啊!3名本土合砍62分,三分22中16,付政浩:CBA独一档

真是变态准啊!3名本土合砍62分,三分22中16,付政浩:CBA独一档

金山话体育
2026-03-26 08:29:20
美国必胜?哈佛专家:不要高估中国,美国已经控制了中国的命脉

美国必胜?哈佛专家:不要高估中国,美国已经控制了中国的命脉

探史
2026-03-25 08:59:36
伊朗武装部队向以色列发射新一轮导弹

伊朗武装部队向以色列发射新一轮导弹

财联社
2026-03-26 19:42:42
美股三大期指短线走低,纳指期货、标普500指数期货均跌超1%

美股三大期指短线走低,纳指期货、标普500指数期货均跌超1%

每日经济新闻
2026-03-26 20:18:05
伊朗伊斯兰革命卫队海军指挥官身亡

伊朗伊斯兰革命卫队海军指挥官身亡

财联社
2026-03-26 16:23:15
兄弟俩联手创办苏宁,如今弟弟千亿资产清零,哥哥却走上另一条路

兄弟俩联手创办苏宁,如今弟弟千亿资产清零,哥哥却走上另一条路

鲸探所长
2026-03-24 14:38:04
人有没有心梗,散步就知道?得心梗的人,散步常有这2个表现

人有没有心梗,散步就知道?得心梗的人,散步常有这2个表现

健康科普365
2025-12-18 10:01:25
2026-03-26 21:52:50
量子位 incentive-icons
量子位
追踪人工智能动态
12348文章数 176424关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

美国总统特朗普公开宣布访华行程 外交部回应

头条要闻

美国总统特朗普公开宣布访华行程 外交部回应

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

艺术
教育
时尚
本地
健康

艺术要闻

哪一座桥不是风景?

教育要闻

江苏省教育厅公布全省中小学生竞赛活动名单

上新|| 她们说,找到了自己的人生裙子!

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

转头就晕的耳石症,能开车上班吗?

无障碍浏览 进入关怀版