网易首页 > 网易号 > 正文 申请入驻

可灵3.0系列模型正式上线:属于每个人的导演时代来临

0
分享至


可灵3.0上线,AI视频创作进入影视级导演时代。

近日消息,可灵AI正式全球上线3.0系列模型,目前正面向黑金、钻石、铂金会员开放使用,预计将于近期全量上线。此次发布的可灵视频3.0、可灵视频3.0 Omni及可灵图片3.0、可灵图片3.0 Omni模型,覆盖图片生成、视频生成、编辑及后期等影视级全流程链路,标志着AI正式进入影视与创意内容的核心生产环节,可灵AI也正式迈入3.0时代。

▎全新All-in-One产品和技术理念 多模态输入输出一体化助力原生创作

可灵3.0系列模型基于All-in-One产品和技术理念构建,形成一个多模态输入与输出高度统一的一体化视频模型体系。它并非将功能简单叠加,而是通过统一架构,将影像创作中的理解、生成与编辑整合为一个连续流程,让创作首次在单一模型内完成闭环。

在这一体系下,创作者可以同时使用文字、图片、声音与视频作为输入,并直接获得可用的专业影像级输出结果,创作过程不再被拆分为多个工具与步骤。

围绕创作者最关心的稳定性与表达力,可灵3.0系列模型在多个关键环节上做了系统级增强。长期困扰行业的一致性问题获得突破性进展:通过整合视频主体上传、音色绑定及全球首创的“图生视频+主体参考”等一系列技术能力,能够使得人物形象、动作与声音在复杂镜头切换中保持稳定,文字清晰、品牌标识可识别,即便在多语言场景下,视觉风格与角色特征也能高度统一。

在叙事层面,模型支持最长15秒的连续生成,并引入智能分镜与自定义镜头控制,让创作者能够直接组织镜头节奏与叙事结构,不再依赖碎片化拼接,从而让镜头具备情绪递进与画面张力。


可灵视频3.0 智能分镜

音画能力也被进一步拉齐到影视创作标准。视频3.0与视频3.0 Omni均支持原生音画同出,覆盖多语种与多种地方口音,人物口型、情绪与表演更加自然,整体画面真实感显著提升,人物演绎更具表演张力。图片模块则支持4K超清输出,分镜图与系列组图的引入,使静态画面本身也具备完整的叙事能力。

从单点生成到系统化调度,可灵3.0系列模型不只是一次模型升级,而是创作方式的变化。它将原本需要多人协作、多轮修正才能完成的导演级表达,压缩进更直接、更可控的创作流程中,让更多创作者能够以接近专业制作的方式完成影像表达。

▎可灵视频3.0:电影级叙事与精准掌控

全新的智能分镜系统如同一位AI导演,能深度解 读剧本意图,自动调度机位与景别。无论是经典的“正反打”对话,还是复杂的跨分镜转场,均可一键生成,大幅降低后期修正成本。


灵视频3.0 全球首创“图生视频 + 主体参考”技术

通过全球首创的“图生视频 + 主体参考”技术,创作者可对画面特定元素进行二次锚定。无论镜头如何推拉摇移,主角、道具及场景特征始终稳定如一。该技术有效解决了行业长期存在的“主体崩坏”痛点。此外,模型支持最高15秒超长连续生成,并适配多国语言(中英日韩西)及多种地方口音及方言(粤语、四川话、东北口音、北京口音等),实现情绪饱满的音画同步表演。这些能力使AI不再仅是工具,而是能执行导演意图的智能创作伙伴。

▎可灵视频3.0 Omni:全能参考与极致一致性

Omni版本进一步强化了角色一致性与指令响应的敏锐度。具体来说,创作者只需上传参考素材,模型即可实现对特定主体视觉特征与音色的原生提取与绑定。基于特征解耦技术,角色、道具等元素可在不同场景中自由复用,始终保持同一张脸、同一种声音。


可灵视频3.0 Omni自定义分镜

该版本不仅让画面更少崩坏、更具灵动感,还攻克了文字变形等难题,结合灵活的分镜控制能力,使AI生成内容达到专业影视的“直接交付”标准。这相当于为导演提供了高度可控的“数字演员”与“虚拟摄制组”。

可灵图片3.0系列模型:强化静态叙事 并支持4K超高清

可灵图片3.0及可灵图片3.0 Omni模型专注于强化静态画面的“叙事感”,用静帧讲述完整故事。模型能深度解构提示词中的视听元素,精准把控构图与视角逻辑,高度适配影视分镜、场景设定等专业需求。

新版本支持2K/4K超高清图直出,并新增系列组图生成功能,在增强画面真实感的同时,确保组图间风格、光影与细节的高度统一,满足专业视觉物料对精度与一致性的严苛要求。

打破创作壁垒:AI成为核心生产链路与三次跃迁

可灵AI 3.0完成了从“可用”到“可控”,再到“专业调度”的三次关键跃迁。自2024年6月发布全球首个面向用户的DiT 视频生成模型以来,可灵 AI 推动行业进入“可用时代”;进入2.0阶段后,通过模型能力和表现力的持续提升,实现了从“可用”到“好用”的演化。

基于All-in-One理念打造的可灵AI 3.0系列模型,在近期推出的O1和2.6模型基础上,进一步深化Multi-modal Visual Language(MVL)交互理念,实现了从“基础生成”到“专业调度”的系统性跨越,在生成质量和专业可控两大创作维度上取得关键突破。

通过智能分镜、图生视频 + 主体参考、多语言多口音音画同出等核心能力,模型不再只是理解创作意图,而是能够对镜头节奏、角色关系与视听结构进行系统级调度与协同。创作者可以在一个模型内完成分镜组织、主体锚定与叙事推进,可灵AI也由此完成了从单点生成工具,向内容创意者下一代“创作接口”的进化。

在影视和广告领域,创作者可利用智能分镜等镜头调度能力快速验证创意;在游戏与虚拟制作中,稳定的角色一致性则能大幅加速数字资产的构建。据公开数据,截至2025年12月,可灵AI 已拥有超过6000万创作者,生成超过6亿个视频,服务超过3万家企业用户,年化收入运行率达到2.4亿美元。

可灵3.0系列模型的发布标志着AI从一个简单的生成工具转变为理解创作意图、执行分镜的创作协作者,属于每个人的导演时代已经来临。


未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
再本分的中年女人,也躲不过男人这4招,过来人都懂

再本分的中年女人,也躲不过男人这4招,过来人都懂

热心市民小黄
2026-03-29 12:39:30
最强国产CPU企业诞生:营收144亿,落后intel仅2年,支持windows

最强国产CPU企业诞生:营收144亿,落后intel仅2年,支持windows

互联网.乱侃秀
2026-04-04 10:20:15
远离蠢人!“蠢”的七种形态,你中了几条?

远离蠢人!“蠢”的七种形态,你中了几条?

霹雳炮
2026-04-03 21:34:30
这下惨了!特朗普陷入被动,伊朗俘获美国空军,或成谈判筹码

这下惨了!特朗普陷入被动,伊朗俘获美国空军,或成谈判筹码

落下星星河
2026-04-04 18:21:22
塔帅:我不会因输一场球去批评球员,若有人必须担责那就是我

塔帅:我不会因输一场球去批评球员,若有人必须担责那就是我

懂球帝
2026-04-05 06:30:13
中超巨大争议!韩镕泽35秒手球逃红,国安球员不满,媒体人热议

中超巨大争议!韩镕泽35秒手球逃红,国安球员不满,媒体人热议

奥拜尔
2026-04-04 15:41:20
大牌又闹脾气消极罢工!上海或爆重大危机,沪迷:真把自己当爷了

大牌又闹脾气消极罢工!上海或爆重大危机,沪迷:真把自己当爷了

后仰大风车
2026-04-04 07:05:11
台统一方案或出乎意料:若美国发动代理人战争,中国将启天津模式

台统一方案或出乎意料:若美国发动代理人战争,中国将启天津模式

独坐山巅前
2026-04-04 01:41:45
阮经天与小20岁大陆富家千金东京十指紧扣恋情曝光

阮经天与小20岁大陆富家千金东京十指紧扣恋情曝光

落雪听梅a
2026-04-02 22:06:51
项立刚:光刻机霸权将成过去式,中国入场,下一步将颠覆市场!

项立刚:光刻机霸权将成过去式,中国入场,下一步将颠覆市场!

粤语音乐喷泉
2026-04-04 14:31:39
伊朗媒体:苏莱曼尼女儿否认他的亲属在美被捕

伊朗媒体:苏莱曼尼女儿否认他的亲属在美被捕

环球网资讯
2026-04-05 06:19:50
筱梅下周带汪宝回北京,丽芳阿姨跟随,兰姐叮嘱,箖玥有新变化!

筱梅下周带汪宝回北京,丽芳阿姨跟随,兰姐叮嘱,箖玥有新变化!

老好人的愤怒
2026-04-05 05:55:38
马克龙不要中国去G7峰会,联合高市插手台海,中法千亿大单白签?

马克龙不要中国去G7峰会,联合高市插手台海,中法千亿大单白签?

阿天爱旅行
2026-04-04 00:50:43
伊朗外长澄清立场

伊朗外长澄清立场

第一财经资讯
2026-04-04 21:10:35
李建国任忻州市委书记 朱晓东不再担任

李建国任忻州市委书记 朱晓东不再担任

中国经济网
2026-04-03 11:21:06
随着莫雷加德0-4,乒乓球男子世界杯4强诞生第2席:世界第8碾压晋级

随着莫雷加德0-4,乒乓球男子世界杯4强诞生第2席:世界第8碾压晋级

侧身凌空斩
2026-04-04 14:57:39
喝了30天,眼睛亮得能看清远处站牌!这杯茶真管用

喝了30天,眼睛亮得能看清远处站牌!这杯茶真管用

笑饮孤鸿非
2026-04-02 07:18:00
重大利好!太空算力产业大会发布十大项目,全产业链迎历史性机遇

重大利好!太空算力产业大会发布十大项目,全产业链迎历史性机遇

风风顺
2026-04-04 07:40:03
2026年养老金22连涨!每月4000元退休金,到底能不能涨够100元?

2026年养老金22连涨!每月4000元退休金,到底能不能涨够100元?

复转这些年
2026-04-04 10:00:10
蔡崇信33亿收购篮网队,运营六年后出售赚了多少?网友:难以置信

蔡崇信33亿收购篮网队,运营六年后出售赚了多少?网友:难以置信

生活新鲜市
2026-04-03 19:56:50
2026-04-05 06:51:00
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7170文章数 20743关注度
往期回顾 全部

科技要闻

内存一年涨四倍!国产手机厂商集体涨价

头条要闻

特朗普发布视频宣称“打死多名伊朗军事领导人”

头条要闻

特朗普发布视频宣称“打死多名伊朗军事领导人”

体育要闻

刹不住的泰格·伍兹,口袋里的两粒药丸

娱乐要闻

Q女士反击,否认逼宋宁峰张婉婷离婚

财经要闻

中微董事长,给半导体泼点冷水

汽车要闻

17万级海豹07EV 不仅续航长还有9分钟满电的快乐

态度原创

亲子
房产
数码
本地
公开课

亲子要闻

优生优育,从科学孕前准备开始

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

数码要闻

今年新款AirPods Pro、Apple TV值得等吗?升级方向曝光

本地新闻

跟着歌声游安徽,听古村回响

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版