网易首页 > 网易号 > 正文 申请入驻

从「会表演」到「更会演」:KlingAvatar2.0让数字人拥有生动灵魂

0
分享至

机器之心发布

还记得几个月前那个能随着音乐节拍自然舞动的 KlingAvatar 数字人吗?现在,它迎来了史诗级进化!

近日,快手可灵团队正式发布了 KlingAvatar2.0 技术报告,这一次,数字人不仅能 "表演",更能 "生动表达"——它们将拥有更丰富的情感层次、更精准的多角色互动,对复杂文本指令的深度理解能力,以及支持长达 5 分钟的视频生成。目前该模型已经在可灵平台全量上线,人人都可体验!

  • 论文地址:https://arxiv.org/pdf/2512.13313
  • 体验链接:https://app.klingai.com/cn/ai-human/image/new/

首先看一下效果,肢体灵动、表情逼真,生动性拉满!







文中视频链接:https://mp.weixin.qq.com/s/SexCvqSiQTJKBSixBlmajA

让我们拆解技术报告,看一下可灵团队是如何实现如此生动效果的。

核心技术突破:让数字人 "活" 起来的三大创新

1. 时空级联框架:长视频不再 "虎头蛇尾"

想象一下,你正在制作一个 5 分钟的产品介绍视频,但传统的 AI 生成工具总是在第 2 分钟后就开始 "崩坏"—— 画面变得模糊,人物动作开始不连贯,甚至连口型都对不上了。KlingAvatar2.0 创新性地提出了时空级联框架:

  • 智能蓝图生成:先创建低分辨率 "蓝图视频" 捕捉全局语义和动作
  • 渐进式增强:通过首帧 - 末帧策略,将蓝图精细化为高分辨率、时间连贯的子片段
  • 并行高效:支持分钟级长视频生成,保持身份一致性和故事连续性



KlingAvatar 2.0 方案框架。该方案快速勾勒出一个低分辨率的 "分镜脚本"(蓝图视频),确定整个故事的走向和关键动作节点;然后,它会像精雕细琢的艺术家一样,逐步将这些关键帧升级为高清画面,确保每个细节都栩栩如生;最后,通过并行处理技术将这些精心打磨的片段无缝拼接成完整的长视频。

2. 共推理导演:多模态指令的 "智慧大脑"

KlingAvatar2.0 的共推理导演系统就像是给数字人配备了一个专业的导演团队。这个系统由三位 "AI 专家" 组成,它们会像真正的电影制作团队一样密切协作:

  • 音频专家:精准识别语音内容、情感轨迹和说话意图
  • 视觉专家:深度理解人物特征、场景布局和视觉语境
  • 文本专家:智能解析用户指令,融合对话历史生成连贯剧情

这三大专家通过多轮对话协作,能够解决模态冲突(比如愤怒语气配中性脚本),将模糊的指令转化为详细的镜头级故事线。

3. 多角色精准控制:每个数字人都有自己的 "声音"

在传统的多角色视频中,一个常见的问题是 "张冠李戴"—— 明明是给 A 角色的音频,结果 B 角色的嘴也在动。这种混乱让观众瞬间出戏,破坏了整个视频的沉浸感。KlingAvatar2.0 通过身份特定多角色控制技术,让每个数字人都能 "各司其职":

  • 利用深度 DiT 特征实现角色掩码预测
  • 每个角色都能被独立的音频流精准驱动
  • 基于 Yolo、DWPose、SAM2 等模型构造了数十万条高质量多人数据用于训练



(a) KlingAvatar2.0 基于 DiT 深层 block 特征预测指定角色在视频中每一帧画面的位置,控制音频精确驱动该位置的角色。(b) 可灵团队基于 Yolo、DWPose、SAM2 等模型构造了数十万条高质量多人数据用于训练。

实验结果:生动性大幅提升,数字人有了 "演技"

如果说 KlingAvatar1.0 让数字人学会了 "表演" 的基本功,那么 2.0 版本则让它们真正拥有了 "演技"。生动性方面:

  • 情感表达更细腻:面部表情随语音起伏自然变化,能够准确传达兴奋、悲伤、愤怒等复杂情绪,眼神、嘴角、眉梢都充满 "戏"。
  • 动作协调更自然:全身动作与音频节奏完美同步,手势、姿态变化流畅自然,避免了不自然的扭曲和抖动。
  • 细节处理更精致:头发动态物理真实,不再 "僵硬",牙齿、嘴唇细节清晰可见,光照和曝光效果更加自然。



KlingAvatar2.0 与 Heygen、OmniHuman-1.5、KlingAvatar1.0 相比有更优异的性能。

在涵盖 300 个高质量测试案例的严格评测中,KlingAvatar2.0 展现出了令人瞩目的性能:

  • 整体效果:相比 HeyGen 提升 26%,相比 KlingAvatar1.0 提升 73%,相比 OmniHuman-1.5 提升 94%
  • 文本响应:指令理解能力大幅提升,能准确执行复杂的镜头和动作指令
  • 运动表现力:生动性和丰富度远超竞品



KlingAvatar 2.0 与基线方法的定性比较。左图:KlingAvatar 2.0 能够生成更自然的头发动态效果和更生动的面部表情。中图:KlingAvatar 2.0 更符合指定的自下而上的摄像机运动。右图:KlingAvatar 2.0 的结果与提示 “…… 转身面向前方,双手交叉放在胸前” 更加吻合

总结:让每个数字人都有动人灵魂

回顾整个数字人技术的发展历程,我们可以清晰地看到一个进化轨迹:从最初的 "嘴唇蠕动",到后来的 "表情同步",再到现在的 "生动表演",每一次突破都让虚拟角色离 "真实" 更近一步。

KlingAvatar2.0 不仅仅是一次技术升级,它也代表了 AI 在理解人类表达艺术方面的一次飞跃。这项技术让机器更好地理解了什么是 "表演"—— 它不仅仅是机械地执行指令,而是要在理解音频情感、视觉语境和文本意图的基础上,创造出能够触动人心的视听体验。

放眼到行业,数字人技术的持续迭代,也推动着行业创作门槛的降低、制作标准的提升,在电商直播、娱乐内容制作、在线教育、企业服务等诸多领域,数字人的规模化应用已成趋势。

生成效果的大幅提升,长内容场景的全覆盖,都让我们更加确信:技术不再是冰冷的工具,而是真正成为了表达创意、传递情感的温暖载体。在这个技术与艺术完美融合的新时代,准备好让你的创意 "活" 起来了吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
何卓佳3-1叶伊恬晋级32强!前2局吊打,后2局反手起伏稳住关键分

何卓佳3-1叶伊恬晋级32强!前2局吊打,后2局反手起伏稳住关键分

篮球资讯达人
2026-02-23 21:05:49
女人默许你“得手”从不主动靠近:这三种默许,已是最明确的信号

女人默许你“得手”从不主动靠近:这三种默许,已是最明确的信号

青苹果sht
2026-02-22 06:58:10
谷爱凌回应万斯的批评:你不管别人,就只管我,那是因为我能赢

谷爱凌回应万斯的批评:你不管别人,就只管我,那是因为我能赢

我心纵横天地间
2026-02-21 18:50:22
我只喜欢刘美贤

我只喜欢刘美贤

必记本
2026-02-23 01:01:50
曼城慌了?阿森纳要组最强三叉戟,1 亿豪赌法国王牌

曼城慌了?阿森纳要组最强三叉戟,1 亿豪赌法国王牌

澜归序
2026-02-24 03:19:20
2026年最神的神童

2026年最神的神童

木子默
2026-02-23 20:46:54
数名肿瘤专家已证实:花生和癌症的关系,最好花点时间看看

数名肿瘤专家已证实:花生和癌症的关系,最好花点时间看看

资说
2025-09-30 15:31:10
谁能夺冠?阿森纳曼城未来英超赛程:第33轮迎直接对话

谁能夺冠?阿森纳曼城未来英超赛程:第33轮迎直接对话

懂球帝
2026-02-23 09:45:07
西媒:欧足联担心维尼修斯与普雷斯蒂安尼次回合赛前拒绝握手

西媒:欧足联担心维尼修斯与普雷斯蒂安尼次回合赛前拒绝握手

懂球帝
2026-02-23 21:11:04
你干过哪些阴暗龌龊的事?网友:最后一个真的好炸裂好真实

你干过哪些阴暗龌龊的事?网友:最后一个真的好炸裂好真实

带你感受人间冷暖
2026-02-17 01:00:24
谷爱凌惹谁了,那么多知识分子不喜欢她

谷爱凌惹谁了,那么多知识分子不喜欢她

冰川思想库
2026-02-23 18:29:54
2026中日首战:商务部重拳出击,日本连夜上门求情,中国寸步不让

2026中日首战:商务部重拳出击,日本连夜上门求情,中国寸步不让

观星赏月
2026-02-23 18:49:03
机枪封锁高速,火烧汽车飞机!墨西哥击毙最大毒枭引发多地混乱,贩毒集团恐“内战”

机枪封锁高速,火烧汽车飞机!墨西哥击毙最大毒枭引发多地混乱,贩毒集团恐“内战”

红星新闻
2026-02-23 13:56:15
国产HBM重大突破!合肥联盟攻克2.5D封装核心技术,2026年底试产

国产HBM重大突破!合肥联盟攻克2.5D封装核心技术,2026年底试产

宇量信息
2026-02-23 20:24:05
36 岁离婚女子独自过年崩溃痛哭:没老公没孩子,谁还会娶我

36 岁离婚女子独自过年崩溃痛哭:没老公没孩子,谁还会娶我

一盅情怀
2026-02-23 14:10:06
韩媒民调:64.5%韩国人支持武力介入台海,中国定会报复

韩媒民调:64.5%韩国人支持武力介入台海,中国定会报复

信息风云
2026-02-24 01:03:43
3年大合同+全家迁居!张本智和官宣震撼抉择,日本队慌了

3年大合同+全家迁居!张本智和官宣震撼抉择,日本队慌了

卿子书
2026-02-02 08:59:31
很多人不懂!结婚后女方如果不将户口迁到男方,会有什么样影响?

很多人不懂!结婚后女方如果不将户口迁到男方,会有什么样影响?

白色得季节
2026-01-06 11:35:16
东北男人“新战袍”:4000元的迪桑特,成了体制内的隐形工牌

东北男人“新战袍”:4000元的迪桑特,成了体制内的隐形工牌

闻香阁
2026-02-23 21:11:24
目标交付30万辆!越南"特斯拉"背后有哪些中国上市公司在供货?|新春观察

目标交付30万辆!越南"特斯拉"背后有哪些中国上市公司在供货?|新春观察

财联社
2026-02-23 10:29:19
2026-02-24 03:48:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12330文章数 142569关注度
往期回顾 全部

科技要闻

智谱、MiniMax合计蒸发近千亿市值,为何?

头条要闻

墨西哥最大毒枭被击毙:喜欢杀人灭门 几乎没人看见过他

头条要闻

墨西哥最大毒枭被击毙:喜欢杀人灭门 几乎没人看见过他

体育要闻

哈登版骑士首败:雷霆的冠军课

娱乐要闻

那艺娜账号被禁止关注,视频已清空!

财经要闻

美国海关将停止征收被裁定违法的关税

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

旅游
家居
健康
本地
亲子

旅游要闻

文化中国行|在祖国最北的地方 过温暖团圆年

家居要闻

本真栖居 爱暖伴流年

转头就晕的耳石症,能开车上班吗?

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

亲子要闻

孩子长得慢长得矮,查查这四项

无障碍浏览 进入关怀版