新京报贝壳财经讯(记者韦英姿)9月18日,新京报贝壳财经记者自快手获悉,可灵AI近日已推出数字人功能,最长支持生成1分钟的视频,目前产品公测陆续开放中。快手方面表示,可灵AI数字人通过音画高度对齐的交叉注意力机制、强化口型的训练策略以及精细化的数据处理,能够实现语音与唇形的同步;采用关键帧控制的架构,模型先构建高层次叙事骨架,再并行生成多个片段的数字人视频,可在保持身份一致的前提下,实现一定长度视频生成。
可灵AI数字人功能页面。企业供图
贝壳财经记者分别以中文、英文、韩文歌曲测试了可灵AI数字人的对口型功能,在同一段8秒视频中,该功能识别中文歌的表现相对好于英文、韩文歌,英文、韩文歌中的个别单词与数字人的口型仍无法较好拟合。
编辑 杨娟娟
校对 柳宝庆
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.