品玩8月11日讯,据昆仑万维官方消息,昆仑万维推出SkyReels-A3模型,基于“DiT(Diffusion Transformer)视频扩散模型+插帧模型进行视频延展+基于强化学习的动作优化+运镜可控”,其能实现任意时长的全模态音频驱动数字人创作。
用户上传人像图片与音频,搭配文本提示,即可让静态图像 “开口说话”、现有视频 “改台词” 且口型表情同步,还能生成含自然动作与运镜效果的视频。其支持固定镜头、推镜等 8 种运镜模式,强度可调节,适配广告、MV、直播等场景。
性能测试显示,该模型在唇形同步等指标上超越 OmniHuman 等同类模型,且通过技术优化将生成步数从 40 步减至 4 步,效率大幅提升。目前模型已上线,用户可登录官网体验,为内容创作提供低成本、高效能方案。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.