观点网讯:6月4日,京东正式开源JoyAI-Echo长音视频生成框架,完整代码及模型权重已在GitHub上线。
据介绍,该框架引入智能“导演助理”DirectorAgent,并内置跨模态记忆库,可在多镜头生成中持续保持角色外观和说话人音色一致。通过DMD技术实现7.5倍推理加速,并支持对话式编辑功能,用户无需重跑整条视频即可修改镜头。
根据公开资料整理,JoyAI-Echo直接解决了长视频生成领域长期存在的“角色易崩、声音乱变、生成缓慢”三大难题,使京东在长视频生成领域进入全球第一梯队。
免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。
本文源自:观点网
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.