3月16日消息,通义实验室今日正式发布并开源Fun-CineForge,该模型为全球首个支持影视级多场景配音的多模态大模型,同时开放其配套高质量数据集构建方法CineDub,旨在解决AI在专业影视配音中长期存在的“口型不同步、情绪不匹配、音色不一致、时间对不准”四大核心难题。
目前,模型已在GitHub、Hugging Face、ModelScope三平台开源,支持30秒以内视频片段推理。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.