近日,米哈游创始人蔡浩宇新公司Anuttacon团队发布公告,公开其新一代视频角色表演生成模型 LPM 1.0。
据论文介绍,LPM 1.0是一个基于170亿参数扩散Transformer架构的视频模型,主打角色表演生成能力。与传统视频生成模型相比,该模型不仅关注画面生成,还尝试实现角色在视频中的连续表达,包括说话、倾听和实时反应,更注重于“表演”。
该模型可以根据输入图像生成具有稳定身份特征的视频角色,在对话过程中保持外观与行为一致,同时完成语音驱动、表情变化和动作反馈。
![]()
![]()
项目标注的领导人包括曾爱玲(Ailing Zeng)。其个人主页显示目前就职于Anuttacon。据悉,曾爱玲此前在腾讯混元团队及AI Lab从事计算机视觉与生成模型相关研究工作。
负责人小红书有自己的账号:
![]()
![]()
![]()
![]()
![]()
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.