金融界2025年6月7日消息,国家知识产权局信息显示,北京神州泰岳软件股份有限公司申请一项名为“一种基于多模态大模型的数字人生成方法和装置”的专利,公开号CN120107427A,申请日期为2025年05月。
专利摘要显示,本申请提供了一种基于多模态大模型的数字人生成方法和装置,涉及数字人生成技术领域,突破了传统基于姿态关键点或三维表示的生成局限性,能生成在目标部位表现细腻自然的数字人形象。方法包括:获取用户输入的多模态数据并基于多模态大模型进行意图识别和情感分析,确定响应文本数据对应的音频序列数据;获取参考图像数据的视觉特征向量表示;根据人物的目标部位在参考图像数据中的位置,确定目标部位对应的掩码特征向量表示;基于扩散模型依据音频序列数据、视觉特征向量表示、掩码特征向量表示,对至少一个噪声向量表示进行去噪处理,生成至少一帧数字人的图像数据;根据至少一帧数字人的图像数据和音频序列数据,生成带有语音的数字人动画。
天眼查资料显示,北京神州泰岳软件股份有限公司,成立于2001年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本196256.4954万人民币。通过天眼查大数据分析,北京神州泰岳软件股份有限公司共对外投资了39家企业,参与招投标项目2831次,财产线索方面有商标信息132条,专利信息575条,此外企业还拥有行政许可5个。
本文源自:金融界
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.