国家知识产权局信息显示,深圳优联合创智慧科技有限公司申请一项名为“面向机器视觉的跨模态图文分析方法”的专利,公开号CN121210958A,申请日期为2025年9月。
专利摘要显示,本发明涉及机器视觉技术领域,公开了一种面向机器视觉的跨模态图文分析方法,该方法包括:将输入图像进行分块,生成图像块序列;将所述图像块序列输入视觉转换器进行多尺度特征提取,生成目标视觉特征;将输入文本进行编码,生成目标文本特征;将所述目标视觉特征和所述目标文本特征输入深度重建瓶颈网络进行压缩对齐,生成跨模态压缩向量;将所述跨模态压缩向量输入大型语言模型,生成跨模态解码信息,本发明能够有效过滤跨模态冗余信息,学习紧凑的共享语义表示,通过双向重建验证确保压缩过程的信息完整性,实现了跨模态语义对齐,进而实现了从整体到细节的全方位跨模态内容生成,满足不同应用场景的需求。
天眼查资料显示,深圳优联合创智慧科技有限公司,成立于2017年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本2377万人民币。通过天眼查大数据分析,深圳优联合创智慧科技有限公司共对外投资了1家企业,参与招投标项目12次,专利信息3条,此外企业还拥有行政许可8个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.