国家知识产权局信息显示,深圳市莱达四维信息科技有限公司申请一项名为“基于视觉语言大模型的知识引导式表计读数方法及系统”的专利,公开号CN121725490A,申请日期为2026年2月。
专利摘要显示,本发明涉及计算机视觉与人工智能技术领域,具体为基于视觉语言大模型的知识引导式表计读数方法及系统,包括:模版获取步骤:获取表计图像,基于类型调取包含元数据及推理逻辑指令的结构化读数提示模版;多模态输入步骤:将图像与模版作为多模态数据输入视觉语言大模型;推理生成步骤:提取视觉特征并与模版进行注意力对齐,响应指令执行思维链推理,生成包含中间推导依据的自然语言描述结果;解析输出步骤:对结果进行结构化解析,提取符合格式约束的表计读数数值;本发明实现了业务逻辑与视觉感知的深度融合,建立人机信任,并规避了纯视觉模型的逻辑谬误。
天眼查资料显示,深圳市莱达四维信息科技有限公司,成立于2015年,位于深圳市,是一家以从事商务服务业为主的企业。企业注册资本2000万人民币。通过天眼查大数据分析,深圳市莱达四维信息科技有限公司共对外投资了2家企业,参与招投标项目77次,财产线索方面有商标信息2条,专利信息20条,此外企业还拥有行政许可11个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.