国家知识产权局信息显示,浙江大学、国网浙江省电力有限公司电力科学研究院申请一项名为“一种基于书生大模型的复杂场景多模态token压缩方法和系统”的专利,公开号CN121305240A,申请日期为2025年12月。
专利摘要显示,本发明公开了一种基于书生大模型的复杂场景多模态token压缩方法和系统,属于工业场景异常理解领域。获取多场景工业异常检测图像数据、各图像对应的文本任务;利用书生大模型的视觉编码器将输入图像处理为token形式,并选择其中的主要token,根据语义相似性合并其余token为上下文token,将主要token和上下文token重新拼接后共同进入投影层,投影至书生大模型中的大语言模型嵌入特征空间;最终经过大语言模型的推理与分析能力实现多样化场景下的异常理解。本发明通过在书生大模型的编码过程中进行token压缩,实现了高效的多模态异常理解与定位,在最具挑战性的下游任务上取得良好性能。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.