国家知识产权局信息显示,上海文因互联信息技术有限公司申请一项名为“一种基于上下文标记与模型级联的文档切分方法及系统”的专利,公开号CN121351802A,申请日期为2025年10月。
专利摘要显示,本发明涉及自然语言处理技术领域,提供一种基于上下文标记与模型级联的文档切分方法,包括,响应文档切分请求,加载待处理文档并初始化切分参数;调用大语言模型对当前待处理的文本段进行分析,识别逻辑分界点并生成包含切分点标记及上下文的楔子信息;根据楔子信息在文本段中定位切分点的绝对位置,将文本段切分为若干文本子段;重复执行直至达到预设的递归终止条件;当递归完成后将各层切分结果进行聚合,构建层级化文档结构并输出切分结果。通过通过楔子机制,仅输出微小的定位标记,降低令牌成本,结合模型级联策略优化了整体成本。生成的文本块与文档的语义边界高度对齐,有效解决了上下文碎片化问题,增强了上下文关联性,抑制模型幻觉。
天眼查资料显示,上海文因互联信息技术有限公司,成立于2024年,位于上海市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本1000万人民币。通过天眼查大数据分析,上海文因互联信息技术有限公司专利信息1条,此外企业还拥有行政许可1个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.