来源:市场资讯
![]()
新浪科技讯 2月26日下午消息,云知声发布Unisound U1-OCR文档智能基础大模型,宣布凭借“性能 SOTA、可信可验、开箱即用、高效部署、强适配”等优势,在理解版面的基础上进一步洞察文档深层语义,实现自动分类与业务级信息抽取,突破了传统模型“只读文字、不懂排版”的瓶颈,能够像人类专家一样“看懂”复杂文档。
据悉,该模型在OmniDocBench V1.5评测中以95.1分取得SOTA表现,领先GLM-OCR,Deepseek-OCR2,Gemini-3-Pro,GPT-5.2等主流模型,实现了精度与泛化能力的双重突破。
在内部业务测试中,该模型信息抽取与文书分类能力超越Gemini-3-Flash、Qwen-235B-VL等主流通用商业和开源模型。特别是在医疗入院记录、出院小结等强业务场景中,领先优势尤为明显,Unisound U1-OCR 以 3B 规模的参数获得比更大规模通用VLM更好的评测性能。(文猛)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.