楔子
研究分析工作者们都会遇到一个“老大难”问题——图片内数据提取。
当你需要就某一行业整理一份报告,首先需要参考市场中的研报、论文或智库报告。在参考源中,数据素材绝大多数都是图片或pdf格式,不可以直接复制进表格内重新编辑,你想复用的话就会面临处理麻烦,誊写缓慢,容易出错等等问题,也因此大家都会对OCR识别辅助软件产生迫切需求。
目前主流的OCR软件一般是网页在线与本地客户端两种模式,按照识别精确程度与使用次数收取软件费用。操作步骤一般需要用户将目标图片上传或导入,识别得出结果,复制进表格内开始编辑或制图。
痛点在于:
一是识别准确率不高;
二是识别性能较好的软件需要下载客户端;
三是识别结果不可直接编辑。
种种使用困难,仍在降低研究人员的工作效率。
对此现状,WarrenQ智能投研平台从使用的便捷性与识别准确率入手,提出了自己的优化方案。
解析识别功能
WarrenQ智能投研平台内部支持解析研报,可以直接抽取研报中全部图表,抽取出的图表都可以进行OCR识别;同时,本地上传的报告也支持解析抽取。
01 精确高效的OCR
目前WarrenQ智能投研平台的OCR功能支持对各类图表进行解析,纯表格,折线图,柱状图,面积图都可以进行精确识别数据,OCR识别准确率超90%,可满足商业办公需求。
以下图为例,WarrenQ识别的数据精确,所有数据保真,同时识别结果支持使用者直接进行编辑处理,或存入笔记进行在线存储,或复制到本地进行整理,使用便捷,操作人性化。
目前最新版本的OCR功能已经支持无标注的图表识别,即使图片内未明确标志数据,也可通过Y轴刻度线进行数值估计,来帮助研究人员进行更多场景下的数据整理。
02 便捷的数据存储
图表识别的数据内容,可以结合WarrenQ智能投研平台内置的笔记、脑图写作进行在线编辑整理。
图表的OCR识别结果可直接在表格内部修改编辑,编辑结果支持一键转存入笔记内,生成文字表格,并按照研究员需要装入对应的工程管理内,形成数据收集、整理、存储的闭环操作。
同时表格素材也可直接插入脑图写作内,形成研究报告的支撑素材,无须重新编辑,一键操作。
丹渥智能最新WarrenQ智能投研平台现已上线,欢迎各位用户搜索官网咨询,谢谢!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.