在手机上读扫描版 PDF,体验约等于用放大镜看报纸——横屏字太小,竖屏看不清,放大看个公式还得左右横跳。更糟的是遇到乱码、错版、整页糊掉的文件,基本就是电子垃圾。
小墨阅读器最近接入了 DeepSeek-OCR,试图终结这种灾难。
传统 OCR 像是用镊子夹文字,生硬且容易散架。小墨背后的开源方案 PDF Craft 让大模型直接"读"懂 PDF 结构,再重排成标准的 EPUB 电子书。你可以理解为:不是复印,是重新排版。
作为本地阅读器,它支持 EPUB、PDF、TXT、漫画 ZIP 和 M4B,覆盖 iPhone、iPad、网页、Windows 和 macOS。核心围绕 EPUB 做了四件事:PDF 转 EPUB、扫描件 OCR、EPUB 翻译、有声书生成。
收到一份糟糕的扫描 PDF,丢进任务中心,等它变成规整的电子书再打开——同一本书,左边是原版 PDF 在手机上挤作一团,右边是转换后的 EPUB 自动适配屏幕。从视力消耗角度,这几乎是刚需。
桌面端的存在感稍弱,毕竟能手机读的书,很少有人愿意开电脑。但开发者把重活都放在了桌面端:OCR、批量转换、导出。iOS 则负责轻量阅读和进度同步。处理完的内容存在本地,适合对云端不放心的用户。
网页版只保留转换、翻译、有声书,给不想装客户端的人留了个后门。另有 RESTful API 和命令行工具,供开发者折腾。
小墨给小众软件读者准备了一个月 200 万 Token 的体验额度。开发者说,最早做这工具是因为自己囤了几百本扫描版技术书,实在读不下去了。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.