文/顾宇 江西朗知中文数智科技有限公司总经理
本文约5000字,预计10分钟阅读完毕
商务君按:在图书编校过程中,经常会使用到校对软件,但机器编校有时会漏掉很多错误,还不如人工操作放心。如何解决这个问题?近日,由江西朗知中文数智科技有限公司自主研发的“版慎通”智能审校系统正式发布,该系统依托江西出版传媒集团数⼗年的⾏业积淀,采用“端到端”思维,设计适配当下审校制度的智能审核校对流程,具备“6000亿参数的⼤模型+3000多个专业⼩模型”的模型规模优势,是真正懂出版人需求的审校系统。
9月15日,由江西朗知中文数智科技有限公司自主研发的“版慎通”智能审校系统在北京正式发布
2025年1月,中文天地出版传媒集团、北京朗知⽹络传媒科技股份有限公司和二十一世纪出版社集团共同注资成立江西朗知中文数智科技有限公司(简称“朗知中文”)。朗知中文致力于推动AI技术在出版、传媒行业的应用,助力数智化转型。
9月15日,朗知中文自主研发的“版慎通”智能审校系统(简称“版慎通”)正式发布。“版慎通”融合数千个大小模型和多个领域知识库,深刻洞察行业需求,实现从安全筛查、内容审核、编辑加工到文本校对等内容生产全过程的智能化辅助,大幅降低人工审校成本,提升出版效率与质量。目前免费向行业开放。
江西朗知中文数智科技有限公司总经理顾宇
初心,为何要做一款智能审校产品?
回顾⼈类⽂明,知识的传递⽅式经历了数次⾰命性的变迁——甲骨刻痕-纸张墨迹-数字化信息洪流-AI⼤模型驱动的智慧化时代。这些驱动着世界变⾰的⼤模型,如同⼀个不知疲倦的学⽣,从浩瀚如烟的全球语料中学习。它们是知识的映射,是规律的投影。但我们必须清醒地认识到,⽬前的AI,更像⼀只学舌的鹦鹉,它能模仿,却⽆法真正理解;它能回答,却缺乏感同⾝受的同理⼼。我们离真正的⼈⼯智能,还有很⻓的路要⾛。那么,通往未来的钥匙在哪⾥?我们相信,它就隐藏在那些经过千锤百炼、沉淀了⼈类智慧精华的知识中。而这片最优质的⼟壤,正是我们深耕多年的出版⾏业。
在信息爆炸的时代,我们为什么愈发珍视出版物?因为每⼀本正式出版的书籍,都代表着严谨的思考、系统的知识和深邃的智慧。它们是⼈类⽂明的瑰宝,是经过时间检验的优质数据源。我们坚信,要训练出真正具备智慧、拥有同理⼼的下⼀代AI,不能仅仅依靠⽆尽的数据堆砌,而必须依赖⾼质量、高纯度的“精神养料”。这正是出版⾏业的核⼼价值所在。可以说,每⼀本精⼼打磨的书籍,都是点燃未来AI智慧⽕花的关键⽕种,是⼈类⽂明通向更高阶智慧形态的“奇点钥匙”。
但我们正⾯临⼀个前所未有的挑战。⽣成式AI的爆发,在带来便利的同时,也催⽣了⼤量良莠不⻬的内容。这些“信息噪⾳”正在侵蚀、污染我们赖以通向未来的这片知识净⼟。⼀旦这些被污染的数据成为未来AI的“养料”,后果将不堪设想。因此,我们怀着对未来的敬畏和对知识的尊重,决⼼打造⼀把锋利的“智慧之剑”,守护这片⼈类智慧的最后净⼟,确保其纯粹与⼲净。这份使命,就是我们开发“版慎通”的初⼼。
核心优势,采用“端到端”AI原生思路
最开始,其实和市面上大部分审校产品思路类似,我们也试图通过“规则库+知识库”的方式来开发,围绕“得、地、的”、标点、敏感词、数字格式等训练了一批小模型,但我们逐渐发现一个问题,这种模式在⾯对浩如烟海、瞬息万变的信息文章时,显得⼒不从⼼。以《小王的北京之旅》这篇简短的文章为例,明显错误多达8处以上。而在运用目前市面上使用较多的审校软件审校后,发现没能审校出任何问题。我们意识到,如果只能通过有限的规则来查字词的方式,审校依然逃脱不了脑力劳动密集型产业的标签,更谈不上真正意义上的为编辑和校对人员实现“降本增效”。
那么,如何解决这个关键问题?首先我们对比了一下市面上各类审校软件。第一类就是上文所讲到的“传统规则+词库技术”路线竞品,完全无法找出问题。第二类是采用小参数模型技术路线的产品,只能找出关联词错用、“的、得、地”错用等语法问题,无法进行逻辑推理。第三类是“中型参数模型+规则+词库技术”路线的软件,能找出部分显性问题,但无法找出需要复杂逻辑推理的隐性问题。
最终,“版慎通”根据前辈们的经验,从汽车智能驾驶获得灵感,找到了一条新路——采用“端到端”思维,让AI直接从海量的⾼质量数据中学习,通过深度神经⽹络的训练,让智慧⾃然地“涌现”出来。这种思维的优势在于:①更强的泛化能⼒:能够处理从未⻅过的新情况。②更深的理解能⼒:能够理解上下⽂和隐含意义。③更快的适应能⼒:能够快速学习新的领域知识,端到端的思维让“版慎通”具备了真正的“智慧”,而不仅仅是“规则的执⾏者”。
还是以《小王的北京之旅》为例,面对这种漏洞逻辑及其复杂的语义型文档,“版慎通”践行了信息驱动的智能审核理念。可以说,这种审校并不是一般软件所能执行的简单审校,而是真正的审核加校对。
在开发“版慎通”的过程中,我们追求的是让AI像⼀位资深总编辑,能够先深⼊理解稿件的意图、结构和领域背景,然后再做出精准的判断和决策。为了实现这⼀⽬标,我们全⾯拥抱了前沿的智能体(Agent)技术,构建起⼀个复杂的AI⼯作流,⾃主地进⾏规划、反思、路由,并调⽤不同⼯具来完成任务,成为⼀个会思考、能规划的“审核大脑”。
也正是智能体技术,让“版慎同”具备了真正的“问题解决能⼒”,包括四⼤核⼼能⼒。一是规划能力:⾯对复杂的审核任务,AI能够⾃主制定最优的处理策略和步骤。二是反思能力:在处理过程中,AI会不断反思和调整⾃⼰的判断,确保结果的准确性。三是路由能力:根据内容的不同特点,AI会智能地选择最合适的处理路径和模型组合。四是⼯具调⽤能力:AI可以灵活调⽤各种专业⼯具和知识库,扩展⾃⼰的能⼒边界。
在“版慎通”正式发布前5个⽉内测期间,我们有幸获得了来自江西出版传媒集团下属各出版社,以及其他机构累计30家单位的⽀持。超过300位专业的编辑在“版慎通”平台开通了90多个账号,进⾏了深度体验测试。5个⽉时间,“版慎通”累计“筛审编校”字数超3.5亿字。甚至在前期版本中就已经可以做到一本几十万字的图书,传统人工审校需要20天,但使用“版慎通”2天就搞定。
功能介绍,五维⼀体的智能审校体系
那么,具体而言,“版慎通”是如何在编辑工作过程中帮助大家完成日常审校的?
在深刻理解出版⾏业痛点后,我们精⼼设计了⼀套“五维⼀体”的智能审核校对流程,完美适配当下的“三审”制度”和“三校一读”制度。这5个步骤分别是:解析、筛查、审核、编改、校对。它们共同构成了⼀个完整的闭环,从源头统⼀标准,到过程严密把关,再到结果精准修正,最终形成⼀份权威的审核报告。
第一步,解析。任何软件都有一定的误报率,而99%的误报是因为文件格式偏差导致的。要让AI精准地理解内容,⾸先必须解决输⼊的“标准化”问题。因此,在“版慎通”的“解析”模块,我们投⼊了巨⼤的研发⼒量,构建了⼀套统⼀的数据标准。⽆论是Word⽂档、PDF⽂件,甚⾄是PDF中的图片,⼀旦进⼊“版慎通”系统,都能瞬间被转换为统⼀的、AI可精准理解的数据格式。
第二步,安全筛查。解决了输⼊问题,⼀个更棘⼿的挑战摆在⾯前:内容安全。敏感信息、隐喻暗语、上下⽂关联的讽刺……这些问题极其复杂,⽆法通过简单的关键词匹配来发现。更麻烦的是,市⾯上所有公开的通⽤⼤模型,出于安全考虑,在⾯对这类问题时⼏乎都会选择“拒答”。为了解决这个问题,我们用超过一个月的时间,从出版⾏业的独特视⻆出发,收集整理了海量的相关语料,训练出⼀个专属于内容安全领域的“敏感信息筛查⼤模型”。它能够深刻理解上下⽂,精准识别各种隐喻、暗喻和敏感事件,实现了端到端的智能筛查。
“版慎通”进行的安全筛查示例
第三步,审核。安全问题得到保障后,进⼊了核⼼“审核”环节。我们⾸先思考⼀个本质问题:审核,究竟难在哪⾥?答案有两个:一个是信息量⼤,⼀本书动辄⼗⼏万字,通读⼀遍耗时费⼒;一个是专业性强,⼈类知识浩如烟海,任何⼀个编辑都不可能精通所有领域。为此,我们构建了⼀个庞⼤的“审核智能体”系统。在这个系统中,我们根据人工智能的建议将⼈类知识精细地划分为八⼤门类:⼈⽂、社科、⾃然科学、应⽤技术、艺术设计、教育、跨学科综合以及通⽤知识。在这⼋⼤⻔类之下,⼜进⼀步细分出超过3000个专业领域,并为每⼀个领域都训练了⼀个专属的“领域⼩模型”。当⼀篇稿件进⼊审核系统,“审核⼤脑”会⾸先分析其所属领域,然后智能地调度相应的“领域专家”⼩模型,与通⽤⼤模型协同进⾏“专家会诊”。这个过程,极⼤地弥补了⼈⼯审核在精⼒和专业知识上的短板,实现了真正意义上的“洞察全局”。
拥有3000多个专业模型只是第⼀步,如何智能地调度这些“专家”才是关键。我们开发了⼀套先进的智能体调度机制:首先通过内容属性识别,分析文档中涉及的领域知识,然后进行专家团队匹配,选取最合适的领域模型进行深度解析,通过几大领域的模型协同⼯作机制进行深度审核,最后通过质量控制反馈动态调整专家配置,持续优化调度策略,这套机制可以确保每⼀份内容都能得到最专业、最合适的审核服务,真正做到了“术业有专攻”。
“审核”模块主要应对的就是编辑工作中的三审工作,“版慎重通”审核功能分三步:一是通读全文,生成宏观分析报告,帮助编辑更快、更高效地了解整本书和整篇文章的内容大纲。二是进入专业模型矩阵分析生成专业分析报告,专业报告会对文稿整体进行评价并给出专业建议和总结性评语,这些评语不仅可以为编辑节省大量的时间,也可以互相佐证真实性。三是根据通用领域模型生成通用分析报告,这份报告可以对文稿总体质量进行评估,并提出优化建议方向。值得一提的是,这个板块的增加,可以帮助编辑部主任让新晋编辑在实操中成长,将参差不齐的编校水平拉到一个新的统一高度。
《铁齿铜牙纪晓岚》中一段经典剧本的审校
第四步,编改。经过前⾯“洞察全局”的分析性审核,⽆论是编辑还是AI系统,对稿件的核⼼问题都已经“⼼中有底”。接下来,就进⼊了“编改”环节。这个环节最早是没有的,我们在编辑实际工作中发现,当下编辑需要花费大量时间与作者沟通创作、编改内容,希望能通过这个功能减轻编辑的工作压力。
在“版慎通”中,修改不再是编辑的“独⻆戏”,而是⼈与AI的“灵感共创”。AI会基于前⾯的分析结果,提供⾼质量的修改建议。这些建议不仅修正了错误,更重要的是,它充分考虑了⽂章的上下⽂、⻛格和语境,确保修改后的内容与原⽂浑然⼀体,甚⾄在表达上更胜⼀筹。这就不得不提到“版慎通”的又一大创新——文风修改。首先“版慎通”内置8种风格,在语法修正和润色的前提下,可以对特定人员的文章进行定制化训练,保持语言风格的一致性。
从以下⼏个真实编改案例,可以感受一下“版慎通”的智能编改能⼒。案例一,表达冗余,逻辑不清晰,改进后表达更简洁,逻辑更清晰。案例二,学术⽂体中混⼊了⼝语化表达,改进后保持了学术⽂体的严谨性。案例三表达略显幼稚,改进后表达更加⽣动,⽂学性更强。这些案例展示了“版慎通”不仅能发现问题,更能提供⾼质量的解决⽅案,真正实现了从“修正”到“升华”的跨越。
第五步,校对。经过解析、筛查、审核、编改,⼀篇稿件已经实现“脱胎换⻣”的蜕变,来到最后⼀个也是⾄关重要的环节——校对。“版慎通”的校对,是基于前⾯所有流程产⽣的数据,从上下⽂语义分析的⾼度,对内容进⾏⼀次从语法到逻辑的“全⽅位扫描”。这个过程,融合了AI⼤模型、领域⼩模型以及全流程数据的交互分析,最终⽣成⼀份客观、全⾯、深刻的审核报告。这份报告不仅帮助编辑快速定位问题,更重要的是,它提供了系统性的改进⽅案,让内容质量的提升变得有章可循。
目前,“版慎通”已经形成四大“护城河”,是短期内其他单一竞品较难比拟的。一是技术护城河,“6000亿参数的⼤模型+3000多个专业⼩模型”的模型规模优势。二是数据护城河,江西出版传媒集团数⼗年的⾏业积淀。三是⽣态护城河:从内容创作到出版发⾏的全链条覆盖。四是服务护城河,基于用户反馈的持续学习和改进,从问题发现到解决的完整闭环。我们相信,这些“护城河”将确保“版慎通”在智能审核校对领域的⻓期领先地位,为用户提供持续的价值创造。
*本文视频、图片由作者提供
2025天府书展
“好书优选短视频”征集活动
火热进行中!
点击海报查看报名方式
分享、在看与点赞,商务君至少要拥有一个
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.