大语言模型驱动下审计智能体的构建及财务舞弊识别实践研究|会计|行政处罚决定

分享至

一、前言

财务舞弊是指有目的、有预谋、有针对性的财务造假和欺骗，从而导致会计报表产生不真实反映的故意行为。财务舞弊行为会在某些方面留下蛛丝马迹，诸如会计人员频繁离职、变更注册会计师事务所、关联交易频繁等情况。对于商业银行来说，公司客户的财务数据在授信额度确定、用信条件设定、贷后管理和风险预警等方面发挥着重要作用，因此，如何更有效地识别公司客户的财务舞弊行为，成为银行控制风险的关键举措。

国内很多学者通过建立财务舞弊模型来预测或识别企业的财务舞弊行为。从已有研究来看，主要分为三类：第一类是基于统计知识的模型，如多元判别分析、Logistic回归和Probit回归等（如赵英林和陈素华，2007；岳殿民等，2012；钱苹，2015）。第二类是基于数据挖掘技术的模型，主要涵盖人工神经网络、支持向量机、决策树、机器学习、文本识别技术等（如张佳佳，2021；李心丹，2021等）。第三类是基于大语言模型和专家经验交互的模型、人工智能等技术的模型（如陈唯源和何嘉玉，2024；陈耿和王晨晗，2024；叶钦华和黄世忠，2025等）。

随着算力、数据可得性和统计技术的不断进步，以大模型和人工智能为基础的方法成为财务舞弊研究的主要方向。从既有研究来看，运用人工智能方法开展财务舞弊预测研究的文献数量逐渐增加，应用“大模型+专家知识库”的方式搭建智能体来避免人工智能幻觉、提升模型识别效率的研究相对较少。本文以大语言模型为核心搭建审计智能体，基于已有文献研究成果和专家经验构建财务舞弊风险识别专家知识库，选取2000-2021年间A股上市公司作为样本学习集，以上市公告的财务舞弊公司对审计智能体进行训练，随后在P银行内部审计项目中应用审计智能体，对项目所涉及的公司信贷客户的财务舞弊情况进行预测分析，并在项目现场检查时对相关财务舞弊线索进行核查。研究发现，引入财务舞弊风险识别专家知识库的审计智能体在完成财务舞弊预测识别任务时召回率较高，彰显出“智能体+专家知识库”模式在银行内部审计和风险管理领域的应用价值。这为商业银行系统化甄别客户财务真实性、识别和防范客户财务欺诈风险，提出了可行性较强的人工智能模型构建及发展建议。

二、引入专家机制的审计智能体

本文构建的审计智能体（见图1）主要包含以下核心功能模块：（1）智能决策中枢，以大语言模型（LLM）为核心，协助处理感知到的财务数据输入、财务舞弊识别体系模型，并在预设的审计逻辑约束下进行推理；（2）感知环境的输入，多源异构的财务数据、专家识别体系模型，被输送到决策中枢，固化为可查询到的知识库，为审计决策提供核心依据；（3）行为输出模块，在知识库的驱动和逻辑约束下，完成审计推理，最终输出可执行的审计结论。

在上述功能模块的基础上，将基于文献研究和银行审计专家经验的财务舞弊识别指标体系，转化为一个可计算、可迭代的审计规则执行系统。智能体凭借LLM强大的文本理解与推理能力，运作机制如下：（1）数据整合层，对输入的多源异构上市公司财务数据开展预处理与融合工作；（2）规则固化与执行，将复合指标计算逻辑固化为审计规则，存储于规则库中。执行任务时，审计智能体根据目标激活相应规则，调取关联数据执行指标计算；（3）约束推理与结论生成，在审计逻辑约束层（确保合规性与业务逻辑）的管控下，基于计算结果完成审计分析，输出舞弊识别结论。该审计智能体能够动态、实时地验证该指标体系的有效性，从而形成完整的“理论构建（指标提出）→实证验证（实时计算与识别）→模型迭代（规则与指标优化）”研究闭环。

为将专家知识库融入审计智能体中，本文设计了三层审计逻辑链架构（见图2），确保大模型的推理严格遵循审计逻辑并服务于复合指标体系的动态验证。

1.数据注入层：负责将结构化的上市公司财务数据精准嵌入AI指令。核心任务是将数值型复合指标的计算结果与相关文本描述锚定至提示词，并支持按行业、年份等维度动态构建分析场景，从而为后续的指标验证提供有针对性的数据输入。

2.审计规则层：将依托专家经验构建的舞弊识别知识库转化为可执行的规则树。该层严格限定大模型的链式推理路径，使其必须遵循“指标异常检测—关联会计科目定位—潜在舞弊假设生成—证据链指向分析”的专业审计流程，确保推理聚焦于指标异常的可疑点。

3.推理约束层：对审计智能体的最终输出施加严格约束，强制要求结论附带精确到数据点或指标值的可追溯证据来源，并将大模型可能产生的模糊判断转化为结构化、基于规则和指标证据的决策输出，如舞弊风险等级、具体科目疑点。

图3展示了此三层逻辑链联动下的工作流程，以及在复合指标体系驱动下，大模型进行审计推理时的数据流动路径与结构化决策逻辑。该架构是审计智能体动态执行指标计算、验证指标异常与舞弊关联性，并输出可审计结论的核心机制。

三层逻辑链架构的协同联动，为审计智能体建模动态验证复合指标体系提供了显著的技术优势：一是审计轨迹具备显性化与可验证性。审计智能体所输出的结论能够完整追溯至原始数据源及复合指标计算规则，为指标有效性的实证分析提供透明、可审计的轨迹。二是专家知识库的可复用固化与迭代。将复合指标异常判定逻辑进行系统编码，并沉淀为可迭代更新的规则库，这不仅可以驱动当前审计智能体，更构建了持续优化舞弊识别指标体系的核心知识资产。三是可提供监管合规与量化决策支撑。对关联指标值、数据点、规则等证据进行精确标注，能够满足审计底稿索引要求；规则库预设的指标异常评分阈值，为风险判断提供了客观、可审计的量化依据，显著增强了结论的合规性与说服力。这些技术优势确保了本文提出的方法能够在智能体建模框架下接受严格、透明、符合审计准则的动态验证，并支撑其持续优化，最终达成研究闭环。

三、模型在银行内部审计实务中的应用

（一）研究方案设计

为完成财务舞弊识别任务，数据注入层对企业年报、财报附注等结构化数据与管理层讨论、舆情等非结构化文本进行整合；审计规则层构建专家指标规则库（如存贷双高等），为推理过程提供专家经验指导；推理约束层强制要求大模型必须从规则库中选择专家指标作为推理过程中遵循的原则，实现输出结论逻辑的合规性、可解释的要求。验证方案以证监会处罚的355例舞弊样本与行内客户数据作为观测集来设置实验组（见表1）。

（二）智能体调优过程

1.规则库的迭代优化。通过分析新增样本中的舞弊模式，持续扩充规则库，以覆盖更广泛的异常场景；淘汰效力衰减或无效的规则，确保规则集的简洁与高效；针对不同行业特性细分规则，建立多套具有行业特异性的判别逻辑，以增强泛化能力（见表2）。

2.判别阈值的动态设定。初期，为实现潜在风险的最大限度识别，可适当降低阈值，优先保障较高的查全率。虽然此操作可能导致一定数量的误报，但能够有效控制漏检风险。随着审计反馈数据的不断积累，逐步优化阈值参数，从而达成查全率与查准率之间的平衡，持续提升智能体的实用性与可靠性（见表3）。

3.反馈闭环持续进化。智能体对客户发出高风险预警，并启动审计验证流程，将审计人员确认后的结论（无论真伪）反馈至系统。经过验证的标注样本将用于后续训练，构建“预警—验证—更新”的自治循环，推动智能体在执行过程中持续迭代、不断提升判别能力。

4.可解释性。每次风险预警均需提供清晰的决策依据，包括触发的具体规则、每条规则的权重及其对当前决策的贡献度，要求智能体输出如下形式的结论：“该客户被判为高风险（概率87%），主要依据为：（1）营业收入与销售商品收到现金的差异存在异常（贡献度40%）；（2）毛利率持续高于行业中位数（贡献度30%）；（3）前五大供应商集中度出现显著变动（贡献度17%）。”此类具有可解释性的输出能够显著提升智能体的透明度和可接受度，促进人机协同效率的提高。

（三）引入专家机制的审计智能体

通过查询相关文献（叶钦华等，2022；周卫华等，2022），并结合单位内部审计工作经验总结，本文从基本情况、财务指标、财务舞弊指标、外部负面信息四个方面，建立公司财务舞弊识别模型体系，该体系涵盖企业分红情况、审计意见、货币资金占比、存贷双高、公司被执行次数等74个指标。

本文选取“存贷双高”“存货异常”“应收账款异常”这三个常见财务异常指标作为专家机制引入审计智能体，以进一步验证其对模型效果的提升作用。大模型验证对财务舞弊客户预测的召回率见表4。

经观察可知，引入复合专家指标后，模型的召回率实现显著的跨越式提升（分别提升15.5%，14.1%，15.9%），这表明存贷双高等复合特征能够有效捕捉传统模型所忽略的隐蔽性造假模式。如果将专家经验从单一规则（v1.0）升级至多指标动态联动分析（v2.0）时，召回率进一步提升7.2%，这意味着审计逻辑链的完备性对风险识别起着决定性作用。

（四）在审计项目中的应用

P银行在2023年和2024年所开展的审计项目中，运用该智能体对审计项目涉及的公司信贷客户的财务舞弊风险进行识别，共识别出16个财务舞弊风险程度较高的客户，相关审计线索由审计组在审计项目现场展开核查。通过审计验证发现5家公司信贷客户涉及财务舞弊，这进一步验证了模型的有效性。例如，模型识别出公司信贷客户GT电子有限公司的财务舞弊风险程度较高，通过非现场分析可知，该客户呈现出毛利率显著高于行业平均水平的特征。该客户2021年末财务报表显示，营业收入为25.62亿元、净利润为7.38亿元和所得税为0元，客户毛利率达到34.94%，而行业平均值为12.3%。现场审计发现，客户实际营业收入为18.9亿元，实际净利润为0.77亿元，实际毛利率仅为12.17%。

四、结论

本文研究表明，引入专家经验的财务舞弊指标知识库后，审计智能体在上市公司验证集上的召回率显著提升。专家型审计智能体，能够高效识别潜藏的财务舞弊风险，精准指引线索方向，强调路径可实现，工具可复用，效果可验证，使得审计证据含金量有了质的飞跃。本文为基于大模型开展公司财务舞弊审计提出新的思路：一是“大模型外挂知识库”是人工智能在审计领域应用的重要范式，“通用+专业”双轨协同模式将进一步推动审计向全量数据分析和预测性风险管理方向演进。二是加快构建完善的银行客户数据管理平台，接入工商、司法、税务、征信等外部数据，多渠道、多维度地收集客户财务及非财务信息，引入更多“专家”来完善客户画像，为精准识别客户舞弊奠定基础。三是加强大语言模型在银行内部审计场景的理论研究及应用，强化专家经验和人工智能的交互，提升银行内部审计智能化水平和公司客户财务舞弊风险识别能力，努力实现“科技强审”目标。

文章摘自《中国内部审计》杂志2025年第11期

作者：徐佩利曾鹏宇阿古拉张晋烽熊文王可瑞

单位：中国邮政储蓄银行审计局中国邮政储蓄银行软件研发中心中国邮政储蓄银行审计局广州分局

编辑：孙哲

目前190000+人已关注我们，您还等什么？

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.