
一、审计背景
在建筑企业经营活动中,招投标环节是资金密集、交易频繁、舞弊高发的风险高发地。尤其在近年来“集中采购+电子化招标”持续推进的背景下,围标、串标等违规手法愈发隐蔽,呈现出“表面合规、实质围标串标”的新型舞弊趋势。
在应对此类问题时,传统审计手段面临“三重挑战”。一是数据分散、线索模糊。招投标行为横跨电子招标、供应链、合同等多个系统平台,导致行为链条难以完整还原。二是伪装手段专业化。供应商通过设立壳公司、使用虚拟IP、伪造数据等手段,消除“静态”风险特征。三是业务体量大、审计周期紧。单个项目的基础文件可能多达上千份,审计资源与识别手段难以支撑有效查证。
为破解上述痛点,中国建筑一局(集团)有限公司审计团队(以下简称审计组)提出以“行为特征树”为牵引、以“数智模型组合”为突破口的创新审计思路,灵活运用行为路径聚类、结构化数据挖掘、电子文档OCR以及辅助爬虫技术等多类审计工具,把握全局多点突破,穿透表面合规假象、识别真实关联,精准发现围标、陪标等违规行为,在实战中取得较好成效。同时,通过在多个审计项目中的应用迭代,逐渐探索出一套“可复制、可推广、可演进”的建筑业招投标数智化审计方法。
![]()
![]()
二、审计实践
(一)总体查证思路
2024年,在对集团两家下属公司的经责审计项目中,审计组将招投标环节列为重点审查内容。审前调查过程中,多条线索集中指向一些供应商,这些供应商周围时常伴有其他关联方出现,隐约出现“组团”痕迹,例如注册地址集中于相邻相近位置,成立时间相差不足半年。但这些企业在股权上未呈现直接关联,也未发现明显的围标违规证据。
审计组意识到,要揭开这一隐藏的利益网络,必须突破传统审计方式的局限,运用更先进的数智化技术手段实现深度查证。经过讨论研究,审计组确立了以下总体思路:以招投标违规特征树为指引,从供应商围标行为特征出发,系统梳理可能存在的违规手法与漏洞,并借助数字化技术、AI技术打造多维度的工具模型组合。
第一阶段:绘制违规行为特征树。全面梳理招投标、实施结算与支付、投融资三大环节的常见违规类型与表现形式,明确各类违规行为的典型手段与风险痕迹,初步匹配可应用的数智化技术方法,形成覆盖流程、手段、线索与查证逻辑的全景图谱。
第二阶段:梳理数据源和技术路线。在风险画像基础上,审计组梳理出可用的结构化与非结构化数据源,优选逻辑清晰、技术成熟、可快速落地的分析路径,如供应商关联图谱分析、“握手”(即多家供应商在同一项目中共同投标)共现分析、陪标行为识别等,构建了多点突破的查证策略。
第三阶段:设计开发组合模型并交叉验证。针对不同风险特征,设计并开发多种模型工具,交叉比对分析结果,进一步提升了问题识别的准确性与证据链条的严密性。
第四阶段:补充完善证据链条。结合传统取证方式(如现场访谈、资料核查等),对模型识别结果进行人工核实,确保审计证据真实性、充分性、有效性,支撑后续处理建议。
第五阶段:模型固化与持续迭代优化。根据业务需求与实际应用反馈,持续优化模型参数与功能,推动模型在更大范围的复制推广,不断提升适配性与生命力。
(二)具体查证步骤
1
绘制违规行为特征树,确定技术路线
围绕建筑企业招投标流程的关键节点以及后续利益实现的可能路径,审计组构建了覆盖招投标、商务结算和财务结算、投融资三个环节的“违规行为特征树”,以树状结构形式系统梳理各类常见违规手段、审计线索、数据来源与查证逻辑(见图1)。该特征树不仅作为模型设计的核心依据,也成为实操查证中的路径指南,可作为后续审计项目中的通用审计模型开发蓝本,为全流程风险穿透与多维交叉验证提供了标准化、结构化的技术依据。
![]()
在招投标环节,重点识别供应商之间的串通行为,包括轮流中标、陪标、抬压报价等,主要线索涉及高频共现、报价规律、文件雷同等,通过“握手”分析、文本比对等模型技术加以识别。同时,也关注限制竞争、虚构资质、内部舞弊等问题,并针对性设计了如“资审异常分析”“操作日志审查”等工具模块。
在商务结算与财务结算环节,主要识别高价执行、转包分包、虚增工程量、虚报劳务人员等问题。通过结算对比分析、图像识别、费用比例分析等手段,从结算数据、施工资料、人员信息中提取可疑线索,提升风险识别效率。
在投融资环节,聚焦虚构应收账款、循环融资、虚假担保等风险行为,结合合同文件、资金流水等数据,借助数据可视化与序列分析方法,揭示资金异常流向和虚假交易结构。
2
模型设计和开发
围绕前述“违规行为特征树”,审计组开发了多套组合模型,这些模型从不同角度切入、相互验证,有效提升对围标、串标等违规行为的识别效率,在海量数据中精准聚焦问题线索,主要模型和工具如下。
01
“投标关联图谱分析”模型
模型目标:在海量数据中快速圈定异常交易主体,识别关键节点和潜在关联关系,发现问题源头。
查证逻辑:基于历史投标数据,构建供应商间的关联网络图,挖掘“核心中介”企业及其关联路径,辅助识别隐藏控制人或协同操作行为。
数据来源:集团招投标平台投标记录。
实施步骤:采集并清洗投标基础数据,通过算法生成可视化图谱,可进行节点放大与详情导出,便于深入分析与证据溯源。
模型成效:成功从5万条数据中识别出20组高频“组团投标”供应商。
02
“握手共现”模型
模型目标:在关联图谱的基础上,量化围标企业之间的协作频率,定位核心企业。
查证逻辑:以“握手”为切入点,统计高频组合,结合中标率与报价特征,识别可能存在陪标、轮投或排斥竞争行为。
数据来源:集团招投标平台投标记录。
实施步骤:清洗数据后,通过程序统计各供应商的共同投标次数,量化“协同关系强度”。
模型成效:进一步验证并细化“组团围标”结构,锁定“某系”供应商中的核心企业。
03
“陪标筛查”模型
模型目标:识别中标率异常低、投标次数过高的可疑“陪标”或“壳公司”供应商。
查证逻辑:设置阈值(如高投标次数、低中标率、特定发包方集中度),筛选出具有陪标特征的供应商,结合上下游关系进一步识别协同方。
数据来源:集团招投标平台投标记录。
实施步骤:设定参数后,系统自动筛查并输出可疑名单,支持点击查看企业历史投标行为与关联方。
模型成效:对“组团”内企业进行角色分层识别,明确核心企业与协作辅助方,查证精度进一步提高。
04
“异常排斥”模型
模型目标:揭示存在人为限制投标行为的项目,查证招标环节是否存在有意“清场”的围标行为。
查证逻辑:筛查未入围但报名的供应商,交叉验证入围名单中是否存在存疑供应商,并调阅资格审查记录识别其合理性。
数据来源:集团招投标平台投标记录及相关资审资料。
实施步骤:上传报名与投标数据,系统自动统计入围情况并分析被排除供应商名单,支持进一步人工核查。
模型成效:查实部分项目存在内部操控、排除“异己”现象,获取关键违规证据。
05
电子文档属性与痕迹分析工具
模型目标:识别供应商提交资料中可能存在的造假行为。
查证逻辑:分析投标文件(PDF、Word、图片等)的元数据(创建时间、作者、编辑软件)和图像痕迹(如公章模糊、图层不一致),识别疑似伪造或模板化资料。
数据来源:供应商资质文件、考察资料等电子档案。
模型成效:识别部分资料编辑痕迹,完善证据链。
06
OCR模型与爬虫技术辅助
模型目标:自动提取非结构化文档中的关键信息,发现潜在关联或伪造痕迹。
查证逻辑:运用OCR识别扫描文档中的企业名称、联系人、印章、照片等信息,结合历史资料进行横纵比对,挖掘重复线索与隐性关联。
数据来源:扫描版考察资料、结算文件、企业介绍等文档。
模型成效:发现两家供应商考察资料照片完全相同、公司牌匾并列展示等关键线索,支撑后续关联关系查证;抓取工商网站数据,发现社保缴纳人数与实际项目规模严重不匹配。
3
补充完善证据链条
在基本锁定问题事实的基础上,审计组进一步运用传统审计手段,补充和完善证据链条。通过关键人员访谈、实地走访及调阅补充资料,逐步还原问题全貌。通过系统性、多角度、多技术手段的综合运用,审计组最终形成了一套完整、闭环的证据体系,有效支撑了审计结论的客观性和权威性。审计最终揭示出,某单位原高管在离职后,控制或设立多家建筑劳务公司,依托其在原单位的影响力和人脉资源,通过内外勾连、暗中操控招投标流程,违规获取大量分包工程项目,并在后续结算环节中牟取不当利益,涉及金额巨大。
4
模型固化和迭代升级
在现场审计期间中,审计组紧密结合业务实际与查证结果,持续优化和迭代所开发的数智模型,根据不同场景反馈及时调整算法逻辑、输入参数与界面设计,确保模型“能用、好用、易用”。项目推进期间,模型开发团队与审计业务团队高效协同,实现了从需求提出到工具部署的快速闭环,显著提升模型适应性与操作体验。截至目前,相关模型已在多个项目中成功复制应用,部分模型仍在持续升级过程中,以更好适应工程审计、合规审计、财务审计等多样化审计场景,力求延长工具生命周期,最大化技术投资回报。
![]()
三、审计成果运用
在对某集团下属公司审计过程中,审计组通过对技术工具的应用,从近5万条供应商投标记录和招标任务中,精准识别出涉嫌围标、串标的多笔可疑业务,同时发现以不合理理由限制投标单位的行为,所涉金额较大。
上述数智化审计的实践探索不仅取得实质性成果,也沉淀出一套契合工程建设领域的业务特性,具有可复制性、可推广性的数智化审计方法论。项目中开发出的数智工具包具备多场景适应能力,尽管部分工具尚待完善,但其总体方向明确、框架成熟,具备持续深化应用的潜力,未来随着场景拓展和迭代优化,有望创造更多审计价值。
![]()
![]()
四、经验启示
(一)数智化审计是融合协作的审计
数智化审计的成功关键在于多领域人才的融合协作,由数字化专家提供技术支撑,审计专家提供专业方法,业务专家传递场景理解。实践中,集团审计部门摸索出“专家协作工坊”模式,有效打通知识壁垒,实现数据流、信息流与业务流的深度融合,有效提升了解决复杂问题的能力。
(二)数智化审计是贴近一线的审计
模型是否好用,关键在于是否能深入一线、服务一线、解决一线实际问题。实践中,数字化团队分散至审计现场,现场提出问题、开发模型、测试并优化,确保技术成果能够快速响应需求。实践中,大多数模块3日内即可完成开发,而小型功能甚至可在30分钟内实现,体现出极强的实用性和灵活性。
(三)数智化审计是开放共享的审计
开放互通是推动组织整体数智化审计水平提升的有效手段。一方面,通过先行试点、经验复用、培训交流,让“少数先行者”带动“整体跃升”;另一方面,开放共享也确保模型持续优化与生命周期延长。在实践中,审计部门始终坚持开放理念,积极组织培训、答疑、交流,逐步形成可积累、可迭代、可传承的数智化审计能力。
(四)数智化审计是多维立体的审计
数智化审计的成果不仅体现在查处问题和揭示风险,更应体现为多维度系统性和战略性的综合价值。未来应探索更深层次的数据治理与模型应用,如进行垂直领域本地大模型的微调与知识库建设,构建审计人专属的智能大脑——审计AI大模型,使其理解公司业务、熟悉规章制度、知晓业务数据及存在的问题。智能大脑可以有效辅助审计人员提供更加科学高效的管理咨询建议,帮助审计人员在助力企业治理与高质量发展方面发挥更大作用。
文章摘自《中国内部审计》杂志2025年第8期
作者:陈哲
单位:中国建筑一局(集团)有限公司审计部
编辑:孙哲
目前190000+人已关注我们,您还等什么?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.