53.7% 高学历政企人员“看走眼”！公文写作AI智能体首次通过图灵测试|无忧|ai智能体

53.7% 高学历政企人员“看走眼”！公文写作AI智能体首次通过图灵测试

2025-10-09 15:37:14　来源: InfoQ

北京举报

分享至

文 | 棱镜

53.7% 的高学历政企人员“看走眼”，将 AI 生成的公文误判为人类作品！

在 2025 中国国际大数据产业博览会期间，一场由贵阳市国信公证处见证的双盲测试引发政企界的关注。72 名高学历政企人员（69% 来自党政机关、事业单位或国企，99% 本科以上）被要求在 10 分钟内，阅读 6 篇文章并识别 AI 生成文本，其中包含 3 篇方寸无忧的 AI 产品“方寸智脑”现场生成的文本，以及 3 篇政府网站下载的人类创作文章。

测试结果显示，有 53.7% 参与者误将 AI 文本认作人类创作文本。这场突破性测试印证了 AI 在政务写作领域的成熟度，更揭示了深度行业化 AI 正跨越工具阶段，向决策伙伴进化。

现场观众进行“人机测试”(受访者供图)

国务院《关于深入实施“人工智能 +”行动的意见》明确要求增强 AI 公共治理作用。然而，IDC 2024 数据显示，由于政务场景的合规要求与通用大模型的幻觉风险，政务 AI 的落地率仍不足 35%。这一困局正被方寸无忧与华为云的联合方案打破。凭借“方寸智脑”融合政务专家知识的模型能力与华为云 Tokens 服务的高效协同，双方构建了极致精准、高效的政务 AI 写作新范式，将政务审校准确率提升至 99%，公文写作效率提升 20 倍以上。

1 政务智能化转型的“现实之困”

当前，各级政府正积极推进“一网通办”“一网统管”的数字化治理新模式，通过人工智能技术整合政务数据、社会数据和物联网数据，实现更精准的治理决策。政务办公全流程数字化与智能化转型已成为必然的趋势，然而在这场深刻的变革中，公文写作这一基础而又关键的环节却面临着特殊的挑战。

在效率层面，传统公文写作往往需要耗费数天时间。撰写一份高质量的汇报材料，经常需要查阅大量文件，反复推敲表述，加班到深夜是常态。传统公文写作耗时耗力的过程，工作效率较低，加上工作人员还面临知识盲区风险。以撰写制造业发展计划为例，工作人员不仅需理解制造业政策、技术趋势、区域经济布局，还要熟悉本地企业情况、产业链短板及政策补贴导向，这些复杂且多元的知识要求，对机关工作人员而言往往构成极高的专业壁垒。

技术层面同样面临严峻挑战。通用大模型虽然在某些领域表现出色，但其固有的幻觉问题与政务场景对准确性的极致要求形成尖锐矛盾。政府公文涉及政策表述、数据引用等关键信息，必须百分之百准确，甚至要做到一个字都不能错。这就需要既具备行业专业知识，又能确保安全可控的技术解决方案。

此外，政务安全层面的考量更为关键。政务文本往往涉及重大政策表述、敏感数据信息等重要内容，一旦出现差错，可能引发严重的政治风险。这种风险使得许多政府部门对 AI 写作工具持谨慎态度。

“无数个凌晨伏案工作的日夜，走出办公室时，已是满天星光。”方寸无忧联合创始人、高级副总裁梅俊博士的亲身经历，正是这种困境的真实写照。他曾因紧急任务连续工作五天，脚肿得无法走路。这种刻骨铭心的体验，让他坚定了通过技术创新将政务工作者从重复性脑力劳动中解放出来的决心。

2 首破图灵测试！政务公文写作三阶跨越的 AI 引擎

如何在确保安全、准确的前提下，真正实现 AI 赋能政务办公的突破性进展？经过不断探索，梅俊博士带领团队，基于方寸无忧可私有化的“方寸智脑”智能体平台，打造出精准高效完成公文写作任务的智能体。

在 2025 年 8 月中国国际大数据产业博览会上，“方寸智脑”以其突破性的技术表现，获得行业广泛关注。图灵测试结果显示，53.7% 的参与者将“方寸智脑”公文写作智能体生成文本判定为政府发布的真实公文，较政府发布的真实公文高出 6.02%。这一突破性成果的背后，是“方寸智脑”与华为云的深度技术融合。

方寸无忧 CTO 杨钢曾在分享中谈到，AI 应用的发展大致分为三个阶段，从直接使用 Prompt，到使用 Dify 之类的工具创建固化流程的 Agent，再到通用 Agent 自主规划。“方寸智脑”作为政务公文写作领域首个支持完全私有化的通用 Agent，成功实现了政务公文写作从“人机协同写得像”到“自主运行写得准”再到“辅助决策写得优”的三阶跨越。

“方寸智脑”的技术创新主要基于四大内核体系：

专用模型层面采用“大小模型协同”架构，利用专项训练的自研模型处理专业、高精度任务（如政务审校），结合前沿通用大模型处理开放性任务（如内容生成），并通过多智能体协同、微决策拆解和任务约束技术解决大模型“幻觉”问题，确保内容“写文回答必有出处”；
专家知识层面公文专家梅俊博士的 AI 公文写作方法论深度融入产品，确保智能体输出符合公文规范和专家思维；方寸首席内容官张凤强和 20 余名时政专家组成的团队，对重要表述、政策变化进行实时人工审核与更新，确保规则库的权威性和及时性；
数据层面基于方寸无忧 9 年来积累的海量高质量数据，建立了包括 5 亿条审校数据、近千万审校规则的审校数据库；通过数据清洗、结构化处理与知识图谱构建，建立的近 800 万篇包括中央级、国家级、省市级机关单位的公文、政策与法规的公文数据库；
工具层面集成了公文写作、政策解读等上百种专业工具，支持 AI 智能体快速调用工具解决复杂问题。

这种技术架构的创新性在于，它不仅解决了政务写作的效率问题，更重要的是建立了完整的安全保障体系，从源头上杜绝了政治风险的发生。

在“方寸智脑”的背后，华为云 Tokens 服务为这一智能写作系统提供了强大的算力支撑。基于 CloudMatrix 384 超节点和 xDeepServe 架构，该服务提供单芯片最高 2400TPS 吞吐量与 50ms 超低时延的性能表现，确保了“方寸智脑”核心推理能力的高效运行。正是依托这一强大的算力基础，“方寸智脑”独创的“一个大脑统筹，九位专家协同” 智能体架构得以高效运转。

以行动计划为例，用户仅需输入标题，系统就能够自动调度信息搜索、资料分析、主题提炼、结构生成、内容润色、合规审校等 9 个专家智能体进行分工作业，形成流水线闭环，将原本需要数天的公文写作过程压缩至 15-20 分钟。

该解决方案还利用华为云全栈云服务构建安全可信底座，支持完全私有化部署，确保政务数据不出域、不泄露，满足最高安全要求。未来计划适配华为政务云和 Cloudpond，进一步拓展应用场景。通过华为云 MaaS 平台和商城，方寸无忧的智能体能力得以更广泛地触达客户，而 Tokens 服务的按需付费模式，显著降低了政企客户，尤其是中小型单位使用高级 AI 写作能力的门槛，推动 AI 能力的规模化、普惠化落地。

3 落地实践，AI 如何成为“体制内笔杆子”？

任何颠覆性技术的出现都会引发关于“替代人类”的讨论，AI 公文写作也不例外。面对这样的疑问，梅俊的回应清晰地表明了公司的价值观：技术的终极目的不是替代人类，而是通过人机协同，将工作者从重复性高、规范性强的任务中解放出来，使其能将更多精力专注于策略优化、政策创新和创造性思考等更具价值的工作。

这一理念正在全国各级政务部门得到实践验证，目前“方寸智脑”已服务 2000 余家用户，包括 19 个部委单位、覆盖 25 个省、260 余家省厅级单位、600 余家地市级单位以及 500 余家企事业单位，展现出强大的落地应用能力。

当前“方寸智脑”的智能政务审校、智慧公文写作在各级政府、媒体和国央企的成功实践，为 AI 政务应用的深度发展奠定了坚实基础。随着政务数字化进程的加速，方寸无忧与华为云正携手推动智能写作向更高阶段演进。短期来看，依托华为云 MaaS 平台和灵活的 Tokens 服务，方寸无忧将快速开放税务、法律等垂直智能体，显著降低政企客户的定制化成本和部署门槛。从长期发展视角，AI 政务应用正在经历从工具到伙伴的深刻转型。

未来 AI 将不再仅仅是提供标准答案的百科全书，而是进阶为能够理解治理逻辑、提供决策参考的“行业级军师”和“可信赖伙伴”。当 AI 能写出人机难辨的公文，意味着AI智能体开始深度理解治理逻辑与行业知识，这才是数字政府智能化转型的真正开端。方寸无忧与华为云在 MaaS 生态下的深度合作，正为这一未来铺设坚实的算力与智慧基石。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.