不敢信？中国AI国家队出手，刚刚通关了万亿级主战场「地狱副本」|飞轮|招采|招标|标书|智能体

分享至

新智元报道

编辑：编辑部【新智元导读】人人都在夸智能体有多强，但真正的生死考场从不是Demo现场，而是几亿金额、零容错的招标采购。英伟达和OpenAI才刚喊口号，但这家AI已经先走了一步，趟过落地的深水区了。

这几天，「打工人版」Claude火得一塌糊涂。

一键清空桌面、杂乱笔记瞬间成报告，甚至，给AI一个文件夹，就能直接帮你干活。

毫不夸张地说，你的父母都能用上「编码版」Claude了！还有人惊呼，「这就是第二个ChatGPT时刻」。

更令人惊掉下巴的是，Claude之父自曝，Claude纯100%编码，一周半就创造出了Cowork，端到端真正实现了闭环。

不仅如此，最近爆红的各种Claude Skills库，直接给AI加上了双重buff，「技能包」让AI智能体干活更得心应手。

有的Skills GitHub库，直接刷爆近40k星标。

一夜之间，AI智能体竟变得这么强了？

硅谷AI能造APP，却卡在最后一公里

人们常说2025年是「智能体元年」，但要真正规模化普及，还得看2026年。

CES 2026大会上，老黄再一次对当前AI的进展，做出了前瞻性的判断——

智能体本身，就是未来的交互界面。

无独有偶，OpenAI总裁Greg Brockman也给出了惊人一致的判断：2026年，将是企业级智能体真正普及的一年。

回望过去一年，我们看着OpenAI Operator在浏览器里熟练地帮人订机票；看着Grok 4并行多个智能体，暴力破解了人类最高难度的纯文本考试；看着Claude Code让不懂代码的普通人，在几小时内手搓出一个App。

Claude之父Boris Cherny半开玩笑地说，他过去三十天的代码贡献，100%都是由Claude Code完成

一切看起来都很美好。AI似乎已经无所不能，它能写诗、能画画、能写代码。

但是，且慢。

如果你把视角从硅谷的演示Demo，拉回到真实且残酷的商业世界，你会发现一个尴尬的「最后一公里」断层：

这些聪明的AI，敢不敢让它去审核几亿金额的标书？敢不敢让它在没有人类盯着的情况下，对涉及法律责任的流程做判断？

绝大多数时候，答案是沉默。

因为写错代码可以Debug，画错图可以重绘，但在商业核心业务——

尤其是招标采购这种合规要求高、风险集中的领域，错误的代价往往是巨额罚款、法律诉讼，甚至是牢狱之灾。

这才是AI落地的真正深水区。

地狱级副本：招标采购领域的AI转型

如果不是央国企或大型集团的供应链负责人，你很难想象这个岗位的「酸爽」。这绝不仅仅是填几张表那么简单。

招标采购，是连接企业供应链上下游的超级枢纽。在这个枢纽里，充满了著名的「不可能三角」：合规、成本、效率。

标书审阅效率低，合规风险难防控

首先合规问题，招标文件隐性风险审查、评审环节主观判断，都存在一定的人为干预，影响了公平公正。

还有成本极难控制，流程中人工加班、重复工作是显性成本，供应商选择不当，更成为了难以回避的隐性成本。

从效率来说，从招标文件编制、审核、再到评审环节专家评审，都需要消耗大量的人工精力。

这三大挑战，依靠传统的人工模式，已经难以跟上企业的发展需求。

投标异常行为，屡禁难止手段难辨

在投标环节，往往会出现各种异常行为。

以市政EPC项目为例，专家需在短时间内，对几百份文件进行风险排查，标书动辄上千页。

传统的方式比如文档识别，很难深层次检测投标文件内容本身异常，比如文本语义级相似、图片实质性相似、关键要素相似、报价规律性等。

因此，这些过程皆需要专家逐字逐句进行比对，工作量巨大。

文件编审周期长，评审公平保障难

科大讯飞数字化业务群CTO张永亮举了一个真实的场景案例：

业务方提出如下一个采购需求，到了编制环节，编制人员可能因为对条款不熟悉、项目不了解，导致效率低，甚至可能出现很多漏洞。

再到下一个环节中，审核人员又需要耗费大量精力查找隐性条款，若因查得不仔细，还会导致流标、供应商投诉等问题。

从管理者角度来说，历史招标过程中沉淀的优质经验，难以得到复用。

在传统模式下，不同专家的评分偏差率高，甚至一些项目因评分争议需要复核。

传统的电子化招采系统（如SRM系统），本质上只是把纸质流程搬到了线上。它们能解决流程流转的问题，但解决不了「决策」的问题。

与之相对的，现代大模型可以比对几百份标书的资质、筛查风险、判断价格合理性，但它们普遍存在的「幻觉」问题，对要求100%合规的招采行业来说堪称是「史诗级灾难」。

因此，行业真正等待的，并不是一个更聪明的AI，而是一套能够嵌入主流程、边界清晰、结果可核查的智能系统。

一座「智能体工厂」

回顾招采技术的发展，我们经历了从小模型专精（如OCR自动评标）的1.0时代，到大模型泛化认知的2.0时代。

而现在，随着全流程自主规划能力的出现，行业终于迈入了「智能体（Agent）」的3.0时代。

1月13日，「AI国家队」科大讯飞重磅发布的「招采智能体平台」，给出了一个完全不同的解题思路。

它彻底抛弃了「辅助工具」的定位，直接提出了一个大胆的概念：智能体工厂（Agent Factory）。

这意味着，讯飞把招采领域几十年积累的专业能力，全部拆解成了标准的「智能乐高模块」。

由此一来，以上三个痛点迎刃而解。

招采智能体精准嵌入「全流程」：编标环节自动生成招标文件，并进行合规检测；清标环节智能体揪出报价雷同、资质造假等问题；评标环节评审智能体，主动审查同时给专家一个参考。

招标文件编审智能体：只要用自然语言讲出需求就会自动回填项目信息、分析场景、选范文模板、推荐评审规则，一键出稿。还能针对招标文件的风险进行全方位的审查，再也不用人工对着法律条文逐条修改。

异常行为检测智能体：先解析所有招标、投标文件，把文本、图片都转成结构化数据；随后从企业关联、语义相似、报价规律等8个维度，精准检出异常行为迹象；最后生成风险预警、异常详情和结果判定，连证据链都给你整理好。

辅助评标智能体：打破传统评标引擎「黑盒调试难」困局，实现定点调试提效，进一步提升评审准确率，支持私有化部署深度适配企业个性化需求。

像搭积木一样，搭建智能体

作为招采行业的探路者，科大讯飞认识到：招采比他们想象的更加复杂。本质上是因为，缺乏承上启下的载体。

而这个全新的招采智能体平台，以Agent作为底座，打造了一个专属于行业的智能体平台。

它融合了行业知识库，利用Workflow构建了全场景的招采智能体应用。

这样，就能通过搭积木的方式，降低开发门槛，实现应用的快速落地。

而且，这个平台还有40多个场景的子Agent，比如招标文件解析，资质验真。

同时，平台还整合了11万多个泛行业的优质智能体，覆盖生活、学习、办公全场景。

要知道，速度就是企业AI落地的核心需求。

而这个平台，可以让你零代码、用自然语言描述需求，快速生成应用。另外，低代码工作流可以把各种能力、插件、组件、工具拼接起来。

现场怎样搭一个智能体

在大会现场，科大讯飞的工作人员为我们演示了如何像搭积木一样，搭建一个评审办法解析智能体。

其中，子Agent、知识库等，都是在招采智能体中上线的原子能力Agent。

具体步骤如下：首先，在开始节点配置输入，导入招标文件。

接着，招标文件解析Agent，可以利用多模态识别能力将招标文件内容解析为结构化信息。

然后，通过评审办法抽取一个Agent。接着在知识库节点，选择适配的大模型。

而初步评审办法解读Agent和详细评审办法解读Agent，会依次工作。

再后面的招标规则整合Agent，就可以实现对评审办法的全维度梳理，然后进行结构化的输出。

就这样，短短几分钟的时间，这个平台就搭建出一个Agent。

接下来，工作人员还具体演示了，怎样用它调试一个真实的项目。

导入一份招标文件，输入提示词，短短几秒就得到了具体的评审因素、打分因素、评分标准的关键等。

RPA赋能智能体

在招采过程中，有很多重复性很强的工作。比如在评标环节，专家经常需要第三方的网站，用到它们的知识，极其繁琐。

而且，资质条款的核验需要在企业内部查询，还需要手动核对，耗时又费力。

而科大讯飞的资质验真Agent，可以自主决策核验路径。全程都无需人工介入，能真正解放人力，提升效率。

这就是Agent*RPA比起传统RPA的优势。而现在，完全可以让Agent成为RPA的大脑。

工作人员演示了，资质验真Agent是怎样运行的。

首先，上传一份投标文件，输入评审条款。

然后Agent就识别出，需要到信用中国去实现验证。

接下来，RPA就代替了人手、人眼，完成了验证工作。全程它都在自主操作。

最后，它识别到了匹配度最高的一家公司。并且验证出该投标人并未被列入失信被执行人名单。

总之，如果说Agent是大脑，RPA就是它的双手，可以轻松打通上下游系统。

另外，辅助评标这个复杂的流程也放到智能体平台上了，企业可以快速增加节点，上传知识，完成企业自己的评标智能体开发。

实践证明，科大讯飞招采智能体平台在实际落地时AI与专家的主观项排名一致率已达到95%。

从成熟的智能体生态，到零门槛的快速搭建，RPA的高效协同，再到简洁的调试和模型精调，整个智能体平台，将为招采行业开启应用开发的新范式！

四个「反直觉」判断

如果说产品功能只是表象，那么透过此次发布会，我们可以提炼出四个触及AI B端落地灵魂的「反直觉」行业判断。

判断一：Agent必须从「聊天助手」进化为「可信赖的业务执行单元」

在消费级场景，AI的答复可以天马行空。

但在招采这类严谨的商业领域，AI输出的任何结果都必须建立在三个基石之上：可执行、可核查、可追溯。

这要求AI不再是一个仅能对话的「参谋」，而必须成为一个深度理解业务规则、能够自主完成复杂任务链且过程全透明的「专业执行者」。

讯飞通过构建40多个专业子Agent的能力矩阵，并实现其间的规划与协同，为AI配备了精准的招采「操作指南」，确保其操作稳定、规范，从而真正胜任关键业务环节。

判断二：高自由度是风险，约束才是核心竞争力

通常我们认为AI越自由、越有创造力越好。

但在招采这种规则系统里，Agent必须放弃「自由发挥」。

此时，真正的工程能力，在于如何把Agent拆解进流程，用规则去校验它，用多重逻辑去约束它。

用一句话总结就是：

智能招采不是在展示模型有多聪明，而是在验证工程约束能力有多强。

对此，讯飞采用了SuperAgent架构，通过主Agent调度10+个子Agent，并接入招采法律法规库和行业知识库进行严格约束。

判断三：「长期活着」比「一次跑通」重要一万倍

做一次完美的演示很容易，但在真实环境中活下来很难。

招采的规则会变，流程会变，异常情况才是常态。

真正的技术门槛在于：当规则变更时，系统是否依然可用？在没有人工兜底的极端情况下，系统是否依然稳定？

因此，Agent能否进入主流程，取决于它的「生存能力」，也就是系统的鲁棒性。

如今，科大讯飞已经和许多龙头企业，在招采产品中进行了合作落地，成功跑通流程。

发布会上，一位重量级嘉宾的出现很有说服力——国家能源集团物资有限公司科技信息部主任朱捷。

作为「智能评审的开创者」，朱捷分享了一个震撼的数据：

他们早已不仅是试用，而是实现了「智能无人评审」的规模化应用。

在集团内部，AI已辅助评审订单高达18万单，评审准确率已超过97%。

判断四：这是一条「不可逆」的单行道

招采属于企业最敏感、最难回退的系统之一，一旦引入AI，回退成本极高。

讯飞「招采智能体平台」，正体现了这一不可逆性。

不可逆的核心在于，一旦企业尝试到AI带来高效率、公平公正与全链路优化，就不可能再心甘情愿退回到传统低效率模式。

想象一下，过去海量标书评审，人工耗费数小时甚至数天，异常行为检测依赖专家主观判断。

如今，通过平台实现多维度风险预警与人机协同，让企业招采效率跃升，运营成本大幅降低。

这意味着，招采领域的Agent应用，正在从实验期走向了真正的落地期。

为什么是科大讯飞？

在AI Agent这条赛道上，几乎所有的科技大厂都下了重注，而且还有无数的初创前仆后继。

为什么偏偏是科大讯飞，在招采这个细分但极度重要的领域跑通了？

答案可能藏在三个关键词里：「底座」、「领域」与「数据」。

首先是国产算力底座的硬气。

在当前的国际局势下，央国企对数据安全和供应链安全的考量处于最高优先级。

科大讯飞与华为联手打造的「飞星一号/二号」平台，构建了纯国产的算力底座。

这种在硬件层面的自主可控，是其他依赖海外GPU的厂商无法比拟的护城河。

其次是讯飞星火大模型的「通专结合」。

招采业务极其考验多模态能力——既要看懂晦涩的法律文本，又要看懂复杂的工程图纸，还要比对公章的真伪。

讯飞星火大模型长期的迭代，尤其是其在图文理解上的优势，恰好匹配了招采的痛点。

除了招采领域，基于讯飞星火大模型底座，打造的垂类模型早已遍地开花。

星火医疗大模型深度赋能诊疗、健康交互等多场景；星火法律大模型打造AI专属顾问，让法律咨询服务公平可及....

这些生动的实践，正是讯飞「1+N」战略布局的有力印证，让通专结合的模式脱颖而出。

最关键的，是经过实战验证的数据飞轮。

更深一层看，「通专结合」之所以真正落地，并不是只因为底座强、垂类多，而是它天然具备了跑出数据飞轮的条件。

一方面，大模型提供了强泛化的理解与推理能力，能把招采复杂场景先跑通；另一方面，垂类模型和智能体钉进具体环节，让LLM在真实业务中获得高密度的反馈。

由此，便形成了越用越准、越准越用的闭环。

比如，合肥公共资源交易中心，就利用「智慧交易智能体」将一致性提升到了95%。

还有如上提到的国家能源集团的智能评审系统，已辅助评审订单高达18万单，准确率超97%。

这种在央企实战中打磨出来的算法精度和业务逻辑，是任何实验室里都跑不出来的数据壁垒。

目前，讯飞在AI招采的市场份额持续领先。

从中国石油到国家电投，这些掌握着国家经济命脉的巨头们，不约而同地成为了讯飞的合作伙伴。

这些行业巨头的率先采用与成功实践，有力证明了AI在复杂B端场景的可行性。

如今，当AI Agent开始在招采这样严谨、复杂的领域挑起大梁，我们有理由相信，2026年，确实会成为一个分水岭。

它标志着AI从「玩具」变成了「工具」，从「副驾驶」坐到了「主驾驶」。

对于所有的企业管理者来说，现在的问题已经不是「要不要用AI」，而是——

「你的业务流程，准备好迎接一位硅基新同事了吗？」

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

不敢信？中国AI国家队出手，刚刚通关了万亿级主战场「地狱副本」

贾国龙与罗永浩被禁言，微博CEO回应

罗永浩、贾国龙微博账号均被禁言

罗永浩、贾国龙微博账号均被禁言

全队身价=登贝莱，他们凭什么领跑法甲？

李湘翻车，早就有迹可循！

清流|酒店商家在携程和美团之间沦为炮灰

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

今年冬天最时髦保暖的4组搭配，照着穿美出新高度！

180米！上海北外滩新地标，设计藏了3个“小心机”

北境飘雪南园绽，青秀山用一场菊花展，藏住南宁冬日顶流密码！

精神科医生：家长的“为你好”也可能对孩子造成创伤

岁月柔情 现代品质轻奢

岁月柔情现代品质轻奢