![]()
新智元报道
编辑:编辑部【新智元导读】人人都在夸智能体有多强,但真正的生死考场从不是Demo现场,而是几亿金额、零容错的招标采购。英伟达和OpenAI才刚喊口号,但这家AI已经先走了一步,趟过落地的深水区了。
这几天,「打工人版」Claude火得一塌糊涂。
一键清空桌面、杂乱笔记瞬间成报告,甚至,给AI一个文件夹,就能直接帮你干活。
毫不夸张地说,你的父母都能用上「编码版」Claude了!还有人惊呼,「这就是第二个ChatGPT时刻」。
![]()
![]()
更令人惊掉下巴的是,Claude之父自曝,Claude纯100%编码,一周半就创造出了Cowork,端到端真正实现了闭环。
![]()
不仅如此,最近爆红的各种Claude Skills库,直接给AI加上了双重buff,「技能包」让AI智能体干活更得心应手。
有的Skills GitHub库,直接刷爆近40k星标。
![]()
一夜之间,AI智能体竟变得这么强了?
硅谷AI能造APP,却卡在最后一公里
人们常说2025年是「智能体元年」,但要真正规模化普及,还得看2026年。
CES 2026大会上,老黄再一次对当前AI的进展,做出了前瞻性的判断——
智能体本身,就是未来的交互界面。
![]()
![]()
无独有偶,OpenAI总裁Greg Brockman也给出了惊人一致的判断:2026年,将是企业级智能体真正普及的一年。
![]()
回望过去一年,我们看着OpenAI Operator在浏览器里熟练地帮人订机票;看着Grok 4并行多个智能体,暴力破解了人类最高难度的纯文本考试;看着Claude Code让不懂代码的普通人,在几小时内手搓出一个App。
![]()
Claude之父Boris Cherny半开玩笑地说,他过去三十天的代码贡献,100%都是由Claude Code完成
一切看起来都很美好。AI似乎已经无所不能,它能写诗、能画画、能写代码。
但是,且慢。
如果你把视角从硅谷的演示Demo,拉回到真实且残酷的商业世界,你会发现一个尴尬的「最后一公里」断层:
这些聪明的AI,敢不敢让它去审核几亿金额的标书?敢不敢让它在没有人类盯着的情况下,对涉及法律责任的流程做判断?
绝大多数时候,答案是沉默。
因为写错代码可以Debug,画错图可以重绘,但在商业核心业务——
尤其是招标采购这种合规要求高、风险集中的领域,错误的代价往往是巨额罚款、法律诉讼,甚至是牢狱之灾。
这才是AI落地的真正深水区。
地狱级副本:招标采购领域的AI转型
如果不是央国企或大型集团的供应链负责人,你很难想象这个岗位的「酸爽」。这绝不仅仅是填几张表那么简单。
招标采购,是连接企业供应链上下游的超级枢纽。在这个枢纽里,充满了著名的「不可能三角」:合规、成本、效率。
标书审阅效率低,合规风险难防控
首先合规问题,招标文件隐性风险审查、评审环节主观判断,都存在一定的人为干预,影响了公平公正。
还有成本极难控制,流程中人工加班、重复工作是显性成本,供应商选择不当,更成为了难以回避的隐性成本。
从效率来说,从招标文件编制、审核、再到评审环节专家评审,都需要消耗大量的人工精力。
这三大挑战,依靠传统的人工模式,已经难以跟上企业的发展需求。
![]()
投标异常行为,屡禁难止手段难辨
在投标环节,往往会出现各种异常行为。
以市政EPC项目为例,专家需在短时间内,对几百份文件进行风险排查,标书动辄上千页。
传统的方式比如文档识别,很难深层次检测投标文件内容本身异常,比如文本语义级相似、图片实质性相似、关键要素相似、报价规律性等。
因此,这些过程皆需要专家逐字逐句进行比对,工作量巨大。
文件编审周期长,评审公平保障难
科大讯飞数字化业务群CTO张永亮举了一个真实的场景案例:
业务方提出如下一个采购需求,到了编制环节,编制人员可能因为对条款不熟悉、项目不了解,导致效率低,甚至可能出现很多漏洞。
再到下一个环节中,审核人员又需要耗费大量精力查找隐性条款,若因查得不仔细,还会导致流标、供应商投诉等问题。
从管理者角度来说,历史招标过程中沉淀的优质经验,难以得到复用。
在传统模式下,不同专家的评分偏差率高,甚至一些项目因评分争议需要复核。
传统的电子化招采系统(如SRM系统),本质上只是把纸质流程搬到了线上。它们能解决流程流转的问题,但解决不了「决策」的问题。
与之相对的,现代大模型可以比对几百份标书的资质、筛查风险、判断价格合理性,但它们普遍存在的「幻觉」问题,对要求100%合规的招采行业来说堪称是「史诗级灾难」。
因此,行业真正等待的,并不是一个更聪明的AI,而是一套能够嵌入主流程、边界清晰、结果可核查的智能系统。
一座「智能体工厂」
回顾招采技术的发展,我们经历了从小模型专精(如OCR自动评标)的1.0时代,到大模型泛化认知的2.0时代。
而现在,随着全流程自主规划能力的出现,行业终于迈入了「智能体(Agent)」的3.0时代。
1月13日,「AI国家队」科大讯飞重磅发布的「招采智能体平台」,给出了一个完全不同的解题思路。
它彻底抛弃了「辅助工具」的定位,直接提出了一个大胆的概念:智能体工厂(Agent Factory)。
这意味着,讯飞把招采领域几十年积累的专业能力,全部拆解成了标准的「智能乐高模块」。
由此一来,以上三个痛点迎刃而解。
招采智能体精准嵌入「全流程」:编标环节自动生成招标文件,并进行合规检测;清标环节智能体揪出报价雷同、资质造假等问题;评标环节评审智能体,主动审查同时给专家一个参考。
招标文件编审智能体:只要用自然语言讲出需求就会自动回填项目信息、分析场景、选范文模板、推荐评审规则,一键出稿。还能针对招标文件的风险进行全方位的审查,再也不用人工对着法律条文逐条修改。
异常行为检测智能体:先解析所有招标、投标文件,把文本、图片都转成结构化数据;随后从企业关联、语义相似、报价规律等8个维度,精准检出异常行为迹象;最后生成风险预警、异常详情和结果判定,连证据链都给你整理好。
辅助评标智能体:打破传统评标引擎 「黑盒调试难」 困局,实现定点调试提效,进一步提升评审准确率,支持私有化部署深度适配企业个性化需求。
像搭积木一样,搭建智能体
作为招采行业的探路者,科大讯飞认识到:招采比他们想象的更加复杂。本质上是因为,缺乏承上启下的载体。
而这个全新的招采智能体平台,以Agent作为底座,打造了一个专属于行业的智能体平台。
它融合了行业知识库,利用Workflow构建了全场景的招采智能体应用。
![]()
这样,就能通过搭积木的方式,降低开发门槛,实现应用的快速落地。
而且,这个平台还有40多个场景的子Agent,比如招标文件解析,资质验真。
同时,平台还整合了11万多个泛行业的优质智能体,覆盖生活、学习、办公全场景。
![]()
要知道,速度就是企业AI落地的核心需求。
而这个平台,可以让你零代码、用自然语言描述需求,快速生成应用。另外,低代码工作流可以把各种能力、插件、组件、工具拼接起来。
![]()
![]()
现场怎样搭一个智能体
在大会现场,科大讯飞的工作人员为我们演示了如何像搭积木一样,搭建一个评审办法解析智能体。
其中,子Agent、知识库等,都是在招采智能体中上线的原子能力Agent。
具体步骤如下:首先,在开始节点配置输入,导入招标文件。
接着,招标文件解析Agent,可以利用多模态识别能力将招标文件内容解析为结构化信息。
然后,通过评审办法抽取一个Agent。接着在知识库节点,选择适配的大模型。
而初步评审办法解读Agent和详细评审办法解读Agent,会依次工作。
再后面的招标规则整合Agent,就可以实现对评审办法的全维度梳理,然后进行结构化的输出。
就这样,短短几分钟的时间,这个平台就搭建出一个Agent。
![]()
接下来,工作人员还具体演示了,怎样用它调试一个真实的项目。
导入一份招标文件,输入提示词,短短几秒就得到了具体的评审因素、打分因素、评分标准的关键等。
![]()
![]()
RPA赋能智能体![]()
在招采过程中,有很多重复性很强的工作。比如在评标环节,专家经常需要第三方的网站,用到它们的知识,极其繁琐。
而且,资质条款的核验需要在企业内部查询,还需要手动核对,耗时又费力。
而科大讯飞的资质验真Agent,可以自主决策核验路径。全程都无需人工介入,能真正解放人力,提升效率。
这就是Agent*RPA比起传统RPA的优势。而现在,完全可以让Agent成为RPA的大脑。
工作人员演示了,资质验真Agent是怎样运行的。
首先,上传一份投标文件,输入评审条款。
然后Agent就识别出,需要到信用中国去实现验证。
![]()
接下来,RPA就代替了人手、人眼,完成了验证工作。全程它都在自主操作。
![]()
最后,它识别到了匹配度最高的一家公司。并且验证出该投标人并未被列入失信被执行人名单。
总之,如果说Agent是大脑,RPA就是它的双手,可以轻松打通上下游系统。
![]()
另外,辅助评标这个复杂的流程也放到智能体平台上了,企业可以快速增加节点,上传知识,完成企业自己的评标智能体开发。
![]()
实践证明,科大讯飞招采智能体平台在实际落地时AI与专家的主观项排名一致率已达到95%。
从成熟的智能体生态,到零门槛的快速搭建,RPA的高效协同,再到简洁的调试和模型精调,整个智能体平台,将为招采行业开启应用开发的新范式!
四个「反直觉」判断
如果说产品功能只是表象,那么透过此次发布会,我们可以提炼出四个触及AI B端落地灵魂的「反直觉」行业判断。
判断一:Agent必须从「聊天助手」进化为「可信赖的业务执行单元」
在消费级场景,AI的答复可以天马行空。
但在招采这类严谨的商业领域,AI输出的任何结果都必须建立在三个基石之上:可执行、可核查、可追溯。
这要求AI不再是一个仅能对话的「参谋」,而必须成为一个深度理解业务规则、能够自主完成复杂任务链且过程全透明的「专业执行者」。
讯飞通过构建40多个专业子Agent的能力矩阵,并实现其间的规划与协同,为AI配备了精准的招采「操作指南」,确保其操作稳定、规范,从而真正胜任关键业务环节。
判断二:高自由度是风险,约束才是核心竞争力
通常我们认为AI越自由、越有创造力越好。
但在招采这种规则系统里,Agent必须放弃「自由发挥」 。
此时,真正的工程能力,在于如何把Agent拆解进流程,用规则去校验它,用多重逻辑去约束它。
用一句话总结就是:
智能招采不是在展示模型有多聪明,而是在验证工程约束能力有多强。
对此,讯飞采用了SuperAgent架构,通过主Agent调度10+个子Agent,并接入招采法律法规库和行业知识库进行严格约束。
判断三:「长期活着」比「一次跑通」重要一万倍
做一次完美的演示很容易,但在真实环境中活下来很难。
招采的规则会变,流程会变,异常情况才是常态。
真正的技术门槛在于:当规则变更时,系统是否依然可用?在没有人工兜底的极端情况下,系统是否依然稳定?
因此,Agent能否进入主流程,取决于它的「生存能力」,也就是系统的鲁棒性。
如今,科大讯飞已经和许多龙头企业,在招采产品中进行了合作落地,成功跑通流程。
![]()
发布会上,一位重量级嘉宾的出现很有说服力——国家能源集团物资有限公司科技信息部主任朱捷。
作为「智能评审的开创者」,朱捷分享了一个震撼的数据:
他们早已不仅是试用,而是实现了「智能无人评审」的规模化应用。
在集团内部,AI已辅助评审订单高达18万单,评审准确率已超过97%。
判断四:这是一条「不可逆」的单行道
招采属于企业最敏感、最难回退的系统之一,一旦引入AI,回退成本极高。
讯飞「招采智能体平台」,正体现了这一不可逆性。
不可逆的核心在于,一旦企业尝试到AI带来高效率、公平公正与全链路优化,就不可能再心甘情愿退回到传统低效率模式。
想象一下,过去海量标书评审,人工耗费数小时甚至数天,异常行为检测依赖专家主观判断。
如今,通过平台实现多维度风险预警与人机协同,让企业招采效率跃升,运营成本大幅降低。
这意味着,招采领域的Agent应用,正在从实验期走向了真正的落地期。
为什么是科大讯飞?
在AI Agent这条赛道上,几乎所有的科技大厂都下了重注,而且还有无数的初创前仆后继。
为什么偏偏是科大讯飞,在招采这个细分但极度重要的领域跑通了?
答案可能藏在三个关键词里:「底座」、「领域」与「数据」。
首先是国产算力底座的硬气。
在当前的国际局势下,央国企对数据安全和供应链安全的考量处于最高优先级。
科大讯飞与华为联手打造的「飞星一号/二号」平台,构建了纯国产的算力底座。
![]()
这种在硬件层面的自主可控,是其他依赖海外GPU的厂商无法比拟的护城河。
其次是讯飞星火大模型的「通专结合」。
招采业务极其考验多模态能力——既要看懂晦涩的法律文本,又要看懂复杂的工程图纸,还要比对公章的真伪。
讯飞星火大模型长期的迭代,尤其是其在图文理解上的优势,恰好匹配了招采的痛点。
除了招采领域,基于讯飞星火大模型底座,打造的垂类模型早已遍地开花。
星火医疗大模型深度赋能诊疗、健康交互等多场景;星火法律大模型打造AI专属顾问,让法律咨询服务公平可及....
这些生动的实践,正是讯飞「1+N」战略布局的有力印证,让通专结合的模式脱颖而出。
最关键的,是经过实战验证的数据飞轮。
更深一层看,「通专结合」之所以真正落地,并不是只因为底座强、垂类多,而是它天然具备了跑出数据飞轮的条件。
一方面,大模型提供了强泛化的理解与推理能力,能把招采复杂场景先跑通;另一方面,垂类模型和智能体钉进具体环节,让LLM在真实业务中获得高密度的反馈。
由此,便形成了越用越准、越准越用的闭环。
比如,合肥公共资源交易中心,就利用「智慧交易智能体」将一致性提升到了95%。
还有如上提到的国家能源集团的智能评审系统,已辅助评审订单高达18万单,准确率超97%。
这种在央企实战中打磨出来的算法精度和业务逻辑,是任何实验室里都跑不出来的数据壁垒。
目前,讯飞在AI招采的市场份额持续领先。
![]()
从中国石油到国家电投,这些掌握着国家经济命脉的巨头们,不约而同地成为了讯飞的合作伙伴。
这些行业巨头的率先采用与成功实践,有力证明了AI在复杂B端场景的可行性。
如今,当AI Agent开始在招采这样严谨、复杂的领域挑起大梁,我们有理由相信,2026年,确实会成为一个分水岭。
它标志着AI从「玩具」变成了「工具」,从「副驾驶」坐到了「主驾驶」。
对于所有的企业管理者来说,现在的问题已经不是「要不要用AI」,而是——
「你的业务流程,准备好迎接一位硅基新同事了吗?」
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.