网易首页 > 网易号 > 正文 申请入驻

不敢信?中国AI国家队出手,刚刚通关了万亿级主战场「地狱副本」

0
分享至


新智元报道

编辑:编辑部【新智元导读】人人都在夸智能体有多强,但真正的生死考场从不是Demo现场,而是几亿金额、零容错的招标采购。英伟达和OpenAI才刚喊口号,但这家AI已经先走了一步,趟过落地的深水区了。

这几天,「打工人版」Claude火得一塌糊涂。

一键清空桌面、杂乱笔记瞬间成报告,甚至,给AI一个文件夹,就能直接帮你干活。

毫不夸张地说,你的父母都能用上「编码版」Claude了!还有人惊呼,「这就是第二个ChatGPT时刻」。



更令人惊掉下巴的是,Claude之父自曝,Claude纯100%编码,一周半就创造出了Cowork,端到端真正实现了闭环。


不仅如此,最近爆红的各种Claude Skills库,直接给AI加上了双重buff,「技能包」让AI智能体干活更得心应手。

有的Skills GitHub库,直接刷爆近40k星标。


一夜之间,AI智能体竟变得这么强了?


硅谷AI能造APP,却卡在最后一公里

人们常说2025年是「智能体元年」,但要真正规模化普及,还得看2026年。

CES 2026大会上,老黄再一次对当前AI的进展,做出了前瞻性的判断——

智能体本身,就是未来的交互界面。



无独有偶,OpenAI总裁Greg Brockman也给出了惊人一致的判断:2026年,将是企业级智能体真正普及的一年。


回望过去一年,我们看着OpenAI Operator在浏览器里熟练地帮人订机票;看着Grok 4并行多个智能体,暴力破解了人类最高难度的纯文本考试;看着Claude Code让不懂代码的普通人,在几小时内手搓出一个App。


Claude之父Boris Cherny半开玩笑地说,他过去三十天的代码贡献,100%都是由Claude Code完成

一切看起来都很美好。AI似乎已经无所不能,它能写诗、能画画、能写代码。

但是,且慢。

如果你把视角从硅谷的演示Demo,拉回到真实且残酷的商业世界,你会发现一个尴尬的「最后一公里」断层:

这些聪明的AI,敢不敢让它去审核几亿金额的标书?敢不敢让它在没有人类盯着的情况下,对涉及法律责任的流程做判断?

绝大多数时候,答案是沉默。

因为写错代码可以Debug,画错图可以重绘,但在商业核心业务——

尤其是招标采购这种合规要求高、风险集中的领域,错误的代价往往是巨额罚款、法律诉讼,甚至是牢狱之灾。

这才是AI落地的真正深水区。


地狱级副本:招标采购领域的AI转型

如果不是央国企或大型集团的供应链负责人,你很难想象这个岗位的「酸爽」。这绝不仅仅是填几张表那么简单。

招标采购,是连接企业供应链上下游的超级枢纽。在这个枢纽里,充满了著名的「不可能三角」:合规、成本、效率。

  • 标书审阅效率低,合规风险难防控

首先合规问题,招标文件隐性风险审查、评审环节主观判断,都存在一定的人为干预,影响了公平公正。

还有成本极难控制,流程中人工加班、重复工作是显性成本,供应商选择不当,更成为了难以回避的隐性成本。

从效率来说,从招标文件编制、审核、再到评审环节专家评审,都需要消耗大量的人工精力。

这三大挑战,依靠传统的人工模式,已经难以跟上企业的发展需求。



  • 投标异常行为,屡禁难止手段难辨

在投标环节,往往会出现各种异常行为。

以市政EPC项目为例,专家需在短时间内,对几百份文件进行风险排查,标书动辄上千页。

传统的方式比如文档识别,很难深层次检测投标文件内容本身异常,比如文本语义级相似、图片实质性相似、关键要素相似、报价规律性等。

因此,这些过程皆需要专家逐字逐句进行比对,工作量巨大。

  • 文件编审周期长,评审公平保障难

科大讯飞数字化业务群CTO张永亮举了一个真实的场景案例:

业务方提出如下一个采购需求,到了编制环节,编制人员可能因为对条款不熟悉、项目不了解,导致效率低,甚至可能出现很多漏洞。

再到下一个环节中,审核人员又需要耗费大量精力查找隐性条款,若因查得不仔细,还会导致流标、供应商投诉等问题。

从管理者角度来说,历史招标过程中沉淀的优质经验,难以得到复用。

在传统模式下,不同专家的评分偏差率高,甚至一些项目因评分争议需要复核。

传统的电子化招采系统(如SRM系统),本质上只是把纸质流程搬到了线上。它们能解决流程流转的问题,但解决不了「决策」的问题。

与之相对的,现代大模型可以比对几百份标书的资质、筛查风险、判断价格合理性,但它们普遍存在的「幻觉」问题,对要求100%合规的招采行业来说堪称是「史诗级灾难」。

因此,行业真正等待的,并不是一个更聪明的AI,而是一套能够嵌入主流程、边界清晰、结果可核查的智能系统。


一座「智能体工厂」

回顾招采技术的发展,我们经历了从小模型专精(如OCR自动评标)的1.0时代,到大模型泛化认知的2.0时代。

而现在,随着全流程自主规划能力的出现,行业终于迈入了「智能体(Agent)」的3.0时代。

1月13日,「AI国家队」科大讯飞重磅发布的「招采智能体平台」,给出了一个完全不同的解题思路。

它彻底抛弃了「辅助工具」的定位,直接提出了一个大胆的概念:智能体工厂(Agent Factory)。

这意味着,讯飞把招采领域几十年积累的专业能力,全部拆解成了标准的「智能乐高模块」。

由此一来,以上三个痛点迎刃而解。

  • 招采智能体精准嵌入「全流程」:编标环节自动生成招标文件,并进行合规检测;清标环节智能体揪出报价雷同、资质造假等问题;评标环节评审智能体,主动审查同时给专家一个参考。

  • 招标文件编审智能体:只要用自然语言讲出需求就会自动回填项目信息、分析场景、选范文模板、推荐评审规则,一键出稿。还能针对招标文件的风险进行全方位的审查,再也不用人工对着法律条文逐条修改。

  • 异常行为检测智能体:先解析所有招标、投标文件,把文本、图片都转成结构化数据;随后从企业关联、语义相似、报价规律等8个维度,精准检出异常行为迹象;最后生成风险预警、异常详情和结果判定,连证据链都给你整理好。

  • 辅助评标智能体:打破传统评标引擎 「黑盒调试难」 困局,实现定点调试提效,进一步提升评审准确率,支持私有化部署深度适配企业个性化需求。

像搭积木一样,搭建智能体

作为招采行业的探路者,科大讯飞认识到:招采比他们想象的更加复杂。本质上是因为,缺乏承上启下的载体。

而这个全新的招采智能体平台,以Agent作为底座,打造了一个专属于行业的智能体平台。

它融合了行业知识库,利用Workflow构建了全场景的招采智能体应用。


这样,就能通过搭积木的方式,降低开发门槛,实现应用的快速落地。

而且,这个平台还有40多个场景的子Agent,比如招标文件解析,资质验真。

同时,平台还整合了11万多个泛行业的优质智能体,覆盖生活、学习、办公全场景。


要知道,速度就是企业AI落地的核心需求。

而这个平台,可以让你零代码、用自然语言描述需求,快速生成应用。另外,低代码工作流可以把各种能力、插件、组件、工具拼接起来。



现场怎样搭一个智能体

在大会现场,科大讯飞的工作人员为我们演示了如何像搭积木一样,搭建一个评审办法解析智能体。

其中,子Agent、知识库等,都是在招采智能体中上线的原子能力Agent。

具体步骤如下:首先,在开始节点配置输入,导入招标文件。

接着,招标文件解析Agent,可以利用多模态识别能力将招标文件内容解析为结构化信息。

然后,通过评审办法抽取一个Agent。接着在知识库节点,选择适配的大模型。

而初步评审办法解读Agent和详细评审办法解读Agent,会依次工作。

再后面的招标规则整合Agent,就可以实现对评审办法的全维度梳理,然后进行结构化的输出。

就这样,短短几分钟的时间,这个平台就搭建出一个Agent。


接下来,工作人员还具体演示了,怎样用它调试一个真实的项目。

导入一份招标文件,输入提示词,短短几秒就得到了具体的评审因素、打分因素、评分标准的关键等。



RPA赋能智能体

在招采过程中,有很多重复性很强的工作。比如在评标环节,专家经常需要第三方的网站,用到它们的知识,极其繁琐。

而且,资质条款的核验需要在企业内部查询,还需要手动核对,耗时又费力。

而科大讯飞的资质验真Agent,可以自主决策核验路径。全程都无需人工介入,能真正解放人力,提升效率。

这就是Agent*RPA比起传统RPA的优势。而现在,完全可以让Agent成为RPA的大脑。

工作人员演示了,资质验真Agent是怎样运行的。

首先,上传一份投标文件,输入评审条款。

然后Agent就识别出,需要到信用中国去实现验证。


接下来,RPA就代替了人手、人眼,完成了验证工作。全程它都在自主操作。


最后,它识别到了匹配度最高的一家公司。并且验证出该投标人并未被列入失信被执行人名单。

总之,如果说Agent是大脑,RPA就是它的双手,可以轻松打通上下游系统。


另外,辅助评标这个复杂的流程也放到智能体平台上了,企业可以快速增加节点,上传知识,完成企业自己的评标智能体开发。


实践证明,科大讯飞招采智能体平台在实际落地时AI与专家的主观项排名一致率已达到95%。

从成熟的智能体生态,到零门槛的快速搭建,RPA的高效协同,再到简洁的调试和模型精调,整个智能体平台,将为招采行业开启应用开发的新范式!


四个「反直觉」判断

如果说产品功能只是表象,那么透过此次发布会,我们可以提炼出四个触及AI B端落地灵魂的「反直觉」行业判断。

判断一:Agent必须从「聊天助手」进化为「可信赖的业务执行单元」

在消费级场景,AI的答复可以天马行空。

但在招采这类严谨的商业领域,AI输出的任何结果都必须建立在三个基石之上:可执行、可核查、可追溯。

这要求AI不再是一个仅能对话的「参谋」,而必须成为一个深度理解业务规则、能够自主完成复杂任务链且过程全透明的「专业执行者」。

讯飞通过构建40多个专业子Agent的能力矩阵,并实现其间的规划与协同,为AI配备了精准的招采「操作指南」,确保其操作稳定、规范,从而真正胜任关键业务环节。

判断二:高自由度是风险,约束才是核心竞争力

通常我们认为AI越自由、越有创造力越好。

但在招采这种规则系统里,Agent必须放弃「自由发挥」 。

此时,真正的工程能力,在于如何把Agent拆解进流程,用规则去校验它,用多重逻辑去约束它。

用一句话总结就是:

智能招采不是在展示模型有多聪明,而是在验证工程约束能力有多强。

对此,讯飞采用了SuperAgent架构,通过主Agent调度10+个子Agent,并接入招采法律法规库和行业知识库进行严格约束。

判断三:「长期活着」比「一次跑通」重要一万倍

做一次完美的演示很容易,但在真实环境中活下来很难。

招采的规则会变,流程会变,异常情况才是常态。

真正的技术门槛在于:当规则变更时,系统是否依然可用?在没有人工兜底的极端情况下,系统是否依然稳定?

因此,Agent能否进入主流程,取决于它的「生存能力」,也就是系统的鲁棒性。

如今,科大讯飞已经和许多龙头企业,在招采产品中进行了合作落地,成功跑通流程。


发布会上,一位重量级嘉宾的出现很有说服力——国家能源集团物资有限公司科技信息部主任朱捷。

作为「智能评审的开创者」,朱捷分享了一个震撼的数据:

他们早已不仅是试用,而是实现了「智能无人评审」的规模化应用。

在集团内部,AI已辅助评审订单高达18万单,评审准确率已超过97%。

判断四:这是一条「不可逆」的单行道

招采属于企业最敏感、最难回退的系统之一,一旦引入AI,回退成本极高。

讯飞「招采智能体平台」,正体现了这一不可逆性。

不可逆的核心在于,一旦企业尝试到AI带来高效率、公平公正与全链路优化,就不可能再心甘情愿退回到传统低效率模式。

想象一下,过去海量标书评审,人工耗费数小时甚至数天,异常行为检测依赖专家主观判断。

如今,通过平台实现多维度风险预警与人机协同,让企业招采效率跃升,运营成本大幅降低。

这意味着,招采领域的Agent应用,正在从实验期走向了真正的落地期。


为什么是科大讯飞?

在AI Agent这条赛道上,几乎所有的科技大厂都下了重注,而且还有无数的初创前仆后继。

为什么偏偏是科大讯飞,在招采这个细分但极度重要的领域跑通了?

答案可能藏在三个关键词里:「底座」、「领域」与「数据」。

  • 首先是国产算力底座的硬气。

在当前的国际局势下,央国企对数据安全和供应链安全的考量处于最高优先级。

科大讯飞与华为联手打造的「飞星一号/二号」平台,构建了纯国产的算力底座。


这种在硬件层面的自主可控,是其他依赖海外GPU的厂商无法比拟的护城河。

  • 其次是讯飞星火大模型的「通专结合」。

招采业务极其考验多模态能力——既要看懂晦涩的法律文本,又要看懂复杂的工程图纸,还要比对公章的真伪。

讯飞星火大模型长期的迭代,尤其是其在图文理解上的优势,恰好匹配了招采的痛点。

除了招采领域,基于讯飞星火大模型底座,打造的垂类模型早已遍地开花。

星火医疗大模型深度赋能诊疗、健康交互等多场景;星火法律大模型打造AI专属顾问,让法律咨询服务公平可及....

这些生动的实践,正是讯飞「1+N」战略布局的有力印证,让通专结合的模式脱颖而出。

  • 最关键的,是经过实战验证的数据飞轮。

更深一层看,「通专结合」之所以真正落地,并不是只因为底座强、垂类多,而是它天然具备了跑出数据飞轮的条件。

一方面,大模型提供了强泛化的理解与推理能力,能把招采复杂场景先跑通;另一方面,垂类模型和智能体钉进具体环节,让LLM在真实业务中获得高密度的反馈。

由此,便形成了越用越准、越准越用的闭环。

比如,合肥公共资源交易中心,就利用「智慧交易智能体」将一致性提升到了95%。

还有如上提到的国家能源集团的智能评审系统,已辅助评审订单高达18万单,准确率超97%。

这种在央企实战中打磨出来的算法精度和业务逻辑,是任何实验室里都跑不出来的数据壁垒。

目前,讯飞在AI招采的市场份额持续领先。


从中国石油到国家电投,这些掌握着国家经济命脉的巨头们,不约而同地成为了讯飞的合作伙伴。

这些行业巨头的率先采用与成功实践,有力证明了AI在复杂B端场景的可行性。

如今,当AI Agent开始在招采这样严谨、复杂的领域挑起大梁,我们有理由相信,2026年,确实会成为一个分水岭。

它标志着AI从「玩具」变成了「工具」,从「副驾驶」坐到了「主驾驶」。

对于所有的企业管理者来说,现在的问题已经不是「要不要用AI」,而是——

「你的业务流程,准备好迎接一位硅基新同事了吗?」

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
闫学晶没想到,2026年刚开年,老搭档冯巩就给自己上了生动一课

闫学晶没想到,2026年刚开年,老搭档冯巩就给自己上了生动一课

豆哥记录
2026-01-09 15:04:25
快过年了,别买这5种年货!全是“科技与狠活”,别拿身体开玩笑

快过年了,别买这5种年货!全是“科技与狠活”,别拿身体开玩笑

Home范
2026-01-15 12:12:06
提到中国,委内瑞拉代总统最新发声

提到中国,委内瑞拉代总统最新发声

环球时报国际
2026-01-16 12:45:37
从高处跌落的硅胶脸夫人:被拘4个月瘦到80斤,头发花白眼神惊恐

从高处跌落的硅胶脸夫人:被拘4个月瘦到80斤,头发花白眼神惊恐

照见古今
2025-12-12 18:19:05
王思聪39岁生日够挥霍,带懒懒吃153万日式海胆,网友:比我命贵

王思聪39岁生日够挥霍,带懒懒吃153万日式海胆,网友:比我命贵

黄谋仕
2026-01-16 14:27:17
你听过最劲爆的瓜是啥?网友:被大八岁的补习班老师表白了

你听过最劲爆的瓜是啥?网友:被大八岁的补习班老师表白了

带你感受人间冷暖
2025-11-26 00:10:06
卡尼萨雷斯:阿隆索想要一名组织型中场,皇马甚至都未尝试过

卡尼萨雷斯:阿隆索想要一名组织型中场,皇马甚至都未尝试过

懂球帝
2026-01-17 03:14:19
广东一54岁男子痛风去世,从不吃内脏海鲜,医生叹息:无知害了他

广东一54岁男子痛风去世,从不吃内脏海鲜,医生叹息:无知害了他

华庭讲美食
2026-01-03 11:13:38
里子面子都丢了!孙俪给53岁口无遮拦的闫学晶,早早就上了一课

里子面子都丢了!孙俪给53岁口无遮拦的闫学晶,早早就上了一课

文史旺旺旺
2026-01-15 20:04:05
集体大跌!002195,640万手封死跌停

集体大跌!002195,640万手封死跌停

新浪财经
2026-01-16 13:03:25
上海独生子女的幸福:上班不啃老,就是给父母省钱!父母不差钱!

上海独生子女的幸福:上班不啃老,就是给父母省钱!父母不差钱!

捣蛋窝
2026-01-16 00:24:16
英国首相一句话直接扔向全世界,他说,中国,是世界三大强国之一

英国首相一句话直接扔向全世界,他说,中国,是世界三大强国之一

百态人间
2026-01-16 16:04:06
携程因涉嫌垄断被立案调查 追觅CEO俞浩放话:让携程不在垄断

携程因涉嫌垄断被立案调查 追觅CEO俞浩放话:让携程不在垄断

新浪财经
2026-01-14 19:26:45
怀孕时哭着闹离婚,父亲大力支持,二婚终遇幸福

怀孕时哭着闹离婚,父亲大力支持,二婚终遇幸福

锋哥与八卦哥
2026-01-13 12:26:42
日本诺贝尔奖得主大江健三郎表示:很遗憾,日本很可能将重复历史

日本诺贝尔奖得主大江健三郎表示:很遗憾,日本很可能将重复历史

议纪史
2025-11-27 14:35:03
聂卫平去世仅一天,担心的一幕出现,私生活被扒,王刚郎平被牵连

聂卫平去世仅一天,担心的一幕出现,私生活被扒,王刚郎平被牵连

动物奇奇怪怪
2026-01-17 03:30:14
1月有财神爷助运!3个生肖运气不差,赚大钱生活无压力!

1月有财神爷助运!3个生肖运气不差,赚大钱生活无压力!

毅谈生肖
2026-01-15 11:13:01
超额完成1400亿新融资!英伟达抢着输血,马斯克的xAI估值1.6万亿

超额完成1400亿新融资!英伟达抢着输血,马斯克的xAI估值1.6万亿

财经八卦
2026-01-16 16:48:49
河北彩伽 2026 开年王炸!短发 + 酒后暧昧

河北彩伽 2026 开年王炸!短发 + 酒后暧昧

吃瓜党二号头目
2026-01-16 14:43:15
3-0爆大冷!国乒小将横扫奥运季军,替莎头复仇,王励勤没看错人

3-0爆大冷!国乒小将横扫奥运季军,替莎头复仇,王励勤没看错人

体育就你秀
2026-01-17 00:15:23
2026-01-17 04:39:00
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
314文章数 7395关注度
往期回顾 全部

科技要闻

贾国龙与罗永浩被禁言,微博CEO回应

头条要闻

罗永浩、贾国龙微博账号均被禁言

头条要闻

罗永浩、贾国龙微博账号均被禁言

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

李湘翻车,早就有迹可循!

财经要闻

清流|酒店商家在携程和美团之间沦为炮灰

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

时尚
艺术
旅游
亲子
家居

今年冬天最时髦保暖的4组搭配,照着穿美出新高度!

艺术要闻

180米!上海北外滩新地标,设计藏了3个“小心机”

旅游要闻

北境飘雪南园绽,青秀山用一场菊花展,藏住南宁冬日顶流密码!

亲子要闻

精神科医生:家长的“为你好”也可能对孩子造成创伤

家居要闻

岁月柔情 现代品质轻奢

无障碍浏览 进入关怀版