网易首页 > 网易号 > 正文 申请入驻

直击WAIC 2025丨对话安永陈剑光:衡量AI Agent “好用”的关键指标需兼顾技术效能与业务价值

0
分享至

OpenAI发布具备自主思考能力的ChatGPT智能体;零一万物发布企业级Agent智能体“万仔”⋯⋯一时之间,AI Agent(智能体)正从概念加速落地,国内外科技巨头纷纷布局。

7月28日,在2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)上,安永大中华区发布AI Agent产品——安永智能问答3.0。安永大中华区人工智能与数据咨询服务联席主管合伙人陈剑光在接受《每日经济新闻》(以下简称NBD)记者采访时表示,衡量AI Agent“好用”的关键指标需兼顾技术效能与业务价值。

陈剑光强调,AI Agent是否“好用”,技术上需关注准确性、响应速度等指标,业务上则需关注效率提升、成本优化、风控增强等实际价值,需体现对业务目标的支撑度。

除此之外,不同行业的Agent需求差异显著。

金融业聚焦风控合规,如投资组合合规助手、实时交易监控;零售业侧重供应链优化与精准营销,如消费者行为分析推荐Agent;制造业则深耕设备维护与生产优化,典型如预测性维护Agent、质量检测Agent。不过,各行业在人事、行政等职能部门存在共性需求,核心是提升运营效率。

以下为对话实录:

Agent应用两大核心痛点:系统集成障碍与垂直领域适配度不足

NBD:目前企业在落地Agent应用时,最常遇到的痛点是什么?从您的实践经验来看,这些痛点背后的核心原因是什么?

陈剑光:目前,企业在部署Agent应用时,普遍面临的两大核心痛点是系统集成障碍与垂直领域适配度不足。

Agent与企业现有的核心业务系统(如ERP、CRM、财务系统等)的协同困难是一个高频挑战。实践中经常看到,由于接口协议不一致、数据格式不兼容等问题,Agent难以顺畅地与这些系统进行数据交换和指令执行,从而造成任务中断、效率低下。比如,一个负责费用报销的财务Agent,可能因无法正确解析不同格式的票据信息而导致流程停滞。

在面对特定行业的专业场景时,通用Agent模型常常显得“力不从心”,关键在于缺乏深度融入行业的知识库和数据来做支撑。例如,在金融风控领域,模型需要整合瞬息万变的监管规则和市场数据;在医疗诊断领域,则需要模型具备理解并融合影像和文本病历的能力。通用模型在这些高度专业化的环境中,精度往往难以达到业务要求。

这些痛点的背后,核心原因在于双重壁垒。一是技术整合壁垒。打通异构系统的“最后一公里”,需要解决复杂的技术接口、数据映射和流程衔接问题,工程实施复杂度高。二是领域知识与数据治理壁垒。构建真正有效的垂直领域Agent,不仅需要引入深厚的行业专业知识,还需要高质量、结构化的领域数据进行持续训练与调优。然而,高质量数据的获取、清洗、标注及其所涉及的治理成本,构成了显著的障碍。这不仅是技术门槛,更是知识工程和数据资产管理的系统性挑战。

NBD:不同行业(比如金融、零售、制造业)的企业在使用Agent时,需求和应用场景会有明显差异吗?能否举例说说典型行业的特色应用?

陈剑光:行业间的差异化需求非常显著,主要体现在核心业务流程的差异和数据属性的专业性要求上。

例如,金融业高度关注风险控制和合规管理,典型Agent的应用场景如面向客户经理的投资组合分析助手,提供合规建议,或者类似于提供自动化的实时交易监控Agent,用于识别交易异常模式。

零售业的核心痛点围绕供应链优化、库存管理、精准营销与客户体验提升。典型场景如分析消费者行为数据的个性化推荐Agent;优化物流路线的动态规划Agent等。

制造业的应用场景可能更关于设备维护管理、生产流程优化与质量控制等。典型应用包括预测性维护Agent,通过分析设备传感器数据提前预警故障;生产排程优化Agent,实时调整产线资源分配;整合视觉识别技术的质量检测Agent,自动化识别产品缺陷等。

行业差异决定了Agent的核心使命:解决各自领域最关键的效率瓶颈或风险点。另外,各个企业也都存在一些共性场景,例如对于人事、行政、法务、通用IT支持等职能部门,需求通常集中于提升内部运营效率,如自动化查询政策信息、标准化审批流程、提供IT支持等。这类Agent应用追求的核心价值是流程自动化与执行效率提升。

业务价值指标是证明Agent投入产出比的核心

NBD:企业Agent的“智能化”程度往往是关注焦点,您认为衡量一个企业Agent“好用”的关键指标有哪些?

陈剑光:衡量企业Agent是否真正好用,需要从技术效能与业务价值双维度综合评估,考量其对业务目标的支撑度。

技术效能指标是Agent基础能力的量化体现,依据其具体目标设定,包括准确性、鲁棒性、响应速度、吞吐量等。以一个面向内部的客户服务查询Agent为例,技术指标包括用户咨询的意图识别准确度、后台信息查询的响应时间、调用客服系统接口的成功率等。

业务价值指标则是证明Agent投入产出比的核心,体现实际落地效果,包括效率提升(是否缩短业务流程时长、节省人力操作时长)、成本优化(优化运营成本、识别潜在客户)、风控提升(降低合规风险/操作风险)、质量提升(提升产品/服务质量)等。

在技术指标满足的基础上,能清晰量化其对实际业务的影响,是Agent价值的体现。

NBD:随着大模型技术的发展,企业Agent在功能迭代上有哪些新趋势?比如,是否会更注重多模态交互或自主决策能力?

陈剑光:确实,企业Agent的能力边界正在被大模型技术不断拓宽。Agent正从单一的文本交互,向融合视觉、听觉等多模态信号的方向发展,这使得Agent能处理和应对更复杂的企业场景。例如,通过图像识别解析扫描文档、表单、仪表盘截图等非结构化信息;结合语音识别与合成技术,构建更自然、可提供多感官交互体验的数字人(虚拟客服、培训助手);在工业质检中,整合视觉识别实现对产品缺陷或生产线异常的自动化检测等。

随着大模型理解、推理和规划能力的提升,Agent在预设规则和安全边界内的自主决策能力正在增强,能处理更复杂的规则组合,逐步从纯“执行者”向具有一定分析能力的“辅助决策者”角色演进。通过学习和掌握更广泛、更复杂的工具调用能力,将更深度地嵌入现有业务流程,自动触发并协调后端系统的多项操作,形成更强的端到端自动化链条。

除了“多模态”“多功能”“多协作”,即由多个具备不同技能的Agent组成“团队”,通过明确的任务分配和协作机制,共同完成更复杂的、需要多步推理或跨系统协作的任务链,提升整体解决问题的能力上限。

NBD:对于还未尝试Agent应用的中小企业,您认为它们可以从哪些低成本、易落地的场景入手,逐步感受其价值?

陈剑光:对于初次尝试的企业,我们建议采取“小步快跑”策略,可以先从轻量场景切入,即需求明确、技术轻量、能快速体现价值的“试点场景”。例如,文档摘要与信息检索,可以通过智能信息助手,针对企业内部政策/知识库问答,包括HR福利查询、IT常见问题解答;轻度的业务流程自动化,包括简单表单数据的自动化审核(如检查必填项、格式合规)、标准化通知的定时发送等;以及协同增强工具,包括编程助手提升、智能文档翻译等。

对中小企业而言,初期应当利用成熟的外部服务API(应用程序编程接口)来快速扩展Agent的功能,或选择提供Agent能力的SaaS(软件运营服务)产品或按需付费的模型服务(如大模型服务商的Agent平台),也可基于低代码/零代码平台构建属于自己的Agent应用,以降低硬件投入和初始维护成本。

通过这些试点,企业能低成本验证技术价值,积累运营经验,培养团队信心,为后续更复杂、深度的应用打下基础。

最重要的是深刻理解——Agent的核心价值,绝非简单地“替代人力”,而是通过承担规则性、重复性的流程执行任务,释放员工的时间和精力,使其能够投入到更富创造力的工作、更复杂的判断决策和更高价值的创新活动中。其终极目标是实现“人机协同、人智增强”,推动组织效能升级。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
破案!陈家政表现神勇杜锋却全程黑脸原因找到,现场球迷说出实情

破案!陈家政表现神勇杜锋却全程黑脸原因找到,现场球迷说出实情

后仰大风车
2026-03-26 08:15:08
14亿人集体买房,为什么最后买出了一个烂摊子?

14亿人集体买房,为什么最后买出了一个烂摊子?

流苏晚晴
2026-03-25 18:14:02
凯特戴6000块的帽子险出洋相!助手说漏嘴,意外爆出威廉的瓜?

凯特戴6000块的帽子险出洋相!助手说漏嘴,意外爆出威廉的瓜?

白露文娱志
2026-03-26 16:41:18
电影《挽救计划》高口碑热映 以跨文明协作诠释守望相助温暖内核

电影《挽救计划》高口碑热映 以跨文明协作诠释守望相助温暖内核

封面新闻
2026-03-26 18:56:02
定了!全票通过!杜兰特又要换队……

定了!全票通过!杜兰特又要换队……

贵圈真乱
2026-03-26 11:35:13
伊朗计划向通过霍尔木兹海峡的船只收取安全通行费

伊朗计划向通过霍尔木兹海峡的船只收取安全通行费

新浪财经
2026-03-26 20:28:52
独家:某运营商2025年营收几乎0增长! 好日子快到头了! 其实三大运营商日子都那样!

独家:某运营商2025年营收几乎0增长! 好日子快到头了! 其实三大运营商日子都那样!

新浪财经
2026-03-24 22:43:29
俄罗斯人想不明白:为什么强大的中国,几千年都不要西伯利亚?

俄罗斯人想不明白:为什么强大的中国,几千年都不要西伯利亚?

贱议你读史
2026-03-26 00:07:41
国金证券:长期来看黄金有望开启新一轮大牛市

国金证券:长期来看黄金有望开启新一轮大牛市

财联社
2026-03-26 08:08:04
蒙古总理当众给斯大林一耳光,走出宴会厅3小时后,被扣上间谍帽子枪决

蒙古总理当众给斯大林一耳光,走出宴会厅3小时后,被扣上间谍帽子枪决

老杉说历史
2026-03-23 22:17:08
波兰磨刀:谁将是压垮俄罗斯的最后一根稻草

波兰磨刀:谁将是压垮俄罗斯的最后一根稻草

民间胡扯老哥
2026-03-23 18:56:09
3轮0球0助攻!U23国足天才新星踢中超状态断崖式下滑,恐沦为鸡肋

3轮0球0助攻!U23国足天才新星踢中超状态断崖式下滑,恐沦为鸡肋

零度眼看球
2026-03-26 07:41:28
3月26日下午中国女排!传来朱婷、李盈莹、袁心玥最新消息

3月26日下午中国女排!传来朱婷、李盈莹、袁心玥最新消息

民哥台球解说
2026-03-26 16:17:49
崩了,知名光伏公司大规模停产,大面积待岗!

崩了,知名光伏公司大规模停产,大面积待岗!

黯泉
2026-03-25 21:36:39
随着朝鲜1-1,泰国2-2,西安邀请赛积分榜出炉:中国男足排名第一

随着朝鲜1-1,泰国2-2,西安邀请赛积分榜出炉:中国男足排名第一

侧身凌空斩
2026-03-25 21:41:35
法媒:“伊朗战争的首个受害者是真相”

法媒:“伊朗战争的首个受害者是真相”

参考消息
2026-03-26 13:30:07
国足VS库拉索:留洋小将坐镇中场,韦世豪王钰栋领衔,张玉宁冲锋

国足VS库拉索:留洋小将坐镇中场,韦世豪王钰栋领衔,张玉宁冲锋

零度眼看球
2026-03-26 07:23:48
不能光让特朗普出风头,俄罗斯宣布重大消息:和中国有大事要谈

不能光让特朗普出风头,俄罗斯宣布重大消息:和中国有大事要谈

哎呀哎呀看电影
2026-03-26 19:41:54
站在c位的是谁?张怡宁和郭晶晶两位同框,她在中间看着气场不小

站在c位的是谁?张怡宁和郭晶晶两位同框,她在中间看着气场不小

陈意小可爱
2026-03-26 07:59:48
逐玉爆火后最大的受益者,51岁翻红,涨粉百万!

逐玉爆火后最大的受益者,51岁翻红,涨粉百万!

娱人细品
2026-03-25 20:39:14
2026-03-26 21:00:49
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1519463文章数 2724760关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

手机
艺术
数码
家居
房产

手机要闻

OPPO K15 Pro系列突然官宣:天玑9500s+主动散热,4月1日发布

艺术要闻

哪一座桥不是风景?

数码要闻

小米Book Pro 14超薄设计引爆市场!这家国产厂商立功了

家居要闻

傍海而居 静观蝴蝶海

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

无障碍浏览 进入关怀版