网易首页 > 网易号 > 正文 申请入驻

Datadog报告:AI“静默失败”问题即将冲击企业系统

0
分享至

Datadog最新发布的《AI工程现状报告》指出,企业AI系统存在可量化的失败问题。约每20个请求中就有1个在生产环境中失败,但系统仍在继续运行并返回看似正确的输出,这使得这些失败难以被检测。按工程标准来看,生产环境AI系统5%的失败率已经非常高。


除了失败率上升,报告还强调了复杂性增加以及生产环境的不稳定性。这并非系统宕机的问题,而是系统在运行中逐渐变得不再可信的问题。

报告中最引人注目的是多个趋势正在同时碰撞:AI正快速进入生产环境,失败率开始更清晰地显现,系统设计变得更加复杂——因为团队将多个模型、数据源和工具组合到单一管道中。Datadog指出,约70%的组织已在生产环境中使用三个或更多模型,这增加了另一层协调难度。在某些情况下,基于智能体(Agent)的工作流叠加其上,引入了更多变数。每一层都增加了能力,但也增加了出现问题却不立即显现的概率,这正是静默失败问题开始生根的地方。

"AI开始看起来很像云计算的早期阶段,"Datadog首席产品官Yanbing Li表示,"云让系统变得可编程,但管理起来复杂得多。AI现在正在应用层做同样的事情。获胜的公司不仅会构建更好的模型,还会围绕模型建立运营控制。在这个新时代,AI可观测性变得像十年前的云可观测性一样重要。"


这些发现的意义还在于数据来源。Datadog并非调查开发者或收集意见,而是在分析数千家公司运行AI系统的生产遥测数据。其中包括越来越多的基于智能体的环境,在这些环境中,模型不仅生成输出,还驱动多步骤工作流。在这些系统中,报告指出运营复杂性是可靠扩展AI的主要障碍,大多数组织已在生产环境中运行多个模型。随着这些系统扩展,挑战不再是如何让它们工作,而是在部署后如何保持它们可理解和可控。

"下一波智能体失败不会是关于智能体不能做什么,而是关于团队无法观察到什么,"Vercel(Next.js背后公司,构建AI驱动Web应用的领先平台)CEO Guillermo Rauch表示,"我们在Vercel构建了智能体基础设施,因为智能体需要与优秀软件相同的生产反馈循环。与传统软件不同,智能体的控制流由LLM本身驱动,这使得可观测性不仅有用,而且必不可少。"

报告中的另一个情况是,许多失败并非由模型质量驱动,而是由基础设施限制导致。很大一部分错误来自速率限制,生产系统中记录了数百万次此类事件。随着使用量增长,系统更频繁地触及提供商容量上限,这造成了难以预测的失败爆发。在实践中,可靠性既取决于团队如何管理负载、重试和并发,也取决于模型本身的表现如何。


据Datadog的发现,成本和延迟正变得更难控制。典型工作负载的Token使用量增加了一倍多,重度用户的增长更快。推动这一增长的因素不仅是用户输入,还包括系统提示、策略和工具指令的扩展层——这些内容在每个请求中被重复处理。这些后台Token现在占总使用量的很大一部分,这意味着即使用户需求看似稳定,成本也可能上升。

尽管如此,基本的效率提升往往被忽视。报告显示,提示缓存仍被低估使用,大多数系统在跨调用时重新处理相同的上下文。这暴露了AI系统构建方式与生产环境优化方式之间的差距。随着上下文窗口扩大和提示变大,挑战正从向模型中塞入更多数据,转变为决定哪些信息真正重要。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
福州大学一学生称自己5年前的研究生毕业动画作品被合肥工业大学三名学生盗用,且获国奖;合肥工业大学:已了解相关情况,正在核实

福州大学一学生称自己5年前的研究生毕业动画作品被合肥工业大学三名学生盗用,且获国奖;合肥工业大学:已了解相关情况,正在核实

三湘都市报
2026-04-30 16:03:54
首个退群北约的国家来了:已走程序,退意已决!

首个退群北约的国家来了:已走程序,退意已决!

福建睿平
2026-04-27 11:46:08
要来了?郑丽文启程赴美前,大陆先声夺人,全岛2300万人面临抉择

要来了?郑丽文启程赴美前,大陆先声夺人,全岛2300万人面临抉择

老谢谈史
2026-05-01 04:54:36
日本这座山不允许长树,每年要烧一次,付费还能体验“放火烧山”

日本这座山不允许长树,每年要烧一次,付费还能体验“放火烧山”

怪罗
2026-04-29 17:16:04
中超金哨又惹争议!读秒漏判绝杀点球 津门虎官方质疑 于根伟炮轰

中超金哨又惹争议!读秒漏判绝杀点球 津门虎官方质疑 于根伟炮轰

我爱英超
2026-05-01 22:47:48
安徽19岁小伙失联11日 父亲:失联前三天他买了酒菜让我回家吃饭,之前从未见他喝过酒

安徽19岁小伙失联11日 父亲:失联前三天他买了酒菜让我回家吃饭,之前从未见他喝过酒

红星新闻
2026-05-01 13:23:25
4499元!苹果正式官宣:5月1日,两款新机长期断货!

4499元!苹果正式官宣:5月1日,两款新机长期断货!

搞机小帝
2026-05-02 00:04:03
美股再创新高,存储股大反弹,苹果、甲骨文涨超5%,国际油价失守100美元,白银拉升4%

美股再创新高,存储股大反弹,苹果、甲骨文涨超5%,国际油价失守100美元,白银拉升4%

21世纪经济报道
2026-05-01 22:30:57
谁注意到杜锋,徐昕领奖时表情复杂,他的笑容与米切尔完全不一样

谁注意到杜锋,徐昕领奖时表情复杂,他的笑容与米切尔完全不一样

南海浪花
2026-05-02 06:57:48
国民党议员:军购案就该严审,民进党的贪污腐败形象让大家有疑虑

国民党议员:军购案就该严审,民进党的贪污腐败形象让大家有疑虑

海峡导报社
2026-05-01 07:48:16
离婚12年,奥运冠军一直单身,如今在北京健身,和吴奇隆是好朋友

离婚12年,奥运冠军一直单身,如今在北京健身,和吴奇隆是好朋友

翰飞观事
2026-05-01 14:26:44
百万博主举报南大院长:虚假成果套巨额经费,学术圈年终大戏上演

百万博主举报南大院长:虚假成果套巨额经费,学术圈年终大戏上演

十为先生
2026-05-01 21:36:43
钱再多有什么用?2个女儿惨死3个儿子反目,资产1250亿也无人送终

钱再多有什么用?2个女儿惨死3个儿子反目,资产1250亿也无人送终

北纬的咖啡豆
2026-04-08 17:09:30
不出 5 年,中国贬值最快的不是房子和现金,而是这 3 样东西

不出 5 年,中国贬值最快的不是房子和现金,而是这 3 样东西

细说职场
2026-04-26 21:04:20
沉默45年后,中国第二轮“严打”终于来了!但这次的目标变了

沉默45年后,中国第二轮“严打”终于来了!但这次的目标变了

观星赏月
2026-05-02 01:11:17
中超大结局?成都蓉城客场绝杀,申花无力回天,夺冠已是大势所趋

中超大结局?成都蓉城客场绝杀,申花无力回天,夺冠已是大势所趋

国足风云
2026-05-01 22:10:31
讨好大佬陪睡上位?遭央视“开除”?曾是央视主持谣言有多荒诞

讨好大佬陪睡上位?遭央视“开除”?曾是央视主持谣言有多荒诞

老好人的愤怒
2026-05-02 00:54:17
演员朱珠疑似塌房?照片流出,惊呆网友!

演员朱珠疑似塌房?照片流出,惊呆网友!

大眼妹妹
2025-12-15 10:39:19
张军被查创下多个尴尬“纪录”,18年前曾因酒驾被查

张军被查创下多个尴尬“纪录”,18年前曾因酒驾被查

元芳有看法
2026-04-30 09:25:44
成吉思汗大墓或被找到,专家准备挖掘时,蒙古总理却出面进行制止

成吉思汗大墓或被找到,专家准备挖掘时,蒙古总理却出面进行制止

浩渺青史
2026-05-01 00:56:48
2026-05-02 09:28:49
Ai时代前沿
Ai时代前沿
人工智能新闻动态及应用案例。
1725文章数 512关注度
往期回顾 全部

科技要闻

AI热潮耗尽库存,Mac Mini起售调高200美元

头条要闻

男子因健身设备锁扣崩断被弹飞致瘫痪 监控无法调取

头条要闻

男子因健身设备锁扣崩断被弹飞致瘫痪 监控无法调取

体育要闻

无奈!约基奇:这要在塞尔维亚 全队早被炒了

娱乐要闻

马筱梅产后身材恢复超好 现身户外直播

财经要闻

雷军很努力 小米还是跌破了30港元大关

汽车要闻

限时9.67万起 吉利星越L/星瑞i-HEV智擎混动上市

态度原创

教育
健康
时尚
游戏
公开课

教育要闻

高考地理中的机制问题

干细胞治烧烫伤面临这些“瓶颈”

聪明女人衣服从来不买太多!这三种精品提前准备好,耐穿又实用

《英雄无敌:上古纪元》特别好评 首日销量破25万份

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版