![]()
无状态AI能够提供一次性答案,但缺乏前次会话的上下文,在短期内可能有所帮助,但对于更复杂的多步骤场景却存在局限性。为了克服这些限制,OpenAI正在引入"有状态AI"。
该公司宣布,将很快与亚马逊合作提供有状态运行环境,旨在简化AI智能体投入生产的过程。这个环境将在Amazon Bedrock上原生运行,专为智能体工作流定制,并针对AWS基础设施进行优化。
值得注意的是,OpenAI还特别声明,其与亚马逊的新合作"绝不会"改变与微软合作关系的条款。Azure将继续作为无状态OpenAI API的独家云服务提供商。
西北AI咨询公司的Wyatt Mayham表示:"这是一个巧妙的结构性举措。每个人都可以声称获胜,但潜台词很明确:OpenAI正在成为一家多云公司,独家AI合作伙伴关系的时代正在结束。"
在Amazon Bedrock上的有状态运行环境
OpenAI表示,这个有状态运行环境专门为执行需要考虑上下文的复杂步骤而构建。模型可以传递内存和历史记录、工具和工作流状态、环境使用情况以及身份和权限边界。
分析师认为,这代表了一种新的范式。
Mayham解释说,无状态API调用就像一块"白板","模型不记得它刚刚做了什么、调用了什么工具,或者在多步骤工作流中处于什么位置。"
虽然这对于回答一次性问题的聊天机器人来说是可以的,但对于真正的运营工作来说"完全不够",比如处理需要跨越五个不同系统、需要审批并需要数小时或数天才能完成的客户理赔。
新的有状态能力为AI智能体提供了持久的工作内存,使它们能够在步骤间保持上下文、维护权限并与真正的企业工具交互,而无需开发人员"用胶带将无状态API调用拼接在一起"。
此外,Bedrock基础的重要性在于这是许多企业工作负载已经驻留的地方。OpenAI和亚马逊正在满足公司的现实需求,而不是要求它们重新架构其安全、治理和合规态势。
这使得复杂的AI自动化对中型企业变得可及;他们不再需要一个工程师团队来"从零开始构建管道"。
控制平面转移
Greyhound Research的首席分析师Sanchit Vir Gogia称有状态运行环境为"控制平面转移"。无状态对于摘要、代码辅助、起草或隔离工具调用等单一交互可能是"优雅的"。但有状态环境为企业提供了"托管编排基础"。
这支持涉及链式工具调用、长期运行进程、人工审批、系统身份传播、重试、异常处理和审计跟踪的真实企业工作流,而Bedrock执行现有的身份访问管理(IAM)策略、虚拟私有云(VPC)边界、安全工具、日志标准和合规框架。
Gogia说:"大多数试点失败是因为上下文在调用间重置、权限不匹配、Token在工作流中过期,或者智能体无法在中断后安全恢复。"这些问题在有状态环境中可以避免。
然而,Gogia强调,企业还有二阶考虑因素。值得注意的是,状态持久性增加了攻击面。这意味着持久内存必须加密、受管理并可审计,工具调用边界应该"严格控制"。此外,工作流重放机制必须是确定性的,可观察性要足够细粒度以满足监管要求。
还有一个"微妙的锁定维度"。当编排移动到超大规模云服务商的原生运行时内部时,可移植性可能会降低。CIO需要考虑他们未来的智能体架构是否保持云可移植性还是锚定在AWS环境中。
最终,这一新产品代表了市场转折点:智能层正在被商品化。
Gogia说:"我们正在从模型竞赛转向控制平面竞赛。现在的战略问题不是哪个模型最聪明,而是:哪个运行时堆栈能在规模上保证连续性、可审计性和运营韧性?"
与微软的伙伴关系重申
今天微软和OpenAI关于其伙伴关系的联合声明呼应了OpenAI在2025年10月对合作的类似重申。伙伴关系仍然"强劲且核心",两家公司甚至称其为"技术领域最具影响力的合作之一",专注于研究、工程和产品开发。
公司强调:微软维持对OpenAI模型和产品知识产权的独家许可和访问权;OpenAI的Frontier和其他第一方产品将继续在Azure上托管;人工通用智能(AGI)的合同定义和"确定是否已实现的过程"保持不变;持续的收入分享安排将保持不变;OpenAI有灵活性在其他地方承诺计算资源,包括通过Stargate项目等基础设施倡议;两家公司都可以独立寻求新机会。
Mayham说:"那份联合声明读起来像是由三家律师事务所同时起草的,这就是关键。"
协议的核心是Azure仍然是无状态OpenAI API的独家云提供商。这允许OpenAI在AWS上建立一个超出微软影响范围的新类别。
OpenAI最终是在"走钢丝",因为它应该将分销扩展到Azure之外以接触AWS客户,后者占据企业市场的巨大份额。同时,他们必须确保微软不会觉得其135亿美元的投资"在战略价值上被稀释了"。
Gogia称这一声明为"结构性保证"。OpenAI必须在云端增长分销,因为企业买家要求多云灵活性。他们不想被限制在单一云上;他们想要架构选择性。
此外,"CIO和董事会不希望供应商不稳定。超大规模云服务商冲突风险现在是董事会层面的关注点。"
新的基础设施投资
与此同时,来自英伟达、软银和亚马逊的1100亿美元新资金将允许OpenAI扩大其全球影响力并"深化"其基础设施。重要的是,这笔资金包括使用3GW的专用推理容量和在英伟达Vera Rubin系统上的2GW训练。这建立在已经在微软、Oracle云基础设施(OCI)和CoreWeave上运行的Hopper和Blackwell系统基础上。
Mayham称这为"标题中的标题"。
他说:"现金不能构建AI产品;计算能力可以。现在,获得下一代英伟达硬件是地球上每个AI公司的真正瓶颈。"
OpenAI本质上是锁定了为其所有业务提供动力的芯片的"保证供应线"。来自所有三家公司的资金为运营和基础设施提供资金,但英伟达容量和训练允许OpenAI使用最前沿的基础设施。"如果你得不到处理器,现金就只是坐在银行账户里。"
推理现在是AI中最大的成本驱动因素之一,Gogia指出前沿AI系统受到物理基础设施的约束;GPU、高带宽内存(HBM)、高速互连和其他硬件,以及电网级电源容量都是有限资源。
当前的举措将OpenAI更深入地嵌入到基础设施堆栈中,但风险是集中化。当计算控制在少数超大规模云服务商和芯片供应商之间集中时,系统可能变得脆弱。为了保护自己,Gogia建议企业监控供应链集中度。
"然而,从战略角度来看,这一举措加强了OpenAI的耐久性。它保障了维持前沿模型扩展和企业推理增长所需的物理基础。"
Q&A
Q1:什么是有状态AI?它与无状态AI有什么区别?
A:有状态AI是OpenAI推出的新技术,能够在多步骤操作中保持上下文记忆,而无状态AI每次调用都是独立的,无法记住之前的操作。有状态AI可以传递内存、历史记录、工具状态等信息,适合复杂的企业工作流。
Q2:OpenAI与亚马逊的合作会影响其与微软的关系吗?
A:不会。OpenAI明确声明与亚马逊的合作不会改变与微软合作关系的条款。Azure将继续作为无状态OpenAI API的独家云服务提供商,而新的有状态服务将在AWS上运行,形成差异化布局。
Q3:英伟达1100亿美元投资对OpenAI意味着什么?
A:这笔投资包括3GW专用推理容量和2GW训练资源,为OpenAI锁定了下一代英伟达硬件的保证供应。由于获得顶级GPU是AI公司的关键瓶颈,这确保了OpenAI在前沿模型扩展和企业推理增长方面的基础设施保障。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.