网易首页 > 网易号 > 正文 申请入驻

数十亿AI员工上岗倒计时!云计算一哥“没有魔法,只有真能解决问题的Agent”

0
分享至


智东西​
作者 李水青
编辑 漠影

2025年的大模型产业正在经历一场静默的分化。一边,少数明星模型的参数竞赛依然激烈;另一边,一个更根本的转变已在基础设施层悄然发生:

AI的价值实现路径,正从“模型能力展示”转向“Agent实际部署”。

亚马逊云科技CEO马特·加曼(Matt Garman)在今日凌晨举办的2025 re:Invent主题演讲中直言:“Agent的出现使我们在AI轨迹上发生了变化——从一个技术奇迹的时代,转向真正获得价值的时代。”

他的判断基于一组反差强烈的数据:一方面,生成式AI引发全球狂欢,Amazon Bedrock已服务超过10万家企业,其中50多家客户处理了超1万亿tokens;另一方面,许多企业仍未看到AI投资带来相匹配的业务回报。


▲Garman在讲解Amazon Bedrock落地情况

Agent是企业从AI投资中获得实质性商业回报的地方。”Garman揭示了一个关键转折点,“我相信,在未来每个公司内部和每个可以想象的领域都会有数十亿的Agent。”

一场重新定义AI价值实现的竞赛已经打响。在亚马逊云科技2025 re:Invent的舞台上,AI芯片性能飙涨600%,构建AI Agent的四大技术支柱同步升级,Agent部署的全栈战争已经升级……到底什么才是企业抓住这场变革红利的抓手?

云计算一哥的一招一式,都给了我们解答Agent变革时代之问的绝佳参考。


▲Garman在讲解Agent部署的所需要素

一、重新定义AI Infra:自研芯片与「AI工厂」的双重革命

算力竞争已进入云巨头自主可控、性能狂飙的阶段。亚马逊云科技在2025 re:Invent上亮出了其最尖端的武器:基于自研3nm芯片的Amazon EC2 Trainium 3 UltraServers服务器正式全面推出,而下一代Trainium 4芯片的性能参数更令人震撼。

“如果看看今天在Amazon Bedrock上运行的所有推理,大多数实际上已经由Trainium驱动了。”Garman透露。更令人印象深刻的是,亚马逊云科技已部署超过100万颗自研Trainium芯片,而上一代Trainium 2的量产速度是其此前芯片的4倍

最新性能数据揭示了这场算力革命的紧迫程度:基于首款云端3nm AI芯片Trainium 3,亚马逊云科技最新推出的Amazon EC2 Trainium 3 UltraServers服务器,最极致的配置将144颗Trainium 3芯片互连,提供362PFLOPS(FP8)算力和超过700TB/秒的总带宽。

该服务器提供相比前代Trainium 2的4.4倍的计算性能、3.9倍的内存带宽提升,而能效比指标——每兆瓦电力处理的AI token数量——提升了5倍


▲Amazon EC2 Trainium 3 UltraServers服务器性能情况

更值得一提的是,对于下一代Trainium 4,亚马逊云科技承诺了更大幅度的飞跃:预计提供6倍的FP4性能,4倍的内存带宽,2倍的内存容量,并支持通过NVLink Fusion和UALink进行扩展,专为全球最大的模型训练需求而生。

但芯片性能只是故事的一半。亚马逊云科技同时推出了更具战略意义的Amazon AI Factories(AI工厂)服务——允许企业在自己的数据中心部署专用AI基础设施,同时享受亚马逊云科技的全套服务和管理。

这一举措直击企业生成式AI出海全球化部署中的核心痛点:数据主权、合规要求与性能需求的平衡。企业可以在本地维护数据控制权,充分利用既有空间与电力资源;同时获得与公有云相同的先进AI能力,无缝接入从Trainium、英伟达GPU到SageMaker和Bedrock的全栈AI服务。

二、模型生态的多元主义:自研模型超GPT-5.1,中国模型占1/4席位

与追逐“万能模型”的潮流相反,亚马逊云科技选择了多元化的模型战略。“我们从不相信会有一个模型统治一切。”Garman明确表示,“相反,会出现很多伟大的模型。”

这一理念在Amazon Bedrock平台上得到充分体现。过去一年,Amazon Bedrock平台提供的模型数量翻倍,2025 re:Invent上新增的18款全托管开源模型也包含4款中国顶尖模型,中国模型占1/4席位,包括千问、DeepSeek、Kimi及MiniMax多家模型已上线Amazon Bedrock平台。

对中国企业而言,这意味着在出海和全球化过程中,可以获得更贴近本土技术特点的生成式AI支持。对全球用户而言,这代表了更广泛的技术选择。

亚马逊云科技最新推出的自研的Amazon Nova 2系列模型则展示了另一种可能。四款新型号覆盖了从轻量推理到复杂多模态的全场景需求:

Amazon Nova 2 Lite:是一款快速且经济高效的推理模型,拥有不错的指令遵循、工具调用、信息提取、代码生成等能力,在上述四大领域的能力基本全面超越了Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等轻量级模型,仅在编程能力上略逊于GPT-5 mini。

Amazon Nova 2 Pro:是Nova系列中最智能的推理模型,支持文字、图像、视频、语音四种模态输入和文本模态输出,适用于高度复杂的工作负载,尤其是Agent场景。在两项Agent基准测试中,其表现已经超过了GPT-5.1(high)、Gemini 3 Pro Preview(high)等前沿模型。

Amazon Nova 2 Sonic:下一代语音转语音模型,能为AI应用提供实时、类人的对话式AI体验。在语音理解和推理任务上,其性能已经超过了GPT Realtime、Gemini 2.5 Flash等。

Amazon Nova 2 Omni:是业界首个支持文本、图像、视频和音频输入,并支持文本和图像生成输出的推理模型。不过,亚马逊云科技尚未公布其基准测试成绩。


▲Amazon Nova 2 Omni发布现场

可以看到,特别是在Agent关键能力的基准测试中,Amazon Nova 2 Pro展现了令人印象深刻的性能,这直接回应了企业对于生成式AI在实际业务场景中可靠性的关切。

尤其是在企业出海的场景中,选择至关重要(Choice Matters)。AI的未来不会仅由1个模型统治,过去一年Amazon Bedrock上提供的模型数量已经翻倍,DeepSeek、Qwen等中国模型也在支持范围之内,这位中国企业的出海业务部署Agent提供了丰富选择。

三、数据与模型深度融合:开放训练模型打破“RAG局限”

“你的数据是独一无二的,这就是你与竞争对手的区别。”Garman反复强调这一观点。然而,传统的数据与模型结合技术如RAG(检索增强生成)只能帮助模型更有效地导航数据,无法让模型真正“理解”企业的深层次领域知识,这也成为Agent价值释放的“拦路虎”。

亚马逊云科技的革命性的解决方案是:Amazon Nova Forge服务,该服务引入了“开放式训练模型(Open Training Model)”的概念。


▲亚马逊云科技推出Amazon Nova Forge服务

通过这项服务,企业可以在模型训练的任意阶段,将自己的专有数据与亚马逊的训练数据集混合,创建名为“Novellas”的定制模型。这一方法解决了传统微调中的核心矛盾——在教授模型新领域知识的同时,避免其“遗忘”已掌握的核心推理能力。

Amazon Nova Forge还提供了使用远程奖励函数和强化学习微调的能力,以进一步改进模型,让企业可以将真实环境集成到训练循环中。由于基础模型已经理解业务,这些后训练技术实际上会变得更加有效。

索尼是这一服务的早期采用者。通过对Amazon Nova 2 Lite模型进行微调,索尼创建了深度理解自身业务和运营的定制模型,在引用一致性和文档依据等任务上表现优于基准模型,目标是将合规审查和评估流程的效率提升100倍

可以看到,对于寻求通过生成式AI实现差异化竞争优势的企业而言,这一能力至关重要。它意味着企业可以构建真正理解自身业务逻辑、流程和知识的Agent,而非仅仅使用通用的AI工具。

四、回归一件事:没有魔法,只有可部署的Agent

2025 re:Invent上最引人注目的发布,或许是三类“前沿Agent”的推出。这些Agent代表了AI能力的一次阶跃式提升:自主、大规模可扩展且能长期运行,也给广大开发者打了个样。

三类前沿Agent展示了AI重塑软件开发和运营的潜力:

Kiro autonomous agent彻底改变了开发范式。它与市面上常见的代码补全助手不同,而是能够自主处理复杂任务,如升级关键库时,自动识别所有受影响服务,分析使用模式,按规范更新代码,运行完整测试,并一次性创建所有合并就绪的拉取请求。亚马逊内部的一个案例显示,原本需要30名开发者18个月完成的重架构项目,使用Kiro后仅需6人76天完成。


▲亚马逊云科技推出Kiro autonomous agent

Amazon Security Agent是一个持续、主动、内置的AI安全专家。将安全实践从“事后检查”变为“持续嵌入”。它能在设计阶段审查文档,编码过程中扫描漏洞,并将渗透测试从昂贵的一次性活动转变为按需的持续验证过程,从而确保安全性。

Amazon DevOps Agent重新定义了运维响应机制。当警报触发时,它能立即诊断根本原因,提供修复方案,使工程师能够专注于决策而非排查。这一能力对于保障全球化业务的连续性至关重要。

Agent开发的基础设施同样得到加强。Amazon Bedrock AgentCore自SDK预览版发布以来,5个月内下载量超过200万次。新增的两项功能直接应对企业部署Agent的核心关切点:

Amazon AgentCore Policy(预览版):为Agent与企业工具及数据的交互提供实时确定性控制。

它允许开发者在Amazon AgentCore Gateway工具调用运行前拦截,使用带有细粒度权限的策略,为Agent行为定义明确的界限,如使用哪些工具、如何使用工具,开发者也可以通过自然语言创建标准,如“报销金额大于1000美元时,就阻止退款”等。


▲亚马逊云科技推出Amazon AgentCore Policy

Amazon AgentCore Evaluations(预览版):根据实际行为持续检查Agent质量。

这是一项全托管服务,开发者可以使用内置评估器来衡量常见的质量维度,如正确性、帮助性、工具选择准确性、安全性、目标成功率和上下文相关性,还可以创建基于模型的定制评分系统,根据自己选择的提示和模型进行业务定制评分。


▲亚马逊云科技推出Amazon AgentCore Evaluations

除了上述更新,Garman还在最后10分钟公布了25个新发布,包括搭载第五代AMD EPYC处理器的X8i Instances、搭载英特尔至强6的C8ine Instances、EC2 M3 Ultra Mac Instances等覆盖计算、存储、数据库、大数据、安全等多个领域的新品,这些都为企业Agent部署提供了稳定坚实的支撑。

结语:AI进入Agent时间,价值落地之战打响

当AI进入Agent时间,2025 re:Invent的舞台展示了亚马逊云科技对Agent时代的全面布局,这不再是一场单点技术的竞赛,而是全栈能力的比拼,其正在构建一个支持Agent从实验到落地生产的完整平台。

当下,每个产业人士都在见证生成式AI从技术演示走向商业价值,价值落地之战已打响。云巨头的这种“全家桶”式的全栈能力,或许正是企业将AI投资转化为实际业务回报所需要的基础设施。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗同意再放行20艘巴基斯坦籍船只通过霍尔木兹海峡,今后每天将有两艘船通过该海峡

伊朗同意再放行20艘巴基斯坦籍船只通过霍尔木兹海峡,今后每天将有两艘船通过该海峡

扬子晚报
2026-03-29 07:17:05
虚构:四大灵性动物不能吃,食之折寿,害之受报!别小看其中因果

虚构:四大灵性动物不能吃,食之折寿,害之受报!别小看其中因果

屏儿爱读书
2025-03-06 14:40:35
后续!男子吃饭拒付款,对着警察狂怼“我愿意给才给”,已被拘留

后续!男子吃饭拒付款,对着警察狂怼“我愿意给才给”,已被拘留

科普100克克
2026-03-29 17:34:00
一枚“火烈鸟”导弹引爆俄3万吨产能的炸药厂

一枚“火烈鸟”导弹引爆俄3万吨产能的炸药厂

桂系007
2026-03-28 23:48:41
410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

深度报
2025-12-14 22:36:54
做教培的闺蜜:张雪峰身价8亿,为啥还吃外卖?她的回答让我沉默

做教培的闺蜜:张雪峰身价8亿,为啥还吃外卖?她的回答让我沉默

蓝色海边
2026-03-27 18:08:02
伊朗女孩这场模仿秀,比任何抗议都狠

伊朗女孩这场模仿秀,比任何抗议都狠

老马拉车莫少装
2026-03-27 22:59:05
0-4惨败!韩国球迷哀叹:我们已不配跟日本比 只能找中国队寻安慰

0-4惨败!韩国球迷哀叹:我们已不配跟日本比 只能找中国队寻安慰

风过乡
2026-03-29 07:56:36
第84波猛攻!伊朗向华求援,中方斩钉截铁给美指路

第84波猛攻!伊朗向华求援,中方斩钉截铁给美指路

砚底沉香LIU
2026-03-29 14:54:03
李昌钰去世仅24小时,恶心的事情发生,私生活被扒,翁帆也被牵连

李昌钰去世仅24小时,恶心的事情发生,私生活被扒,翁帆也被牵连

林轻吟
2026-03-28 19:23:49
一场127-95让雷霆无奈!马刺创历史第1神迹,亚历山大的MVP不保了

一场127-95让雷霆无奈!马刺创历史第1神迹,亚历山大的MVP不保了

八斗小先生
2026-03-29 13:50:03
愧对600万!全场2分+正负值最低,4失误比得分多,新老东家都喷

愧对600万!全场2分+正负值最低,4失误比得分多,新老东家都喷

篮球看比赛
2026-03-29 11:35:11
穆帅再拒豪门高薪,为何只愿等本菲卡回头?

穆帅再拒豪门高薪,为何只愿等本菲卡回头?

行舟问茶
2026-03-29 18:55:54
女人敢开口向你要“这样东西”,就是“生理性喜欢”了,骗不了人

女人敢开口向你要“这样东西”,就是“生理性喜欢”了,骗不了人

i书与房
2026-02-07 15:36:43
谁是下一个?纹身师晒顾客感染者咬痕纹身引热议

谁是下一个?纹身师晒顾客感染者咬痕纹身引热议

游民星空
2026-03-29 10:06:07
再见,曼联!曝“大核”决定离开红魔!钦点2亿新援“空降”加盟

再见,曼联!曝“大核”决定离开红魔!钦点2亿新援“空降”加盟

头狼追球
2026-03-29 10:15:30
去了一趟伊朗才发现:原来在伊朗人眼里,中国人是这样的

去了一趟伊朗才发现:原来在伊朗人眼里,中国人是这样的

千秋文化
2026-03-24 21:40:40
70艘货船被扣,美方指责中国公报私仇,中方只用一句话,反将一军

70艘货船被扣,美方指责中国公报私仇,中方只用一句话,反将一军

梦史
2026-03-29 00:09:01
比亚迪终于豪华起来!全新腾势D9来了,这才叫顶级颜值!

比亚迪终于豪华起来!全新腾势D9来了,这才叫顶级颜值!

米粒说车唯一呀
2026-03-29 15:37:15
订单已排到2030年!震惊欧美国家,中国趁此机会突围上位

订单已排到2030年!震惊欧美国家,中国趁此机会突围上位

春风笑语
2026-03-28 08:28:33
2026-03-30 05:40:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11462文章数 117018关注度
往期回顾 全部

科技要闻

马斯克承认xAI"建错了",11位创始人均离职

头条要闻

伊朗议长:美航母遭受巨大损失 我们绝不接受屈辱

头条要闻

伊朗议长:美航母遭受巨大损失 我们绝不接受屈辱

体育要闻

绝杀卫冕冠军后,他单手指天把胜利献给父亲

娱乐要闻

汪峰定律再现!李荣浩喊话单依纯侵权

财经要闻

Kimi、Minimax 们的算力荒

汽车要闻

岚图泰山X8配置曝光 四激光雷达/华为新一代座舱

态度原创

房产
教育
亲子
本地
公开课

房产要闻

首日430组来访,单日120组认筹!海口首个真四代,彻底爆了!

教育要闻

建议给家长放春秋假,否则的话,学生放春秋假就失去意义

亲子要闻

罕见五胞胎全保住,20多名医护深夜齐上阵

本地新闻

在潍坊待了三天,没遇到一个“潍坊人”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版