网易首页 > 网易号 > 正文 申请入驻

数十亿AI员工上岗倒计时!云计算一哥“没有魔法,只有真能解决问题的Agent”

0
分享至


智东西​
作者 李水青
编辑 漠影

2025年的大模型产业正在经历一场静默的分化。一边,少数明星模型的参数竞赛依然激烈;另一边,一个更根本的转变已在基础设施层悄然发生:

AI的价值实现路径,正从“模型能力展示”转向“Agent实际部署”。

亚马逊云科技CEO马特·加曼(Matt Garman)在今日凌晨举办的2025 re:Invent主题演讲中直言:“Agent的出现使我们在AI轨迹上发生了变化——从一个技术奇迹的时代,转向真正获得价值的时代。”

他的判断基于一组反差强烈的数据:一方面,生成式AI引发全球狂欢,Amazon Bedrock已服务超过10万家企业,其中50多家客户处理了超1万亿tokens;另一方面,许多企业仍未看到AI投资带来相匹配的业务回报。


▲Garman在讲解Amazon Bedrock落地情况

Agent是企业从AI投资中获得实质性商业回报的地方。”Garman揭示了一个关键转折点,“我相信,在未来每个公司内部和每个可以想象的领域都会有数十亿的Agent。”

一场重新定义AI价值实现的竞赛已经打响。在亚马逊云科技2025 re:Invent的舞台上,AI芯片性能飙涨600%,构建AI Agent的四大技术支柱同步升级,Agent部署的全栈战争已经升级……到底什么才是企业抓住这场变革红利的抓手?

云计算一哥的一招一式,都给了我们解答Agent变革时代之问的绝佳参考。


▲Garman在讲解Agent部署的所需要素

一、重新定义AI Infra:自研芯片与「AI工厂」的双重革命

算力竞争已进入云巨头自主可控、性能狂飙的阶段。亚马逊云科技在2025 re:Invent上亮出了其最尖端的武器:基于自研3nm芯片的Amazon EC2 Trainium 3 UltraServers服务器正式全面推出,而下一代Trainium 4芯片的性能参数更令人震撼。

“如果看看今天在Amazon Bedrock上运行的所有推理,大多数实际上已经由Trainium驱动了。”Garman透露。更令人印象深刻的是,亚马逊云科技已部署超过100万颗自研Trainium芯片,而上一代Trainium 2的量产速度是其此前芯片的4倍

最新性能数据揭示了这场算力革命的紧迫程度:基于首款云端3nm AI芯片Trainium 3,亚马逊云科技最新推出的Amazon EC2 Trainium 3 UltraServers服务器,最极致的配置将144颗Trainium 3芯片互连,提供362PFLOPS(FP8)算力和超过700TB/秒的总带宽。

该服务器提供相比前代Trainium 2的4.4倍的计算性能、3.9倍的内存带宽提升,而能效比指标——每兆瓦电力处理的AI token数量——提升了5倍


▲Amazon EC2 Trainium 3 UltraServers服务器性能情况

更值得一提的是,对于下一代Trainium 4,亚马逊云科技承诺了更大幅度的飞跃:预计提供6倍的FP4性能,4倍的内存带宽,2倍的内存容量,并支持通过NVLink Fusion和UALink进行扩展,专为全球最大的模型训练需求而生。

但芯片性能只是故事的一半。亚马逊云科技同时推出了更具战略意义的Amazon AI Factories(AI工厂)服务——允许企业在自己的数据中心部署专用AI基础设施,同时享受亚马逊云科技的全套服务和管理。

这一举措直击企业生成式AI出海全球化部署中的核心痛点:数据主权、合规要求与性能需求的平衡。企业可以在本地维护数据控制权,充分利用既有空间与电力资源;同时获得与公有云相同的先进AI能力,无缝接入从Trainium、英伟达GPU到SageMaker和Bedrock的全栈AI服务。

二、模型生态的多元主义:自研模型超GPT-5.1,中国模型占1/4席位

与追逐“万能模型”的潮流相反,亚马逊云科技选择了多元化的模型战略。“我们从不相信会有一个模型统治一切。”Garman明确表示,“相反,会出现很多伟大的模型。”

这一理念在Amazon Bedrock平台上得到充分体现。过去一年,Amazon Bedrock平台提供的模型数量翻倍,2025 re:Invent上新增的18款全托管开源模型也包含4款中国顶尖模型,中国模型占1/4席位,包括千问、DeepSeek、Kimi及MiniMax多家模型已上线Amazon Bedrock平台。

对中国企业而言,这意味着在出海和全球化过程中,可以获得更贴近本土技术特点的生成式AI支持。对全球用户而言,这代表了更广泛的技术选择。

亚马逊云科技最新推出的自研的Amazon Nova 2系列模型则展示了另一种可能。四款新型号覆盖了从轻量推理到复杂多模态的全场景需求:

Amazon Nova 2 Lite:是一款快速且经济高效的推理模型,拥有不错的指令遵循、工具调用、信息提取、代码生成等能力,在上述四大领域的能力基本全面超越了Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等轻量级模型,仅在编程能力上略逊于GPT-5 mini。

Amazon Nova 2 Pro:是Nova系列中最智能的推理模型,支持文字、图像、视频、语音四种模态输入和文本模态输出,适用于高度复杂的工作负载,尤其是Agent场景。在两项Agent基准测试中,其表现已经超过了GPT-5.1(high)、Gemini 3 Pro Preview(high)等前沿模型。

Amazon Nova 2 Sonic:下一代语音转语音模型,能为AI应用提供实时、类人的对话式AI体验。在语音理解和推理任务上,其性能已经超过了GPT Realtime、Gemini 2.5 Flash等。

Amazon Nova 2 Omni:是业界首个支持文本、图像、视频和音频输入,并支持文本和图像生成输出的推理模型。不过,亚马逊云科技尚未公布其基准测试成绩。


▲Amazon Nova 2 Omni发布现场

可以看到,特别是在Agent关键能力的基准测试中,Amazon Nova 2 Pro展现了令人印象深刻的性能,这直接回应了企业对于生成式AI在实际业务场景中可靠性的关切。

尤其是在企业出海的场景中,选择至关重要(Choice Matters)。AI的未来不会仅由1个模型统治,过去一年Amazon Bedrock上提供的模型数量已经翻倍,DeepSeek、Qwen等中国模型也在支持范围之内,这位中国企业的出海业务部署Agent提供了丰富选择。

三、数据与模型深度融合:开放训练模型打破“RAG局限”

“你的数据是独一无二的,这就是你与竞争对手的区别。”Garman反复强调这一观点。然而,传统的数据与模型结合技术如RAG(检索增强生成)只能帮助模型更有效地导航数据,无法让模型真正“理解”企业的深层次领域知识,这也成为Agent价值释放的“拦路虎”。

亚马逊云科技的革命性的解决方案是:Amazon Nova Forge服务,该服务引入了“开放式训练模型(Open Training Model)”的概念。


▲亚马逊云科技推出Amazon Nova Forge服务

通过这项服务,企业可以在模型训练的任意阶段,将自己的专有数据与亚马逊的训练数据集混合,创建名为“Novellas”的定制模型。这一方法解决了传统微调中的核心矛盾——在教授模型新领域知识的同时,避免其“遗忘”已掌握的核心推理能力。

Amazon Nova Forge还提供了使用远程奖励函数和强化学习微调的能力,以进一步改进模型,让企业可以将真实环境集成到训练循环中。由于基础模型已经理解业务,这些后训练技术实际上会变得更加有效。

索尼是这一服务的早期采用者。通过对Amazon Nova 2 Lite模型进行微调,索尼创建了深度理解自身业务和运营的定制模型,在引用一致性和文档依据等任务上表现优于基准模型,目标是将合规审查和评估流程的效率提升100倍

可以看到,对于寻求通过生成式AI实现差异化竞争优势的企业而言,这一能力至关重要。它意味着企业可以构建真正理解自身业务逻辑、流程和知识的Agent,而非仅仅使用通用的AI工具。

四、回归一件事:没有魔法,只有可部署的Agent

2025 re:Invent上最引人注目的发布,或许是三类“前沿Agent”的推出。这些Agent代表了AI能力的一次阶跃式提升:自主、大规模可扩展且能长期运行,也给广大开发者打了个样。

三类前沿Agent展示了AI重塑软件开发和运营的潜力:

Kiro autonomous agent彻底改变了开发范式。它与市面上常见的代码补全助手不同,而是能够自主处理复杂任务,如升级关键库时,自动识别所有受影响服务,分析使用模式,按规范更新代码,运行完整测试,并一次性创建所有合并就绪的拉取请求。亚马逊内部的一个案例显示,原本需要30名开发者18个月完成的重架构项目,使用Kiro后仅需6人76天完成。


▲亚马逊云科技推出Kiro autonomous agent

Amazon Security Agent是一个持续、主动、内置的AI安全专家。将安全实践从“事后检查”变为“持续嵌入”。它能在设计阶段审查文档,编码过程中扫描漏洞,并将渗透测试从昂贵的一次性活动转变为按需的持续验证过程,从而确保安全性。

Amazon DevOps Agent重新定义了运维响应机制。当警报触发时,它能立即诊断根本原因,提供修复方案,使工程师能够专注于决策而非排查。这一能力对于保障全球化业务的连续性至关重要。

Agent开发的基础设施同样得到加强。Amazon Bedrock AgentCore自SDK预览版发布以来,5个月内下载量超过200万次。新增的两项功能直接应对企业部署Agent的核心关切点:

Amazon AgentCore Policy(预览版):为Agent与企业工具及数据的交互提供实时确定性控制。

它允许开发者在Amazon AgentCore Gateway工具调用运行前拦截,使用带有细粒度权限的策略,为Agent行为定义明确的界限,如使用哪些工具、如何使用工具,开发者也可以通过自然语言创建标准,如“报销金额大于1000美元时,就阻止退款”等。


▲亚马逊云科技推出Amazon AgentCore Policy

Amazon AgentCore Evaluations(预览版):根据实际行为持续检查Agent质量。

这是一项全托管服务,开发者可以使用内置评估器来衡量常见的质量维度,如正确性、帮助性、工具选择准确性、安全性、目标成功率和上下文相关性,还可以创建基于模型的定制评分系统,根据自己选择的提示和模型进行业务定制评分。


▲亚马逊云科技推出Amazon AgentCore Evaluations

除了上述更新,Garman还在最后10分钟公布了25个新发布,包括搭载第五代AMD EPYC处理器的X8i Instances、搭载英特尔至强6的C8ine Instances、EC2 M3 Ultra Mac Instances等覆盖计算、存储、数据库、大数据、安全等多个领域的新品,这些都为企业Agent部署提供了稳定坚实的支撑。

结语:AI进入Agent时间,价值落地之战打响

当AI进入Agent时间,2025 re:Invent的舞台展示了亚马逊云科技对Agent时代的全面布局,这不再是一场单点技术的竞赛,而是全栈能力的比拼,其正在构建一个支持Agent从实验到落地生产的完整平台。

当下,每个产业人士都在见证生成式AI从技术演示走向商业价值,价值落地之战已打响。云巨头的这种“全家桶”式的全栈能力,或许正是企业将AI投资转化为实际业务回报所需要的基础设施。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
河南省铁路建设投资集团总经理孙伟良接受审查调查

河南省铁路建设投资集团总经理孙伟良接受审查调查

界面新闻
2026-04-10 15:59:24
日本电动汽车销量大涨80%,比亚迪却卖不动了?

日本电动汽车销量大涨80%,比亚迪却卖不动了?

热点科技
2026-04-08 13:06:00
4月10日下午中国女篮:传来3大主力消息!李月汝、李梦、韩旭

4月10日下午中国女篮:传来3大主力消息!李月汝、李梦、韩旭

傲傲讲历史
2026-04-11 05:22:25
曾被誉为“上海最好吃的面”疑似闭店!曾连续多年入选米其林榜单,满满的回忆

曾被誉为“上海最好吃的面”疑似闭店!曾连续多年入选米其林榜单,满满的回忆

上观新闻
2026-04-10 16:24:27
世界杯冠军怒批曼联!2600 万卖他,堪称队史最蠢操作

世界杯冠军怒批曼联!2600 万卖他,堪称队史最蠢操作

奶盖熊本熊
2026-04-11 05:38:46
魔高一尺、道高一丈!中国军号海外账号发布中日英海报:中国军队有足够的能力,让侵略者付出难以承受的代价

魔高一尺、道高一丈!中国军号海外账号发布中日英海报:中国军队有足够的能力,让侵略者付出难以承受的代价

大象新闻
2026-04-10 12:44:04
哈登迎来生涯最佳队友?美媒:哈登和阿伦同时登场,骑士11胜2负

哈登迎来生涯最佳队友?美媒:哈登和阿伦同时登场,骑士11胜2负

爱体育
2026-04-10 23:33:43
全球又要大乱?俄中将阵亡,美油管被炸,四国集体失声!

全球又要大乱?俄中将阵亡,美油管被炸,四国集体失声!

星星没有你亮
2026-04-09 11:32:47
科学家首次见证“猩猩帝国内战”:首领重伤身亡后群体分裂,两大帮派血腥残杀

科学家首次见证“猩猩帝国内战”:首领重伤身亡后群体分裂,两大帮派血腥残杀

红星新闻
2026-04-10 18:13:29
形势开始大变!西方媒体集体改口:中国已无需再向世界证明什么

形势开始大变!西方媒体集体改口:中国已无需再向世界证明什么

小嵩
2026-04-08 21:00:14
黑龙江畜生公公周永福被判死刑,法庭上嚣张大笑:这辈子值了

黑龙江畜生公公周永福被判死刑,法庭上嚣张大笑:这辈子值了

纸鸢奇谭
2025-02-06 14:31:24
美国爆出丑闻:美军真实伤亡惨烈,政府或故意隐瞒,全美热议!

美国爆出丑闻:美军真实伤亡惨烈,政府或故意隐瞒,全美热议!

健身狂人
2026-04-10 18:25:51
海港VS申花:4外援坐镇 国足中场新星领衔 两大功勋老将替补待命

海港VS申花:4外援坐镇 国足中场新星领衔 两大功勋老将替补待命

零度眼看球
2026-04-11 07:11:21
妮可·基德曼顶3斤假发亮相,Schiaparelli高定秒变淘宝

妮可·基德曼顶3斤假发亮相,Schiaparelli高定秒变淘宝

热搜摘要官
2026-04-10 08:02:47
4月10日俄乌最新:万斯再开黄腔

4月10日俄乌最新:万斯再开黄腔

西楼饮月
2026-04-10 16:09:59
11年前优衣库男女主现状曝光,他们还在一起生了两个孩子

11年前优衣库男女主现状曝光,他们还在一起生了两个孩子

半糖甜而不腻
2026-04-06 12:09:15
德国汉学家:“中国有美欧已经失去的现代化愿景”

德国汉学家:“中国有美欧已经失去的现代化愿景”

参考消息
2026-04-10 12:08:13
大杀器终于到手!马克龙大谈中国,他断定:法国翻盘的机会来了

大杀器终于到手!马克龙大谈中国,他断定:法国翻盘的机会来了

触摸史迹
2026-04-10 15:20:30
“嘌呤”不读 piāo líng!动不动说自己高嘌呤的人注意了

“嘌呤”不读 piāo líng!动不动说自己高嘌呤的人注意了

未央看点
2026-04-09 00:53:14
大量游客被困山顶:有人裹垃圾袋、呕吐、失温,景区回应

大量游客被困山顶:有人裹垃圾袋、呕吐、失温,景区回应

最江阴
2026-04-06 13:03:05
2026-04-11 07:40:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11555文章数 117026关注度
往期回顾 全部

科技要闻

马斯克狂发大火箭也养不起AI 年亏50亿美元

头条要闻

推动停火 巴基斯坦被指取得近年来最大的外交胜利之一

头条要闻

推动停火 巴基斯坦被指取得近年来最大的外交胜利之一

体育要闻

17岁赚了一百万美元,25岁被CBA裁员

娱乐要闻

黄景瑜王玉雯否认恋情!聚会细节被扒

财经要闻

李强主持召开经济形势专家和企业家座谈会

汽车要闻

搭载第二代刀片电池及闪充技术 腾势N8L闪充版预售35万起

态度原创

时尚
本地
旅游
游戏
房产

今日热点:陈添祥长文道歉;夏克立曾给前经纪人传上厕所照片……

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

旅游要闻

巴西记者“桥”见武汉

任天堂独占传统不再!经典作品跨平台引粉丝不满

房产要闻

28条新规落地!好房子,终于有了“广州标准”!

无障碍浏览 进入关怀版