网易首页 > 网易号 > 正文 申请入驻

大模型最强生态?今天有答案了

0
分享至

数百万大模型用户如今可以在亚马逊云科技上部署OpenAI的最新推理模型,这一消息引发业界震动。


8月6日,OpenAI最新发布的两款开放权重基础模型gpt-oss-120b与gpt-oss-20b,首次可通过Amazon Bedrock和Amazon SageMaker AI访问,帮助客户快速构建生成式AI应用;与此同时,亚马逊投资的Anthropic最新一代Claude Opus 4.1和Claude Sonnet 4混合推理模型也刚上线Bedrock平台。两家AI领域明星级产品的落地访问,奏响了亚马逊云科技在Agentic AI时期的“双响炮”。


目前,Amazon Bedrock成为汇集了OpenAI、Anthropic、DeepSeek、Meta、Mistral AI等13家顶级AI公司大模型的部署托管平台。一个用户思维惯性也正显现:每当大模型明星产品重磅发布后,用户都能无延时地通过Amazon Bedrock或SageMaker平台调用它们。以至于有人戏称,大模型争霸赛可以直接在Amazon Bedrock上争了。这背后究竟有怎样的战略考量和市场逻辑?

“选择大于一切”,AI巨变时代的战略定力

其实早在大模型争霸赛之前,亚马逊云科技就确定了“选择大于一切”的战略方向。

2023年4月,亚马逊云科技推出Amazon Bedrock平台,率先打破行业对“单一终极AI模型”的追逐,以多样化模型奠定基础。2024年re:Invent大会上,Andy Jassy提出“Choice Matters”战略,其逻辑背景是,没有一款大模型能“包打一切”、适应全部场景,如今这一前瞻性布局已形成包含上百款商业及开源模型的庞大生态,彰显了差异化技术路线的长期价值——随着智能体Agentic AI的到来,用户对具备复杂任务执行能力的多样化模型需求持续增长,多元模型选择和多模型协作将是一种趋势。


但当时大模型企业风头正劲,外界目光普遍聚焦在模型性能竞赛中。

而当狂热褪去,亚马逊云科技对市场的商业洞察在两年后得到Gartner的印证。Gartner在2025年预测,到2027年将有80%的中国企业采用多模型策略,确保客户在云上的多模型选择权变得至关重要。

客户自由选择的前提是有的可选。“选择大于一切”战略方向确立的同时,亚马逊云科技发布了模型托管平台Amazon Bedrock。此后,Amazon Bedrock成为每个季度亚马逊云科技财报文字描述中出现频率几乎最高的业务词组,每次出现都意味着创新进展。

当前Amazon Bedrock有217款大模型可供选择调用,回顾各大模型入驻的时间线,可以用步步为营来形容:2023年4月,Anthropic模型上线Bedrock平台,同时还有AI21 Labs模型;7月,Meta的Llama模型入驻;9月,Stability AI上线可用,同时亚马逊云科技自研的Nova系列产品上线;11月,Cohere入驻;2024年2月,Mistral AI入驻;2025年2月,DeepSeek-R1上线……直到眼下OpenAI的加入,让“选择大于一切”的战略拼图更加完整。有人戏称,现在就差谷歌的Gemini和马斯克的Grok,Amazon Bedrock就可以“集齐龙珠”了。

2024年,来自Gartner的统计显示:有三分之二受访企业高管认为生成式AI将带来颠覆性变革,其热潮促使大量试点及概念验证(PoC)项目启动,然而仅有41%的项目能进入生产阶段。换句话说,“模型打榜”的癫狂氛围让企业纷纷一拥而上,却受困于模型选择背后的成本预算、数据的迁移与管理、实施中的ROI投资回报等问题,导致多一半的项目折戟。

“选择大于一切”这一理念来源于亚马逊云科技强大的云服务经验。客户面对大模型选择时,需要在时延、成本、精度三个层面上找到平衡。通常,小的模型成本低、速度快,但精度也低;大的模型恰好相反。模型也不是越大越好,而是要选择适配客户业务、能带来商家价值增量的组合。

就像OpenAI刚开放的权重基础模型gpt-oss-120b和gpt-oss-20b,OpenAI旗下大模型主要以GPT和o系列命名,此次开源针对的是后者,而非核心GPT。它能在高端笔记本电脑,甚至手机上运行,且性价比更高,进一步满足下沉需求。

OpenAI针对这个“强大的带有推理能力的全新开放权重(open-weight)模型”表示,发布开源系统的原因之一是一些企业和个人更倾向于在自有计算机硬件上运行这类技术。不难看出,如果说一年前业界还热衷于对开源模型和闭源模型的模式之争,现在的热度已转向如何能够以更低成本、更便捷地为终端客户服务。

在Amazon Bedrock上,用户非常清楚,不仅有适合单个场景的高性价比和能力适配的模型,也能完成多模型参与场景匹配实现最佳效果。而这一最强生态中,亚马逊云科技亲自下场自研的Nova系列四大模型也极为关键,通过与其他优质模型适配,形成了不同使用场景下的模型组合。


例如,在复杂的翻译系统中,DeepSeek R1和Claude 3.7负责处理难度大的专业翻译,Nova Lite处理日常用语;在聊天机器人中,Nova Lite先理解用户说什么,Claude再负责处理复杂问题;做深度研究时,让DeepSeek R1和Claude 4专门负责推理,Claude Haiku处理具体的函数调用……

亚马逊云科技始终坚持“选择大于一切”,一方面,客户可以通过更多的选择最大化地实现业务价值;另一方面,亚马逊云科技也可以通过这一战略在生成式AI的市场竞争中赢得成功。这也是它区别于其他可能只提供单一模型选择的云服务提供商之处。

AI比拼的不是冲刺速度

当模型厂商还在纠结是否开放,AWS已经建立起了最完整的AI朋友圈——这意味着最强大的生态,也意味着最庞大的用户基础。

OpenAI现已正式在Amazon Bedrock与Amazon SageMaker AI上线其开放权重模型,用户可以通过Bedrock AgentCore部署并运行高效Agent智能体;也可以在机器学习平台SageMaker上结合开放权重模型与完善的工具链实现模型的预训练、评估、微调与部署。目前SageMaker平台上大约有185款开源模型供选择,加上Bedrock平台上的217款商业模型,一共有大约400款可选。

据测算,目前在Amazon Bedrock上运行的OpenAI两个开放权重模型中的大尺寸模型,在性价比方面是同类Gemini模型的3倍、DeepSeek-R1的5倍,以及OpenAI自家的o4模型的两倍。另据OpenAI公布,gpt-oss-120b模型在竞赛编码、工具调用基准测试中的得分接近或超过自家闭源的o4-mini模型。


成本的下降是推进AI发展进入拐点的重要因素。斯坦福大学2025年人工智能报告指出,过去两年推理成本下降了约280倍。推理成本的极速降低使得Agentic AI应用的规模化部署成为可能。根据不久前亚马逊云科技中国峰会上亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松的判断,如今正处于AI发展的拐点——即Agentic AI爆发的前夜,将从“我问AI答”,“我说AI写”,发展到“我说AI做”。

得益于OpenAI的开放权重模型兼具紧凑体量与强大性能,并具备先进的推理能力,支持调节推理深度与思维链输出,可将复杂问题分解为清晰的逻辑步骤,因而非常适用于Agent工作流、代码生成、科学分析和数学问题求解等场景。其较小的模型甚至能在手机端应用,实现“口袋里的AI”。而Anthropic最新一代Claude Opus 4.1和Claude Sonnet 4模型不仅能持续处理复杂的长周期任务,更能驱动AI智能体实现“数小时工作分钟级完成”的突破性效能。

但总体看来,生成式AI现在还处于非常早期的阶段。亚马逊CEO安迪·贾西在今年二季度财报分析师会议上抛出一个有关大模型部署成本“头重脚轻”的观点。他认为,现在AI部署成本大部分产生于模型训练阶段,也就是“头”的部分,但当市场趋于成熟、有更多用户将AI应用部署到生产上并形成规模化时,80%-90%的AI成本将出现在推理环节。届时用户将更关注所使用的计算和硬件,更重视性价比、安全性与系统稳定。

以这个趋势判断回头去看大模型竞赛,决定AI竞赛最终胜负的,并非一时的冲刺速度,或者起跑时的身位,而是全面的战略耐力。现在下结论、排座次为时尚早。

亚马逊云科技从自研芯片到AI应用的全栈布局思路,将把握住这个趋势性的发展脉络。它针对生成式AI采用三层技术栈,搭建了一个完整的支持系统。在架构上,最底层是以英伟达GPU和自研芯片为代表的基础设施,用于模型训练及推理;中间层的核心是Amazon Bedrock托管服务;顶层是以Amazon Q、Kiro编程助手为代表的开箱即用的生成式AI应用工具。

以底层基础设施为例,亚马逊云科技在与英伟达紧密合作的同时,自研芯片迭代加快,其专为大规模模型训练设计的第二代AI芯片Trainium2号称“在性价比上比其他GPU供应商高出30%到40%”,并已成为Anthropic等公司新一代模型训练的支柱。这种成本优势将在客户大规模部署AI应用时变得至关重要。

此外,亚马逊云科技是目前稳定性排名第一的云服务商。在Frost&Sullivan最新报告《云服务韧性由何决定?》中,亚马逊云科技以99.99%的超高可用性,成为中国唯一达到“四个九”标准的云服务提供商,其稳定性较行业平均水平高出5倍。而Amazon Bedrock平台上的安全护盾Guardrails,通过可配置安全策略可拦截高达88%的有害内容,提升第三方模型的使用安全性。

庞大的客户基础与生态将是最终的护城河。安迪·贾西提醒投资者,生成式AI的推理工作负载最终将像计算、存储和数据库一样,成为云服务的一个基础构建模块,“大家肯定希望把AI应用和现有系统放一起。今天,在AWS上的应用和数据,比其他所有平台加起来还多。”

亚马逊云科技是目前全球最大的云厂商,第二名的规模大约是其65%。践行“选择大于一切”,亚马逊云科技用三年时间证明了多模型战略的远见,这带来的不仅是规模效应,而且这种与客户现有IT架构的深度绑定的模式,将使其在AI应用规模化普及时拥有天然的客户黏性优势——这在AI竞赛新篇章中至关重要。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
央视选了合资车,行业炸锅了,标准革命悄悄来了

央视选了合资车,行业炸锅了,标准革命悄悄来了

三农老历
2025-11-15 01:40:27
不出意外的话!苏林会成为第二个黎笋

不出意外的话!苏林会成为第二个黎笋

近史谈
2025-11-02 18:54:35
F-16昨夜发射45枚导弹!乌克兰测试新技术:一人控制100架无人机

F-16昨夜发射45枚导弹!乌克兰测试新技术:一人控制100架无人机

鹰眼Defence
2025-11-15 17:23:04
为什么首富必须死?

为什么首富必须死?

汉周读书
2024-05-20 09:52:50
玉渊谭天:中方已做好对日实质反制准备

玉渊谭天:中方已做好对日实质反制准备

澎湃新闻
2025-11-15 18:18:09
中央军委副主席:中国必须着眼国际军事竞争战略制高点抢占先机

中央军委副主席:中国必须着眼国际军事竞争战略制高点抢占先机

俄罗斯卫星通讯社
2025-11-12 15:09:26
楼上大爷偷我快递不认,我换地址把寄去公司,几天后物业打来电话

楼上大爷偷我快递不认,我换地址把寄去公司,几天后物业打来电话

秋风专栏
2025-10-06 11:43:21
俄罗斯发出警告:战争爆发中国将被围攻,不过最危险的不止战争

俄罗斯发出警告:战争爆发中国将被围攻,不过最危险的不止战争

扶苏聊历史
2025-11-15 14:24:02
陕西985女生火了!情趣内衣用完就退,商家公开讨伐,曝更多猛料

陕西985女生火了!情趣内衣用完就退,商家公开讨伐,曝更多猛料

阿纂看事
2025-11-15 15:40:48
网红“峰哥亡命天涯”多平台账号被禁止关注

网红“峰哥亡命天涯”多平台账号被禁止关注

极目新闻
2025-11-14 18:38:00
沙特拒歼35选F35,五角大楼操心技术泄露,中国军工最大伏笔出现

沙特拒歼35选F35,五角大楼操心技术泄露,中国军工最大伏笔出现

窥史
2025-11-15 18:05:31
大哥狂刷55年纪录大礼包,三弟41+14+11,新秀8次抢断也徒劳

大哥狂刷55年纪录大礼包,三弟41+14+11,新秀8次抢断也徒劳

体育新角度
2025-11-15 18:27:04
9比0才能晋级!最惨冠军诞生,连续三届跌入附加赛,世界杯又难了

9比0才能晋级!最惨冠军诞生,连续三届跌入附加赛,世界杯又难了

篮球圈里的那些事
2025-11-15 15:35:18
日本男足新海报因酷似韩国太极旗引发轩然大波,设计师意图何在?

日本男足新海报因酷似韩国太极旗引发轩然大波,设计师意图何在?

大眼瞄世界
2025-11-15 09:52:15
男子56万购入300块和田玉,搁置10年后,急用钱才发现其真实价值

男子56万购入300块和田玉,搁置10年后,急用钱才发现其真实价值

兰姐说故事
2025-11-14 17:15:03
荒野求生风波升级!官媒出手锐评,言辞犀利,句句戳到打工人心坎

荒野求生风波升级!官媒出手锐评,言辞犀利,句句戳到打工人心坎

白浅娱乐聊
2025-11-14 09:52:18
香港结业潮继续,“一毛不拔”的业主终于妥协了!

香港结业潮继续,“一毛不拔”的业主终于妥协了!

港漂圈
2025-11-14 20:21:01
吴石的后人有点意思:明明父亲是烈士,儿子吴韶成在河南格外低调

吴石的后人有点意思:明明父亲是烈士,儿子吴韶成在河南格外低调

小虎新车推荐员
2025-11-14 14:54:30
1.5亿欧元,切尔西拟报价皇马巨星,组巴西超豪华三叉戟!

1.5亿欧元,切尔西拟报价皇马巨星,组巴西超豪华三叉戟!

老籣说体育
2025-11-15 16:22:10
振奋人心!中国海军抵达日本,且是最敏感处

振奋人心!中国海军抵达日本,且是最敏感处

超级学爸蛋总
2025-11-14 20:34:38
2025-11-15 19:40:49
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
126305文章数 861398关注度
往期回顾 全部

科技要闻

撕掉流量外衣,小米还剩什么?

头条要闻

山西"狗咬人被摔死"案狗主家10人进院 喊"弄死你全家"

头条要闻

山西"狗咬人被摔死"案狗主家10人进院 喊"弄死你全家"

体育要闻

樊振东和他的尖子班 勇闯地表最强乒乓球赛

娱乐要闻

钟嘉欣婚变风波升级!被骗婚?

财经要闻

小米之“惑”

汽车要闻

限时10.59万起 新款星海S9将11月19日上市

态度原创

数码
游戏
本地
家居
公开课

数码要闻

10月全球电视ODM工厂出货量榜单出炉 京东方第三

高玩招魂《星鸣特攻》私服成功 宣传片火速被下架

本地新闻

沈阳都市圈“冷资源”点燃“热联动” “组团”北上“圈粉”哈尔滨

家居要闻

现代简逸 寻找生活的光

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版