回望2025年,AI大模型竞赛进入深水区。一个关键的行业共识正在形成:AI不再只是风口,更是发展引擎。
根据国际市场研究机构Omdia最新数据,阿里云在中国云市场的份额已连续三个季度攀升,稳居中国市场第一地位。Omdia指出,AI正日益成为核心云基础设施服务新增需求的主要驱动力。
![]()
从33%到34%再到36%,阿里云在激烈的云市场竞争中,走出了“强者恒强”的上升曲线,打破了当前“云市场饱和”的论调。那么今天我们来聊聊,阿里云是如何做到的呢?
一、全栈能力,AI时代的"技术主权"
要理解阿里云的能力,需要先看清当前AI产业的分化格局。
目前,市场上有两类AI玩家:一类是专注模型层的AI公司,手握算法但缺乏算力底座;另一类是传统的云服务商,提供算力租赁却不懂模型优化。这种割裂带来的直接后果是效率损耗——当企业试图将大模型投入生产环境时,往往发现模型推理成本居高不下、响应延迟难以满足业务需求,最终只能停留在POC(概念验证)阶段。
![]()
从底层芯片、澎湃算力到核心模型、上层应用,"全栈AI技术能力"可避免这种割裂。2025年2月,阿里巴巴集团CEO吴泳铭宣布,未来三年,阿里将投入超过3800亿元,用于建设云和AI硬件基础设施,总额超过去十年总和。9月的2025云栖大会上,吴泳铭在演讲中提到,阿里云正全力打造成为全栈人工智能服务商。
截至目前,阿里云的超大规模数据中心遍布全球,在全球 29个地理区域内运营着94个可用区,布局3200多个边缘计算节点。未来还有更多。
这种全栈AI能力的价值,在阿里大模型等产品中也得到了很好的体现。作为阿里最新一代推理模型,Qwen3-Max-Thinking在多个关键维度上实现了显著提升,包括事实知识、复杂推理、指令遵循、人类偏好对齐以及智能体能力。在关键的模型推理能力提升中,千问新模型采用了一种全新的测试时扩展(Test-time Scaling)机制,推理性能提升的同时还更经济。
同样值得关注的还有Qwen-Image-2.0在多模态生成领域的突破。Qwen-Image-2.0在Qwen-Image和Qwen-Image-Edit两大模型基础上全新升级,首次将图像生成和编辑统一到一个模型中去,以更轻量的模型架构,实现了生图和改图性能的大幅提升。
二、技术反哺,模型能力重塑阿里云基础设施
很多人常说,云厂商做大模型只是为了"蹭热点"。但在阿里云的技术演进路径中,我们看到了相反的逻辑:顶尖模型的研发需求,正在反向驱动阿里云基础设施的代际升级。
这种"反哺效应"体现在多个方面。
在计算架构方面,传统的CPU中心架构已无法满足需求。为满足AI时代需求,新一代磐久超节点服务器由阿里云自主研发设计,具备高密度、高性能和高可用的核心优势,可高效支持多种AI芯片,单柜支持128个AI计算芯片,密度刷新业界纪录。目前阿里云已经基于自研芯片和深度优化的软件栈,为企业客户提供更具成本效益的替代方案。
![]()
在存储方面,阿里云分布式存储面向AI需求全面升级。高性能并行文件存储CPFS单客户端吞吐提升至40GB/s,可满足AI训练对快速读取数据的极致需求;表格存储Tablestore为Agent提供高性能记忆库和知识库;对象存储OSS推出 Vector Bucket,为向量数据提供高性价比的海量存储,相比自建开源向量数据库,成本骤降95%,结合OSS MetaQuery 语义检索和内容感知能力,可快速构建RAG等AI应用。
在AI智算集群层面,智能计算灵骏集群通过多级亲和性与拓扑感知调度设计,基于HPN 网络支持10万卡稳定互联,多级可扩展的架构让每张卡间互联路径更短、带宽更优。灵骏集群面向任务的稳定性设计、故障分钟级恢复能力,有效提高了模型训练任务的集群稳定性。
最后是安全体系的进化。企业级AI应用对数据隐私和模型安全的要求远超消费级场景。阿里云在支撑内部电商、金融等高敏感业务的过程中,构建起了覆盖芯片可信执行环境、模型权重加密、推理过程隔离的全链路安全体系。这种经过大规模生产验证的安全能力,是当前市场上大多数独立AI公司难以提供的。
吴泳铭曾表示:“阿里云正在全力打造一台全新的AI超级计算机,它同时拥有最领先的AI基础设施和最领先的模型,两者可以在产品设计和运行架构上高度协同,从而确保在阿里云上调用和训练通义千问模型时,能达到最高效率。”相信这种技术反哺,最终必将让阿里云达到“1+1>2”的效果。
三、“全栈AI技术能力”让阿里云成为客户首选
回到市场竞争的现实维度,企业客户在选择AI云服务商时,决策逻辑正在发生根本性转变。
早期的上云决策主要考虑成本因素——哪家便宜选哪家。但在AI时代,决策权重向"技术可行性"倾斜:你的云服务商是否具备将大模型真正跑起来的工程能力?能否在业务高峰期保障推理服务的稳定性?当模型需要微调时,是否提供从数据标注到训练部署的一站式工具链?
![]()
这些问题的答案,很大程度上取决于云厂商的全栈AI技术能力深度。Omdia指出,AI日益成为核心云基础设施服务新增需求的主要驱动力,并带动计算、存储及数据库等资源消耗增长。AI业务正成为阿里云业务增长的强力引擎,根据阿里巴巴财报,阿里云AI相关产品收入已连续九个季度实现三位数同比增长,这也是阿里云市场份额连续三个季度上涨的根本原因。
在AI时代,算力资源和模型能力越强的厂商,虹吸效应越明显。全球来看,谷歌也是类似发展路径,最新数据显示,谷歌云业务成为Alphabet四季度业绩最大的亮点,当季业务收入同比暴增48%至177亿美元,这一增长主要由企业AI基础设施、企业AI解决方案以及核心谷歌云平台产品需求激增驱动。
结语:
如今,36%的市场份额只是一个结果指标,真正的行业分水岭在于,当AI从实验室走向生产线,只有全栈技术能力才能支撑起企业级的可靠性、安全性和经济性要求。
对于正在规划AI战略的企业决策者而言,选择云服务商本质上是在选择技术合作伙伴。在"懂芯片、懂服务器、懂网络、懂云、懂大模型"这五个维度上,阿里云还有更多想象力。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.