作者:金旺
在刚刚过去的上个周末,阿里千问的奶茶免单活动,让不少人第一次亲身体验到了智能体带来的便利,仅需在对话框中向千问下达点奶茶的指令,再根据推荐选项选择奶茶并确认付款,就可以坐等奶茶配送上门。
这种无缝的交互方式,不仅简化了日常消费流程,还展示了智能体如何将AI从抽象概念转化为实际生活中的助手。
这样的智能体,在过去一年里已经不在少数。
从简单的聊天机器人,到如今能够处理复杂任务的自动化代理,智能体正迅速渗透到消费、教育、医疗和企业管理等领域。
据IDC的最新统计数据显示,2025年全球活跃智能体数量约有2860个,预计到2030年,这一数字将会达到22.16亿个,年复合增长率高达139%。这一爆炸性增长得益于生成式AI技术的成熟,以及大语言模型(LLM)的广泛应用。
另一个来自IDC的预测数据是,到2030年,45%的组织将大规模编排AI智能体,将其嵌入到业务职能中,从而重塑决策、运营和竞争力。
这些智能体不再只是简单的聊天机器人,而是从智能助手演进到自动化决策系统、企业级AI代理,而随着智能体的能力不断提升,这些智能消耗的计算资源也已经远超传统应用,尤其是智能体落地应用潮带来的AI推理算力资源消耗,再次提升了对算力资源的需求。
来自KeyBanc调研报告显示,在智算中心带来的强需求下,2026年全球服务器芯片需求年增长在30%-40%,超大云厂商已经提前锁定CPU货源。
面对这样的AI浪潮,英特尔也迎来了它的AI新机遇。
![]()
01 主控CPU,需求大爆发
英特尔至强系列处理器在数据中心CPU市场长久以来占据着重要地位,作为英特尔新一代服务器CPU,英特尔至强6处理器不仅继承了x86架构的兼容性和生态优势,还针对AI时代进行了设计优化。
首先,英特尔至强6处理器分为性能核和能效核两种架构,性能核针对广泛工作负载,最高提供高达128个高性能核心,较上一代每路内核数提升2倍,内置AI加速器,支持AVX512和AMX AI加速引擎,新增对FP16精度运算的支持,可以更好地支持AI加速系统的数据预处理。
其次,英特尔至强6处理器家族首次引入了拥有12个内存通道的MRDIMM,这项创新的内存技术可有效提升内存敏感型AI工作负载的带宽和性能,较上一代处理器内存带宽提升了2.3倍,并降低了时延,英特尔至强6处理器每个内存通道支持2条MRDIMM,可提供更大内存容量,这对AI模型和数据集规模都在不断增加的AI系统提供了重要支撑。
![]()
可靠性、可用性和可维护性(RAS)的支持是英特尔至强6处理器另一个特性,RAS技术汇聚了平台合作伙伴、ISV、解决方案集成商的丰富专业知识和经验,支持遥测、平台监控、共享资源控制、实时固件更新等多项管理功能,可以减少大规模AI系统停机时间,从而避免高额损失。
在实际应用中,这意味着数据中心运营商可以实现更高的正常运行时间,尤其在处理智能体驱动的实时任务时,避免因故障导致的延迟放大。
正因具有诸如此类特性,在MLPerf全球多个AI加速系统基准测试的结果显示,英特尔至强6处理器已经是AI加速平台的理想主控CPU。
![]()
例如,在MLPerf Inference v4.1基准测试中,英特尔至强6能效核处理器在ResNet50、RetinaNet、3DUNet、BERT、DLRM v2、GPT-J模型测试表现,相较于上一代处理器在六项基准测试中平均提供约1.9倍的AI推理效能提升。
这样的AI性能提升,源于英特尔至强6处理器对混合工作负载的优化,在AI生态中,CPU不仅仅是主控角色,也负责预处理、调度和后处理任务,尤其是在智能体场景下,这些往往决定了整体响应时间。
生成式AI工作负载的复杂性不断增加,对性能和能效提出了越来越高的要求,为了在这些工作负载的性能和总体拥有成本(TCO)之间达到理想的平衡点,主控CPU+独立AI加速器来构建AI加速系统成了一个有效策略。
尤其是在智能体落地潮来袭的2026年,由于AI推理对于低延迟、实时响应、混合工作负载的需求居高不下,让兼具通用性和强调度能力的CPU算力需求持续上升,据悉,智能体中CPU处理耗时在总任务延迟中占比达到了80%-90%。
面对AI带来的服务器CPU需求暴增,英特尔官方则表示,英特尔已经在规划优先保障至强处理器交付,以应对这波AI落地浪潮。
02 智能体落地关键年,英特尔的AI布局
2026年,生成式AI的重点已经从训练走向推理、从单点走向Agentic,算力基础设施也不再只是围绕GPU构建,而更需要CPU+GPU+ASIC协同发展。
面对这样的大趋势,英特尔也在加强在AI算力方面的布局,从处理器升级到异构计算的投入,再到整体组织优化,英特尔正在构建一个更全面的AI平台。
首先,基于Intel 18A制程的英特尔至强6+处理器即将问世。
作为英特尔首款基于Intel 18A的服务器CPU,英特尔至强6+处理器相较于上一代处理器,单颗CPU集成了288个能效核、核心数达到了翻倍,在相同功耗下每核性能提升17%,通过3D堆叠技术大幅扩展了三级缓存,缓存容量增长了5倍、内存带宽提升了20%,同时还支持高达8000MT/s的内存速度。
![]()
英特尔至强6+处理器在2026年的问世,将进一步提升英特尔在主控CPU上的实力,尤其在云服务提供商和电信领域,将会提供更高的核心密度和性能功耗比。
与此同时,英特尔还加强了在GPU、ASIC上的投入。
据悉,2026年,英特尔的GPU业务在产品迭代上开始加速,Crescent Island、Jaguar Shores将接连发布,降低客户异构选型复杂度。
就ASIC业务而言,据英特尔前不久发布的年报数据显示,英特尔定制ASIC业务在2025年增长超过50%,环比增长26%,并在2025年Q4年化收入超过了10亿美元。
为了确保CPU、GPU及平台战略之间的紧密协同,英特尔在组织架构上也进行了调整,将数据中心与AI业务统一交由Kevork Kechichian管理,并任命Eric Demmers为GPU首席架构师,直接向Kevork Kechichian汇报。
从产业端来看,2026年,在智能体规模化落地产业时,各大云厂商也在加速数据中心新建和扩建工作。
阿里在2025年9月的云栖大会上曾官宣,将在巴西、法国、荷兰首次设立云计算地域节点,并将扩建墨西哥、日本、韩国、马来西亚和迪拜的数据中心;谷歌在2025年11月曾官宣,未来几年将在德国投资超过50亿欧元,用于扩建及新建数据中心;微软在美国威斯康星州的15个数据中心新建计划,也在2026年1月得到批准。
面对这样的AI大潮和数据中心扩建大潮,英特尔正在加强AI算力布局,迎接属于它的新机遇。
从长远来看,英特尔这一套多管齐下的策略,也将帮助英特尔在AI市场中占据一席之地。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.