智能体引爆AI落地潮，英特尔的机会在哪里？|gpu|处理器|cpu|知名企业

智能体引爆AI落地潮，英特尔的机会在哪里？

2026-02-11 21:47:14　来源: 科技行者

北京举报

分享至

作者：金旺

在刚刚过去的上个周末，阿里千问的奶茶免单活动，让不少人第一次亲身体验到了智能体带来的便利，仅需在对话框中向千问下达点奶茶的指令，再根据推荐选项选择奶茶并确认付款，就可以坐等奶茶配送上门。

这种无缝的交互方式，不仅简化了日常消费流程，还展示了智能体如何将AI从抽象概念转化为实际生活中的助手。

这样的智能体，在过去一年里已经不在少数。

从简单的聊天机器人，到如今能够处理复杂任务的自动化代理，智能体正迅速渗透到消费、教育、医疗和企业管理等领域。

据IDC的最新统计数据显示，2025年全球活跃智能体数量约有2860个，预计到2030年，这一数字将会达到22.16亿个，年复合增长率高达139%。这一爆炸性增长得益于生成式AI技术的成熟，以及大语言模型（LLM）的广泛应用。

另一个来自IDC的预测数据是，到2030年，45%的组织将大规模编排AI智能体，将其嵌入到业务职能中，从而重塑决策、运营和竞争力。

这些智能体不再只是简单的聊天机器人，而是从智能助手演进到自动化决策系统、企业级AI代理，而随着智能体的能力不断提升，这些智能消耗的计算资源也已经远超传统应用，尤其是智能体落地应用潮带来的AI推理算力资源消耗，再次提升了对算力资源的需求。

来自KeyBanc调研报告显示，在智算中心带来的强需求下，2026年全球服务器芯片需求年增长在30%-40%，超大云厂商已经提前锁定CPU货源。

面对这样的AI浪潮，英特尔也迎来了它的AI新机遇。

01 主控CPU，需求大爆发

英特尔至强系列处理器在数据中心CPU市场长久以来占据着重要地位，作为英特尔新一代服务器CPU，英特尔至强6处理器不仅继承了x86架构的兼容性和生态优势，还针对AI时代进行了设计优化。

首先，英特尔至强6处理器分为性能核和能效核两种架构，性能核针对广泛工作负载，最高提供高达128个高性能核心，较上一代每路内核数提升2倍，内置AI加速器，支持AVX512和AMX AI加速引擎，新增对FP16精度运算的支持，可以更好地支持AI加速系统的数据预处理。

其次，英特尔至强6处理器家族首次引入了拥有12个内存通道的MRDIMM，这项创新的内存技术可有效提升内存敏感型AI工作负载的带宽和性能，较上一代处理器内存带宽提升了2.3倍，并降低了时延，英特尔至强6处理器每个内存通道支持2条MRDIMM，可提供更大内存容量，这对AI模型和数据集规模都在不断增加的AI系统提供了重要支撑。

可靠性、可用性和可维护性（RAS）的支持是英特尔至强6处理器另一个特性，RAS技术汇聚了平台合作伙伴、ISV、解决方案集成商的丰富专业知识和经验，支持遥测、平台监控、共享资源控制、实时固件更新等多项管理功能，可以减少大规模AI系统停机时间，从而避免高额损失。

在实际应用中，这意味着数据中心运营商可以实现更高的正常运行时间，尤其在处理智能体驱动的实时任务时，避免因故障导致的延迟放大。

正因具有诸如此类特性，在MLPerf全球多个AI加速系统基准测试的结果显示，英特尔至强6处理器已经是AI加速平台的理想主控CPU。

例如，在MLPerf Inference v4.1基准测试中，英特尔至强6能效核处理器在ResNet50、RetinaNet、3DUNet、BERT、DLRM v2、GPT-J模型测试表现，相较于上一代处理器在六项基准测试中平均提供约1.9倍的AI推理效能提升。

这样的AI性能提升，源于英特尔至强6处理器对混合工作负载的优化，在AI生态中，CPU不仅仅是主控角色，也负责预处理、调度和后处理任务，尤其是在智能体场景下，这些往往决定了整体响应时间。

生成式AI工作负载的复杂性不断增加，对性能和能效提出了越来越高的要求，为了在这些工作负载的性能和总体拥有成本（TCO）之间达到理想的平衡点，主控CPU+独立AI加速器来构建AI加速系统成了一个有效策略。

尤其是在智能体落地潮来袭的2026年，由于AI推理对于低延迟、实时响应、混合工作负载的需求居高不下，让兼具通用性和强调度能力的CPU算力需求持续上升，据悉，智能体中CPU处理耗时在总任务延迟中占比达到了80%-90%。

面对AI带来的服务器CPU需求暴增，英特尔官方则表示，英特尔已经在规划优先保障至强处理器交付，以应对这波AI落地浪潮。

02 智能体落地关键年，英特尔的AI布局

2026年，生成式AI的重点已经从训练走向推理、从单点走向Agentic，算力基础设施也不再只是围绕GPU构建，而更需要CPU+GPU+ASIC协同发展。

面对这样的大趋势，英特尔也在加强在AI算力方面的布局，从处理器升级到异构计算的投入，再到整体组织优化，英特尔正在构建一个更全面的AI平台。

首先，基于Intel 18A制程的英特尔至强6+处理器即将问世。

作为英特尔首款基于Intel 18A的服务器CPU，英特尔至强6+处理器相较于上一代处理器，单颗CPU集成了288个能效核、核心数达到了翻倍，在相同功耗下每核性能提升17%，通过3D堆叠技术大幅扩展了三级缓存，缓存容量增长了5倍、内存带宽提升了20%，同时还支持高达8000MT/s的内存速度。

英特尔至强6+处理器在2026年的问世，将进一步提升英特尔在主控CPU上的实力，尤其在云服务提供商和电信领域，将会提供更高的核心密度和性能功耗比。

与此同时，英特尔还加强了在GPU、ASIC上的投入。

据悉，2026年，英特尔的GPU业务在产品迭代上开始加速，Crescent Island、Jaguar Shores将接连发布，降低客户异构选型复杂度。

就ASIC业务而言，据英特尔前不久发布的年报数据显示，英特尔定制ASIC业务在2025年增长超过50%，环比增长26%，并在2025年Q4年化收入超过了10亿美元。

为了确保CPU、GPU及平台战略之间的紧密协同，英特尔在组织架构上也进行了调整，将数据中心与AI业务统一交由Kevork Kechichian管理，并任命Eric Demmers为GPU首席架构师，直接向Kevork Kechichian汇报。

从产业端来看，2026年，在智能体规模化落地产业时，各大云厂商也在加速数据中心新建和扩建工作。

阿里在2025年9月的云栖大会上曾官宣，将在巴西、法国、荷兰首次设立云计算地域节点，并将扩建墨西哥、日本、韩国、马来西亚和迪拜的数据中心；谷歌在2025年11月曾官宣，未来几年将在德国投资超过50亿欧元，用于扩建及新建数据中心；微软在美国威斯康星州的15个数据中心新建计划，也在2026年1月得到批准。

面对这样的AI大潮和数据中心扩建大潮，英特尔正在加强AI算力布局，迎接属于它的新机遇。

从长远来看，英特尔这一套多管齐下的策略，也将帮助英特尔在AI市场中占据一席之地。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.