金磊 发自 重庆
量子位 | 公众号 QbitAI
语出惊人。
竟然有人能想到把芯片比作
![]()
不是空穴来风,这话正是出自英特尔中国区董事长,王稚聪
乍一看上面的对比图,确实是有相似之处,用王稚聪的话解释是这样的:
- 重庆的城市规划与建筑设计堪称空间利用的极致,其复杂布局竟与英特尔18A工艺的芯片剖面图惊人相似——一座微型芯片浓缩了庞大都市的精髓。无论是构建现代城市还是设计微观芯片,规划者都展现出高超的空间构建技艺。
- 火锅套餐就像英特尔的通用处理器产品。如今半导体的重要方向是Chiplet技术——英特尔的新品均采用该技术,将芯片拆分为小颗粒(如计算核心、GPU、I/O等单一功能IP),再统一封装集成,恰似火锅中一道道独立的菜品。
![]()
△英特尔中国区董事长王稚聪
量子位的小伙伴听到这个比喻简直都惊呆了,直呼“天才”
![]()
有点意思,着实有点意思。
而且今年正值英特尔进入中国市场第40年,这次在重庆举办的技术创新与产业生态(Connection)大会中,英特尔也展示出了不少的新意。
英特尔把产业带入埃米时代——18A工艺制程
在PC行业,摩尔定律的每一次喘息都牵动着产业链的神经。
当制程工艺逼近物理极限,当AI大模型开始在笔记本上通过Token这一新单位来衡量性能时,英特尔副总裁高嵩带来了一场关于底层制造工艺与交互范式的彻底重构。
![]()
△英特尔副总裁兼中国区软件工程和客户端产品事业部总经理高嵩
新技术:正式迈入埃米时代
半导体工艺的物理极限正在被打破。
高嵩透露,代号为Panther Lake的下一代AI PC平台已投入量产,这标志着英特尔正式跨入埃米时代(1埃米等于0.1纳米)。
这一跨越的核心支撑来自于两大技术突破:
- RibbonFET全环绕栅极晶体管技术:通过四面包裹的方式控制电流,实现了更精准的开关控制和更低的漏电,解决了晶体管微缩带来的电流控制难题。
- PowerVia背面供电技术:创造性地将供电电路移至晶体管背面,解决了信号与供电抢占空间的“拥堵”问题,大幅降低了电压损耗。
这两项技术的融合(Intel 18A制程),使得芯片在相同功耗下性能提升超过15%,或在相同性能下功耗降低25%以上,晶体管密度提升30%。
新产品:Panther Lake的能效跃迁
基于Intel 18A制程,英特尔将于明年1月CES正式发布Panther Lake。
这款产品被高嵩称为工艺与架构智慧的集大成者。
它融合了Lunar Lake的高能效与Arrow Lake的高性能,实现了多核性能提升50%、图形性能提升50%以上、功耗降低40%的显著数据。
更关键的是,其整体AI算力高达180 TOPS,为端侧大模型的运行奠定了物理基础。
新范式:从AI增强到AI原生
高嵩认为,AI PC正在经历从工具到伙伴的质变。
未来的AI原生PC将具备感知、认知、执行、记忆、学习五大核心能力。
为了实现这一范式转换,英特尔在软件层面进行了深度优化,引入了稀疏注意力(Sparse Attention)、推测解码、KV Cache压缩等技术,大幅提升了端侧智能体的响应速度(Token吞吐率提升2.7倍)和可用性。
新思路:重新定义体验,打造六边形战士
在游戏与高性能本领域,英特尔提出了AI高静游戏本的新概念,不再单纯追求跑分,而是追求性能、温度(C面低于42°)、静音和续航的平衡。
此外,通过XeSS多帧生成技术,英特尔试图证明轻薄本也能流畅运行3A大作(如《黑神话:悟空》)。
这代表了英特尔产品思路的转变:利用AI算法(如APO应用优化器、DTT动态调优)来换取硬件体验的越级。
新机遇:智能边缘的爆发
高嵩敏锐地指出了边缘计算的四个新特点:生成式AI的大规模部署、多模态数据的处理需求、AI与控制的融合(将机器人的“大脑”与“小脑”集成)、以及行业智能体助手的涌现。
在这一领域,英特尔正通过SoC整合方案,帮助视源股份(CVTE)等合作伙伴实现从传统OPS向全方位AI解决方案的转型。
新合作:构建“汇山海”的生态
“独行快,众行远。”
高嵩在演讲的最后,特意强调了中国本土生态的重要性。面对开源与闭源模型能力的快速收敛,英特尔选择了一头扎进中国庞大的模型生态中。
从DeepSeek的深度推理,到通义千问的广博知识,再到ModelBest的小模型优化,英特尔通过底层的指令集优化和量化技术,帮助这些国产模型在端侧安家落户。
一个典型的案例是端侧图像搜索:经过微调的专用重排序模型,其准确率从85%飙升至96%,甚至超越了某些庞大的通用模型。
这种“小模型、大作为”的路径,或许正是AI PC普及的关键钥匙。
英特尔重新看待CPU
如果说端侧的关键词是体验,那么在数据中心领域,英特尔数据中心与人工智能集团副总裁陈葆立面对的则是更宏大的命题——
在万亿级的数据洪流中,如何构建一个既强大又经济的智算底座?
![]()
△英特尔数据中心与人工智能集团副总裁、中国区总经理陈葆立
算力正在转化为电力
陈葆立开场便抛出了一组令人屏息的宏观数据:刚刚过去的双11,中国电商市场背后是1.25万亿的月营业额;各类视频平台每月的播放次数突破10万亿;而全球AI大模型每月产生的Token数量更是超过了一千万亿。
这种指数级的数据增长,正在将算力转化为物理世界的电力。
陈葆立引用预测数据称,未来五年,全球为了支撑AI所产生的电力消耗将增加3.5倍,数据中心累计投资额预计接近7万亿美元。
- 算力甚至已经不能完全用来衡量需求,电力才是。
陈葆立的这一判断,点出了数据中心面临的真正危机:不仅要算得快,更要算得省、算得稳。
CPU要做GPU的神仙队友
在AI大模型训练中,GPU往往占据着聚光灯的中心。在这样的时代背景下,CPU还重要吗?陈葆立用一个生动的比喻给出了答案:
- CPU就是球队里那个神队友。
至强6处理器(Xeon 6)正是为了扮演这个角色而生。陈葆立详细拆解了这位“神队友”的三大特质:
- IO与内存:数据传输是AI训练的瓶颈。至强6率先支持 MRDIMM 内存介质,并大幅提升了PCIe 5.0通道数量。这使得数据能够像精准的快传一样在系统间奔跑。在国内某知名高校的蛋白质结构解析研究中,这种高带宽特性直接加速了科学发现的过程。
- AI加速:并非所有任务都需要GPU。至强6引入了专用的 AMX矩阵加速引擎。在向量搜索(HNSWLib)等关键场景中,相比传统指令集性能提升超过72%。这意味着在推理和数据预处理阶段,CPU可以独立承担重任,大幅降低成本。
- 可靠性:数据中心不能有片刻停歇。英特尔的目标是实现“五个九”(99.999%)的运行可用,并通过TDX技术实现数据的“可用不可见”,守住云端安全的底线。
生态新解法
陈葆立的演讲还重点展示了英特尔与中国合作伙伴的深度协同,这些案例展示了至强6在实际业务中的落地价值:
- 火山引擎(算力与弹性):通过AMX优化,AI模型前置数据处理任务耗时降低90%。火山引擎推出的“弹性预约实例”结合至强6,相比常规按量计费最高节省83%的算力成本,精准解决了AI时代算力昂贵的痛点。
- 中兴通讯(开放解耦):双方打造了正交超节点服务器,支持单机柜最大8192卡扩展,通过正交互联替代线缆,降低了成本并提升了信号质量。
- 华勤技术(工程化突破):面对数吨重、超100KW功耗的AI超节点,双方联合制定了ETH-X超节点整机柜设计规范,解决了从生产制造到液冷散热的一系列工程难题。
- 超聚变(AI Infra):基于英特尔硬件底座,将AI行业落地周期从12个月缩短至“当周发布”,极大地提升了AI在垂直行业的部署效率。
- 立讯(高密度):推出了“上海Q”万卡集群方案,实现了单一机柜128卡的高密度部署。
除此之外,面对未来模型“装不下、来不及、做不到”的焦虑,陈葆立给出了明确的时间表。
除了眼下的至强6,英特尔已宣布将于 2026年 推出采用最新制程工艺的“至强6+”处理器,以及下一代GPU产品。
这显示出英特尔在数据中心领域的长期主义——无论AI风向如何变化,底层的算力基石必须不断加固。
One More Thing
在这次英特尔技术创新与产业生态中,还有一个不小的惊喜——
英特尔CEO陈立武,首次用中文送上了致辞:
![]()
视频地址:https://mp.weixin.qq.com/s/A_KifMXHIex-Bd6GllY05w
有一说一,中文还挺标准的。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.