网易首页 > 网易号 > 正文 申请入驻

AI时代的分野与合流:什么才是算力选型的“版本答案”?

0
分享至


作者 | Potatooo

当 AI 大模型从实验室冲向产业一线,企业的算力需求正经历一场前所未有的“撕裂式分化”:一边是 3A 游戏、AI 渲染等场景对极致性能的“军备竞赛”,一边是 Web 服务、视频转码等高频场景对性价比与能效比的“精打细算”,电力成本的飙升与数据安全的红线,更让这场算力抉择变成“既要又要还要”的多重考验。

过去“一套拳法打天下”的时代早已落幕,当行业还在为“性能优先”还是“成本优先”争论不休时,英特尔与腾讯云的联合实践给出了不一样的答案。在最新一期《C 位面对面》栏目中,InfoQ 极客传媒创始人 &CEO 霍太稳和英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立、腾讯云 CVM 产品副总经理李德铠的深度对话,揭开了算力“分野与合流”的核心逻辑——以芯片双架构为底层支撑,以分层云实例为落地载体,让高性能与普惠性不再对立,让软硬件协同成为破解行业痛点的关键钥匙。

算力分化时代的三重困局

数字化与智能化的加速,让企业算力需求的分化从隐性走向显性,而 AI 技术的爆发则让这种分化演变成不可调和的多重矛盾,倒逼行业从“大一统”走向“精细化”。

性能与能效的对立统一

“AI 算力的尽头其实是电力”,李德铠的这句话点破了行业核心困境。随着大模型参数指数级增长,电力成本在算力总支出中的占比已攀升至极高水平,单纯追求极致性能的算力配置,往往会陷入“高能耗、高成本”的恶性循环。但另一方面,GenAI、游戏等场景,又对算力的主频、内存带宽和并行计算能力提出了苛刻要求,性能短板直接影响用户体验。

这种矛盾催生了算力需求的分层:一部分场景需要“火力全开”,另一部分场景则需要“精打细算”。陈葆立补充道:“这种分化不是短期现象,而是 AI 时代的长期趋势。”

安全与生态的刚性需求

除了性能与成本,数据安全与生态适配也成为企业算力选型的“必选项”。随着数据资产价值的提升,企业对数据存储、传输、计算全流程的安全要求越来越高,而算力解决方案能否与现有生态无缝对接,直接影响部署效率与迁移成本。陈葆立强调:“企业需要的不仅是算力本身,更要构建完整的安全防护体系和生态支持。”

通用与专用的场景分化

过往企业依赖一套通用架构解决所有问题的模式,在 AI 时代也彻底失效。不同业务场景的算力诉求呈现出显著差异:3A 游戏需要单核高主频保障操作无延迟,视频转码需要高并发处理能力降低成本,AI 推理需要矩阵运算加速提升效率,Web 服务需要稳定性能避免抖动。

场景的细分要求算力供给必须“精准匹配”,而非“大水漫灌”。腾讯云与英特尔的合作,正是抓住了这一核心趋势,推出针对性的产品组合,让不同场景都能找到“量身定制”的算力解决方案。

双轨破局:从芯片到云实例的协同革命

面对算力撕裂的三重困局,英特尔与腾讯云的联合创新并非简单的产品叠加,而是从芯片架构到云实例、从硬件优化到软件协同的全链路重构,构建起“性能 + 普惠”的双轨算力体系。

实际上,英特尔在最新的至强®6 处理器中推出双架构设计,便是应对算力需求分化的破题关键。“一个是性能核 P-core,另一个是能效核 E-core,我们希望通过两种不同的处理器架构,提供不同的算力服务于客户。”陈葆立介绍道。

其中,性能核 P-core 主打极致性能,具备高主频、大缓存、高内存带宽等特性,完美适配 AI 训练、高性能计算等核心场景;能效核 E-core 则聚焦高内核密度与更优每瓦性能,通过精简设计,在保证性能的同时降低功耗,特别适合云原生、高并发等普惠型场景。

基于英特尔至强®6 的双架构,腾讯云打造了 S9E、S9Pro、S9 三款分层实例:其中 S9E 与 S9Pro 主打极致性能,搭载至强®6 P-core,专为 AI、游戏、图像渲染等高性能场景而生;S9 实例则是全球首发搭载至强®6 E-core 的 SRF-AP 云实例,主打高性价比与高并发适配。

高性能场景:CPU 与 GPU 如何“1+1>2”?

在 RAG(检索增强生成)等高性能场景中,行业曾普遍认为 GPU 能包揽所有核心任务,CPU 并无用武之地,但基于英特尔至强®6 P-core 的 S9E/S9Pro 用实践打破了这一认知。

“进入大模型时代,GPU 和 CPU 有各自的优势——GPU 算力强,CPU 内存大。如果以篮球队为例,CPU 就像控球后卫,既可以传球给 GPU 前锋,也能自己得分。”陈葆立表示。

一方面,作为“控球后卫”,CPU 能帮助 GPU 更好的释放性能。陈葆立表示:“大模型就像记忆力不好的天才,无法在 GPU 中存储大量用户上下文。但是如果通过 CPU 与系统内存的协同,就能最大化发挥 GPU 的能力。”

例如,在 RAG 场景中,借助 CacheClip 技术,能够有效提升 KVCache 的利用率,从而支持更长的上下文窗口并提高执行效率;另外,通过英特尔推出的异构计算框架 HeteroFlow,能够将 MoE 模型中的“冷专家”模块直接卸载至 CPU 处理(卸载、调度、加速三管齐下),让 GPU 的工作更聚焦,从而突破显存瓶颈,为用户带来更高的整体性能。

“许多客户在 TTS、ASR、OCR 等预处理任务上的日常支出,甚至达到后续大模型推理费用的数十倍。这些 AI 工作的前置准备阶段,以前常常要 GPU 分心兼顾。AI 工作负载里的非结构化数据解析、格式转换、特征清洗,看着是‘细活’,实则要高并行逻辑和高 I/O 吞吐,正好是机头 CPU 的强项。更重要的是:数据预处理通常具有流程复杂、数据量巨大、需弹性扩展、实时性要求低但吞吐量极高等特点。而这些需求,恰恰与至强®6 的架构优势高度契合。CPU 把预处理扛了,GPU 就不用在训练推理这样的核心任务和预处理这种边缘任务之间来回切换,算力与时间一点儿都不浪费。”陈葆立解释道。

“这种 1+1>2 的组合拳,不仅帮客户解决了 GPU 资源紧张的燃眉之急,更通过更优的部署成本和更低的系统延迟,实现了全链路的性能提升。”李德铠补充道。

另一方面,CPU 本身也能在 AI 场景“上大分”。英特尔至强®6 P-core 集成了 AMX 加速引擎,专为大规模 AI 训练和推理工作负载提供支持,能够助力客户提高效率,降低推理、训练和部署成本以及降低总拥有成本 (TCO)。值得一提的是,由于 AMX 是直接集成在 CPU 内核上且靠近系统内存的内置加速器,相比于独立加速器,它能提供更便捷、更快速的加速支持。

“利用 AMX 矩阵加速能力,S9e/S9pro 可以非常高效地处理 Embedding(向量嵌入)、数据清洗和中小型模型的推理任务。”李德铠举例称。腾讯云实测数据显示,在千问 4B 小模型的 Embedding 场景中,搭载英特尔至强®6 P-core 的 S9E/S9Pro 相比 T4 GPU 卡,性能提升了 25%,综合性价比直接提升了 66%。

当然,在游戏对战服、AI 渲染和图像处理等传统高性能场景中,S9E/S9Pro 凭借着高主频和高内存带宽等特性,也成为了“客户的优选”。“玩家 PK 时的实时响应至关重要,S9E/S9Pro 能保障数据传输的高带宽和低延迟,让操作指令即时生效不卡顿。”李德铠介绍道,“此外,在 AI 渲染和图像处理场景中,S9E/S9Pro 的多线程核与高内存带宽,也能帮助客户企业快速处理海量数据,大幅提升渲染效率,缩短项目周期。”

普惠场景:如何实现“性能无抖动、满载不降频”?

“普惠不代表性能不行,搭载至强®6 E-core 的 S9 相比上一代实例性能提升了 15%-20%,能稳定支撑 Web 服务、小程序等轻负载场景的高并发需求。”李德铠强调。

“性能无抖动、满载不降频”的背后是英特尔与腾讯云在设计细节上的不妥协。

“我们首先肯定不希望普惠版的云实例在性能上缩水。”陈葆立表示。硬件层面,英特尔在 E-core 中关闭了超线程功能,让每个虚拟机拥有独立的物理核、显存和内存,避免用户间的性能干扰,保障性能稳定无抖动。“另外,能效核(E-core)顾名思义它的能效比是非常好的,也就是在性能更优的同时功耗更低,这也符合国家倡导的节能减碳以及绿色数据中心等理念。”

软件与优化层面,腾讯云也做了非常多用户“看不见”的工作。其中最关键的就是“绑核设计”——将 CPU 核心与虚拟机绑定,确保单个虚拟机高负载运行时,不影响整片 CPU 的性能表现;同时优化了 CPU 与总线、内存的搭配关系,进而缩短了数据传输路径,提升了计算效率。“‘绑核设计’对于计算密集型任务的提升非常明显。”李德铠补充道。

这种软硬件协同的优化,让 S9 在教育行业大受欢迎。教育机构的录播视频课程通常需要转码为不同码率,以适配不同网络环境,S9 实例搭配英特尔软件库后,转码性能获得了 90% 以上的提升,在降低成本的同时,保障了课程传输的流畅性。

“S9 的高并发适配能力,也使其在 Web 服务和小程序场景中备受青睐。很多客户反馈,S9 能稳定支撑高峰期的并发请求,且成本比传统实例更低。”李德铠补充道。

此外,基于英特尔至强®6 E-core 的 S9 云实例,在腾讯内部的超大规模业务中,也得到了普遍验证。

以微信存储为例,不仅通过高 I/O 实例配置的使能以及软件优化,高效解决了 Gen5 SSD 高吞吐性能所带来的存储压力,还通过英特尔 QAT(数据保护与压缩)加速器,使得存储压缩效率提升了 70%,真正实现了“用更少空间存更多数据”。

在搜索业务领域,腾讯新一代海量搜索引擎借助 SRFAP 平台能力,使得元宝的搜索性能提升了 15%。另外,在大数据业务中,S9 实例的多核并行能力与扩展性,也帮助腾讯实现了显著的降本增效。

产品成功的背后,是双方更深层次的战略共识。

“我们双方的合作已经超越了简单的买卖关系,上升到了联合定义产品的高度。腾讯的宗旨是一切以用户价值为依归,英特尔则以客户场景为核心,双方的价值观高度契合。我们不会盲目追求单纯的技术参数,而是先去听市场和用户的声音,再回过头来定义产品。”李德铠表示。

这种契合体现在合作的全流程:从芯片设计阶段,英特尔就与腾讯云紧密沟通,了解最终用户的实际需求,定制化设计芯片;在产品定义阶段,双方共同规划了三款实例的定位,确保硬件架构与场景需求精准对接;在技术优化阶段,双方专家联合研发,充分发挥 AMX、QAT 等指令集的优势,将好钢用在刀刃上,真正让技术红利转化为客户价值。

AI Agent 引爆的算力“新战场”

谈及未来,李德铠表示:“AI 的技术热潮已经从模型向 Agent(智能体)演进,这将带来算力需求的新变化。”

在 AI 发展的早期,算力资源几乎全部向“模型训练”倾斜,但随着 AI Agent 时代的到来,这种天平正在发生逆转——从“重训练”转向“重推理”。“据专家预测,未来推理算力的需求将达到现在训练算力的 10 倍。”陈葆立指出。如果说训练主要是 GPU 的“大力出奇迹”,那么 Agent 架构中的各种推理需求则让 CPU 的角色将变得空前重要。

“Agent 的本质是‘大脑 + 工具’。GPU 负责思考,而 CPU 负责执行(比如运行 Python 代码、查询数据库、读写文件、网络通信等),每一步推理后,CPU 都要介入处理非线性逻辑,这会导致 CPU 的负载大幅增加。腾讯云第九代云实例及至强®6 平台的设计,正是致力于通过更高性能、更优能效的通用算力,帮助客户应对推理与 Agent 负载带来的计算密度挑战。”李德铠表示。

同时,“算力即财富”的 AI 时代也对系统的稳定性、可靠性提出了更高的要求。随着 AI 集群正加速向万卡规模突破,系统越复杂,计算密度越高,就越可能出现更多的静默数据错误。

陈葆立指出,至强®6 具备 99.999% 的 RAS(可靠性、可用性、可维护性),能够全面保障整体系统的稳定运行;同时其内置的 TDX 技术,能够为云服务提供硬件级可信执行环节,有效支持通用机密计算和异构机密计算,助力构建端到端的可信 AI 服务能力。

“TDX 技术,帮助我们在云上打造了一个‘数据保险箱’,企业可以无缝地把它的 AI 模型、Agent 应用部署到 S9 系列实例上,来确保模型与数据的安全。”李德铠补充道。

此外,AI 应用的大爆发也将进一步催生数据海量吞吐的需求,对内存、SSD 等部件厂商提出了更高的要求,也对生态适配提出了新挑战。“英特尔作为平台方,一直以来保持着‘生态联盟’的方式,跟伙伴厂商保持密切互动、相互验证,以确保整个平台生态的高质量、高安全、高可用。”陈葆立表示。

据介绍,英特尔最新的 18A 制程工艺已进入量产阶段,性能提升可达 15%,密度提升 30%。基于 18A 制程的至强®6 Plus 处理器(Clearwater Forest)将于 2026 年内发布,目前英特尔已经与部件厂商、腾讯云等合作伙伴展开了早期的适配与验证工作。

“下一步,随着英特尔 18A 等革命性制程工艺的推进,我们也会在第一时间推出结合下一代芯片性能的云实例。同时,我们正在紧锣密鼓地研发适配 vRDMA 网络的新一代 CVM 机型,这将进一步释放底层硬件的传输潜力。此外,在加密计算、可信计算等对安全性要求极高的垂类场景,我们也会持续演进,利用最新的指令集优势,为企业数字化转型和 AI 应用的全面落地提供一个更高效、更安全、更具性价比的底座。”李德铠表示。

结 语

算力的分野与合流,本质上是 AI 产业从“技术狂欢”走向“价值落地”的必然。当狂热褪去,企业终将回归理性:算力的核心竞争力,从来不是参数的堆砌,而是对场景需求的精准响应与资源的最优配置。

英特尔与腾讯云的双轨实践,撕开了行业“非黑即白”的选型困局:性能核与能效核的二元架构,消除了“杀鸡用牛刀”的尴尬;CPU 与 GPU 的异构协同,打破了“谁主谁次”的偏见;分层实例的场景适配,终结了“一套方案包打天下”的粗放。这不是简单的产品组合,而是对算力分配逻辑的底层重构,让每一份算力投入都能匹配对应的业务价值,让技术创新真正服务于成本与效率的平衡。

AI Agent 时代的到来,将会让这种精准匹配的需求愈发迫切。推理算力的爆发式增长、多模态场景的复杂诉求,会进一步放大“按需分配”的重要性。而英特尔与腾讯云的合作,早已提前卡位这一趋势:从芯片到实例,从硬件到软件,构建起了一套“场景定义技术”的完整闭环。

AI 时代的算力革命,终将是一场“以场景为锚、以协同为纲”的效率革命,谁能更深刻地洞察不同业务的算力痛点,谁能更高效地整合软硬件资源形成精准解决方案,谁就能掌握 AI 落地的核心话语权。那些真正能够破解“既要又要还要”困局的玩家,才能成为最终的规则制定者。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
河南矿山内幕揭晓,官媒发声警示“造神”迷局背后的真相

河南矿山内幕揭晓,官媒发声警示“造神”迷局背后的真相

小怪吃美食
2026-02-06 06:36:49
北京某公证处银行存款惊现巨额差异,1.8亿缩水至44万!

北京某公证处银行存款惊现巨额差异,1.8亿缩水至44万!

特约前排观众
2026-02-07 00:10:05
刺激夜:本泽马首秀戴帽,尤文0-3出局,马竞5-0晋级,摩纳哥1-3出局

刺激夜:本泽马首秀戴帽,尤文0-3出局,马竞5-0晋级,摩纳哥1-3出局

侧身凌空斩
2026-02-06 06:39:27
从“论斤买”升级为“论箱买”,车厘子大降价!有网友称品质普遍不佳且口感发苦,专家:前期压货致不新鲜

从“论斤买”升级为“论箱买”,车厘子大降价!有网友称品质普遍不佳且口感发苦,专家:前期压货致不新鲜

每日经济新闻
2026-02-06 12:27:35
马英九:大陆武统,我不接受。赖清德:如果统一,我们会拼命保护

马英九:大陆武统,我不接受。赖清德:如果统一,我们会拼命保护

南权先生
2026-01-21 15:45:43
立陶宛承认开设台湾代表处是错误,外交部:同立方沟通大门始终敞开

立陶宛承认开设台湾代表处是错误,外交部:同立方沟通大门始终敞开

澎湃新闻
2026-02-06 15:45:08
《夜色正浓》37岁男配太抢镜,佟大为黯然失色

《夜色正浓》37岁男配太抢镜,佟大为黯然失色

深层奥秘
2026-02-06 21:05:46
原来李莉就是孙涛的老婆,难怪孙涛能成“春晚钉子户”,每年都上

原来李莉就是孙涛的老婆,难怪孙涛能成“春晚钉子户”,每年都上

孤城落日
2026-01-30 22:01:27
马未都:香港宁愿要20万菲佣,也不接受内地保姆,原因很简单

马未都:香港宁愿要20万菲佣,也不接受内地保姆,原因很简单

犀利辣椒
2025-12-27 06:42:38
陪读妈妈半夜录视频引发争议,清凉装扮引发热议。

陪读妈妈半夜录视频引发争议,清凉装扮引发热议。

特约前排观众
2026-01-29 00:15:03
79岁李保田老态难辨,生活简朴,与儿子关系紧张

79岁李保田老态难辨,生活简朴,与儿子关系紧张

带你领略快乐真谛
2026-02-07 02:34:44
放着便宜俄油不买?印度信实据悉已进口200万桶委内瑞拉石油

放着便宜俄油不买?印度信实据悉已进口200万桶委内瑞拉石油

财联社
2026-02-06 14:52:15
原来黑龙江人口流失与七大政策有关?就是这样被掏空的…

原来黑龙江人口流失与七大政策有关?就是这样被掏空的…

慧翔百科
2026-02-06 09:04:03
山东89-88淘汰浙江3喜1忧!鲍威尔+陈林坚打出价值,珀赛尔好状态

山东89-88淘汰浙江3喜1忧!鲍威尔+陈林坚打出价值,珀赛尔好状态

篮球资讯达人
2026-02-06 18:00:56
郑丽文真是一个狠人!竟公开承认自己身世之谜!宋楚瑜题字火出圈

郑丽文真是一个狠人!竟公开承认自己身世之谜!宋楚瑜题字火出圈

素衣读史
2026-02-03 11:49:44
闹大了!四川华西医院神经外科王伟教授收礼,全网都在传

闹大了!四川华西医院神经外科王伟教授收礼,全网都在传

云中浮生
2026-02-06 21:43:21
郭士强没想到,临近年关,爱徒赵睿竟闯了个“大祸”,姚明没说错

郭士强没想到,临近年关,爱徒赵睿竟闯了个“大祸”,姚明没说错

生命之泉的奥秘
2026-02-07 01:54:22
俱乐部力挺,球迷举牌支持,队友进球致敬,C罗罢赛另有隐情?

俱乐部力挺,球迷举牌支持,队友进球致敬,C罗罢赛另有隐情?

夏侯看英超
2026-02-07 04:21:40
超雄真的有那么可怕吗?网友的分享,一看一个不吱声

超雄真的有那么可怕吗?网友的分享,一看一个不吱声

另子维爱读史
2026-02-01 20:30:29
普京“五大心腹”陆续交权隐退,“后普京时代”或将提前到来

普京“五大心腹”陆续交权隐退,“后普京时代”或将提前到来

乐享人生风雨
2026-02-06 17:19:35
2026-02-07 04:52:49
InfoQ incentive-icons
InfoQ
有内容的技术社区媒体
12034文章数 51737关注度
往期回顾 全部

科技要闻

独角兽版图巨变:SpaceX奔万亿 中美差在哪

头条要闻

电动车行业"老三"冲刺上市 分股东2亿克扣员工社保3亿

头条要闻

电动车行业"老三"冲刺上市 分股东2亿克扣员工社保3亿

体育要闻

西甲射手榜第2,身价不到姆巴佩1/40

娱乐要闻

微博之夜抢C风波 杨幂工作室9字讨说法

财经要闻

爱尔眼科董事长旗下7家精神病院骗保

汽车要闻

宝马"本命年"关键词:20款新车与"新世代"耐力赛

态度原创

旅游
艺术
时尚
数码
本地

旅游要闻

琅琊古城·“文旅迎春 马跃新程”2026河东文旅新春联欢晚会举行

艺术要闻

这颜色太美,不看太可惜!

豆瓣8.5分,人美剧甜衣品好,小韩拍恋爱剧还是有两把刷子

数码要闻

零刻SER10 Max迷你主机上市:AI 9 HX 470,0+0款4499元

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

无障碍浏览 进入关怀版