
![]()
“并行算网已接入62个算力中心,已累计输出超200亿核时、近2亿卡时。”
作者丨刘伊伦
编辑丨包永刚
2025年12月12-13日,第八届GAIR全球人工智能与机器人大会在深圳·博林天瑞喜来登酒店正式启幕。
作为AI 产学研投界的标杆盛会,GAIR自2016年创办以来,始终坚守“传承+创新”内核,始终致力于连接技术前沿与产业实践。
在人工智能逐步成为国家竞争核心变量的当下,算力正以前所未有的速度重塑技术路径与产业结构。13日举办的「AI 算力新十年」专场聚焦智能体系的底层核心——算力,从架构演进、生态构建到产业化落地展开系统讨论,试图为未来十年的中国AI产业,厘清关键变量与发展方向。
并行科技副总裁、AI联合创始人赵鸿冰在「AI 算力新十年」论坛发表了主题为《基于用户视角的算力服务及算网服务》的演讲。
历经18年超算领域深耕,并行科技见证并参与了中国算力市场的演进。当前,算力市场呈现多场景、多业态的爆发式增长,从尖端超算到智算形态,从算力租赁到算力网络,行业生态日趋多元;与此同时,大模型技术的快速迭代,也对算力的可用性、高效性与性价比提出了更高要求。
在这样的背景下,从用户视角构建算力服务体系、通过算力网络实现资源的高效整合与调度,以及应对推理需求爆发带来的产业变革,成为算力行业亟待解决的核心问题。
赵鸿冰在演讲中指出,当前算力市场已形成四大核心业态:算力租赁作为最基础的形态,以“裸金属”算力资源长期交付用户且不参与后续应用;算力服务聚焦用户终端需求的“最后一公里”,核心是按需提供精准适配业务场景的算力支持;算力运营则依靠复杂调度平台统筹管理资源,实现算力的高效分配与运营;而算力网络作为更高维度的形态,通过纳管多个算力平台形成广泛覆盖的网络,达成跨平台整体调度。
为此,并行科技推出“厂网结合”模式:“厂”即公司投入大量资金建设的万卡集群等重资产布局,“网”则是通过轻资产扩张连接国内47个智算中心与15个超算中心,该算力网络可调度200万CPU核心、5万多张GPU卡,服务超16万用户,商业化输出累计超200亿核时、近2亿卡时。
在算力资源适配方面,他强调“没有绝对最优的算力资源,只有最适配的选择”:例如在B200集群实测中发现,虽B200性能领先,但针对某具身智能客户需求,H200性价比更优。
基于18年行业经验与数据积累,并行科技构建的算力性能预测模型,在小规模场景下预测误差可控制在2%以内,中大规模场景下误差也仅为个位数,能有效支撑用户资源选型决策。在大规模推理场景中,消费级显卡5090作为“性价比之王”,成为多数客户的首选。(作者长期关注算力与芯片产业,欢迎添加微信YONGGANLL6662交流更多信息。)
这些思考与经验,均来自并行科技服务16万用户的真实市场沉淀,其打造的算力网络已实现全国范围内的资源调度与商业化输出,希望能为算力行业的发展提供可借鉴的思路。
演讲结束后,雷峰网与赵鸿冰就演讲中提及的“算力网络”、“推理需求”等关键议题,进行了更深入的探讨。以下是雷峰网在不改原意的基础上,根据对话过程做的整理与编辑:
01
对话环节
雷峰网:您提到算力规模年复合增长率达到52.3%,当前市场已投入大量资本用于AI基建,为何算力规模仍能保持高速增长,背后的主要推动力是什么?如何看待市场讨论的“算力泡沫”这一说法?
赵鸿冰:人工智能是全球竞争的制高点,将成为未来数年乃至数十年发展的核心驱动力。一场革命性的产业变革,需要足够的时间与周期来完成生产力和生产关系的重构,这个过程并不会一蹴而就。当前市场对 “算力泡沫” 的质疑,核心在于AI投入尚未形成大面积的商业闭环。但从产业发展规律来看,每一次重大技术革命都需要经历投入期、探索期才能进入收获期,算力是否为泡沫,时间会给出最终答案。
另一方面,在当前的全球竞争格局下,头部科技企业普遍对AI赛道抱有FOMO情绪。相较于因过度谨慎、投入滞后而错失行业发展窗口期的代价,适度超前的算力基建投入可能获得更可期的未来。
雷峰网:您在演讲中提到算力网络,并行算网对接入的算力资源有什么要求?算网本质是资源整合工作,势必会面临诸多利益分配问题,这些问题如何解决?
赵鸿冰:并行科技已经打造了一套成熟的算力资源接入标准体系。我们会根据资源的规模类型、调度能力、完善程度等多个维度,对拟接入的算力资源进行分级定义,这套标准就像“插销与插座”的匹配规则,能够实现算力资源的快速接入与网络化输出。资源接入周期没有固定标准,若资源本身完全符合标准,可直接接入;若需要改造,并行科技会协助完成标准适配,整体周期通常较短。
关于利益分配,并行科技的商业模式早已定义清晰,核心是以价值分层驱动利益分配。整个算力服务产业链可以拆解为多个价值环节:最前端是面向最终用户的市场推广、销售对接与方案设计,这需要铁三角组织中的销售负责人、方案负责人共同完成,解决客户的商务与技术需求;往下是产品平台层,需要具备账号开通、算力调度、计量计费、报告输出等核心能力,这是算网运营的核心支撑;再往下是售后服务层,我们建立了7×24小时5分钟响应的保障体系,常规问题由一线工程师解决,疑难问题由二线、三线工程师分层处理,确保客户业务稳定运行;最底层则是服务器重资产投资与IDC托管的价值。
在算网合作中,我们会根据合作伙伴的优势,匹配对应的价值环节。比如有的合作伙伴拥有IDC和服务器资源,就可以获取底层两部分价值;若合作伙伴同时具备前端销售推广能力,就可以分得前端与底层价值,并行科技则主要获取平台调度与售后服务的价值。整个价值分配逻辑清晰,能够保障各方的合理收益。
雷峰网:异构算力(CPU/GPU/DCU 混合部署)虚拟化过程中,算力会面临损耗,如何优化虚拟化层开销?
赵鸿冰:关于异构算力虚拟化损耗的问题,当前主流的算力调度形态包括裸金属、高性能集群、云主机和容器。不同形态适配不同的客户场景:如果客户有极致性能需求,直接采用裸金属或高性能集群即可规避虚拟化损耗;虚拟化损耗主要体现在云主机形态中。
超级计算的核心逻辑不是切割算力单元,而是将更多小单元连接起来形成大规模并行计算的算力。对于有小粒度算力需求的场景,需要虚拟化切割时,容器是最优选择,容器技术几乎可以实现零虚拟化损耗,是解决虚拟化损耗的主流方案。
雷峰网:行业内普遍将杀手级应用的诞生、推理需求的爆发,视作破解算力闲置困局的关键抓手,也将其视为下一波算力需求增长的核心引擎。您如何判断推理需求全面爆发的时间节点与演进节奏?
赵鸿冰:当前市场已经显现出明确的信号,以OpenAI为例,2025年预估营收将达到130亿美元,这正是推理业务规模化发展的直接体现。并行科技服务的众多大客户,也已经进入推理业务落地阶段,整个行业正朝着推理需求爆发的方向迈进。
从产业发展规律来看,技术研发不能无限制推进,最终必然要走向产业化落地,创造社会价值并形成商业闭环,推理需求的爆发是这一趋势的必然结果。国产芯片在当前阶段也可以通过更多地满足推理场景需求,来推动自身业务的发展。
雷峰网:推理需求成为算力产业主流需求后,将对当前的算力基建布局、技术路径选择及商业模式带来哪些影响?您认为AI Infra公司未来最重要的迭代方向是什么?
赵鸿冰:推理需求成为主流后,算力产业的各个环节都将迎来显著变化。在训练时代,算力竞争的核心是大规模集群的可靠性与稳定性,需要通过并行框架优化、checkpoint机制等技术手段,保障模型训练高效完成。而到了推理时代,除了可靠性与稳定性的基础要求外,市场对算力提出了新的核心诉求:一是更大规模的弹性资源调度能力,需要支撑应用随时爆发的算力需求;二是更精细的资源匹配能力,因为推理与训练的应用特征差异显著,比如 DeepSeek的推理过程分为P阶段和D阶段,两个阶段的计算与访存敏感特征完全不同,必须针对性匹配算力资源。
对于AI Infra公司而言,未来最重要的迭代方向是紧跟客户需求场景,持续升级产品与服务。不论迭代技术会带来多高的成本,你都要跟,这是一个商业化的问题,不是一个技术的问题。
雷峰网:今年超节点这一产品形态非常火热,超节点通过高密度集成和高速互联,在通信时延、硬件协同效率上有显著提升,您认为这种硬件层面的优化,是否会压缩软件侧的算力优化空间?这个产品形态主要是为了解决什么问题?
赵鸿冰:并行科技深耕算力服务18年,我们认为无论是超算还是智算,本质都是为了更快地完成计算任务,计算过程中涉及的数据搬运与节点通信,都是额外的性能开销,超节点的核心目标也是通过高密度集成与高速互联,降低这些开销,提升数据传输与通信效率。
从本质上讲,超节点就是一个小型化的超级计算机。硬件层面的优化,并不会压缩软件侧的优化空间,反而需要软硬协同才能发挥最大价值。一台性能优异的超节点,必须搭配优秀的软件调度与优化能力,才能充分压榨硬件性能。硬件架构的升级是顺应产业发展方向的必然选择,软件则需要同步迭代,实现对硬件的高效驾驭。
雷峰网:那么是否可以理解为,具备超算技术积累的企业,更容易获得超节点的能力?
赵鸿冰:确实如此,超节点的技术逻辑与超算一脉相承。国外在智算领域的布局,本质上也是在构建超级计算机,比如Stargate等,在描述上也是在建设超算。超节点与传统超算的核心共性,都是通过优化卡间互联、节点间互联,实现大规模并行计算。
区别在于,超节点的规模远小于传统超算,传统超算动辄需要上万个、甚至数万个节点,而超节点更偏向于小型化集群,比如英伟达的NVL72、华为384超节点,本质上都是小型超级计算机。
02
演讲全文
![]()
演讲完整视频,详见链接:https://youtu.be/acn8RLPTqHs
以下是赵鸿冰演讲的精彩内容,雷峰网作了不改变原意的整理与编辑:
大家好,今天我想和大家分享并行科技在算力服务与算网服务领域的实践探索与心得。并行科技深耕算力行业18年,以超算业务起家,在长期的发展过程中,我们从超算视角出发,基于客户画像与产品定位两个维度,对当前的算力市场进行了划分。
算力市场的第一类场景,是以我国“天河”超级计算机为代表的尖端超算领域。2010年,天河超级计算机跻身全球超算500强首位,这类超算主要面向国家重大科技攻关项目的研发工作,其核心特征是需要十万核、百万核甚至更大规模算力支撑。
第二类场景是通用超算领域,并行科技对这一领域的发展起到了核心推动作用。与尖端超算不同,通用超算面向的主要场景之一是高校师生的日常教学与科研需求,算力需求集中在万核以下,以千核甚至几十核为主,这是并行科技的主战场之一。
第三类场景是业务超算领域,主要服务于企业的业务模拟仿真需求,这类算力应用通常是企业生产流程中的关键环节。
第四类场景就是2016年以来,伴随大模型技术爆发而兴起的智算形态,其核心计算载体为GPU加速卡。从技术指标来看,前三类超算场景的核心需求是高精度计算,普遍要求FP64双精度,最低也需达到FP32精度;而智算场景的计算精度则大幅降低,以FP16、FP8甚至FP4为主,当前智算也是整个算力市场中增长最快的板块。
![]()
近两年,算力市场迎来爆发式增长,各类参与者纷纷入局。从业态形态来看,当前算力市场可分为四大类型:
算力租赁:这是最基础的算力服务形态,相当于将“裸金属”算力资源长期交付给用户,用户可自主支配算力用途,算力提供方不参与后续的应用环节。
算力服务:这是面向用户终端需求的“最后一公里”服务,核心是按需提供算力支持,精准匹配用户的实际业务场景。
算力运营:其核心是构建一个复杂的调度平台,通过对算力资源的统筹管理,实现算力的高效分配与运营。
算力网络:这是更高维度的算力服务形态,通过将多个算力平台纳入统一管理,形成一张覆盖广泛的算力网络,实现跨平台的整体调度。
这四类业态,清晰勾勒出当前算力服务与算力网络的市场全貌。
![]()
并行科技的经营核心理念,始终立足于用户视角。我们认为,从算力需求方的角度出发,用户的核心诉求可以归结为三点:第一是可用,即需要有稳定的算力资源供应,且能够有效支撑业务运行;第二是好用,算力资源不仅要 “跑起来”,更要具备高效的运行性能;第三是降本,要降低用户的算力使用门槛,以高性价比满足需求,尤其是大模型训练这类高门槛的算力应用,性价比更是关键考量因素。
“可用、好用、降本”是用户的核心刚需,并行科技的所有产品平台,均围绕这三大需求展开设计。
![]()
在大模型时代,不同类型的客户对算力产品平台有着差异化的需求。例如,基模训练场景中,受DeepSeek的影响,仅有少数企业需要大规模的算力集群;而垂类模型的研发场景,则覆盖了更为庞大的用户群体,这类需求可以通过标准化、高适配性的产品型平台来满足。
并行科技的特色经营模式,是基于算力网络的轻资产运营模式,其核心逻辑是“厂网结合”。其中,“厂”代表并行科技的重资产布局,我们已投入大量资金,建设了万卡集群;而“网”则是我们的核心发展策略,通过轻资产扩张的方式,更多地把已建或在建的算力产能更大化的发挥出社会效益,并行科技已连接国内47个智算中心与15个超算中心,总计62个算力节点。
目前,我们的算力网络可调度资源总量达到200多万CPU核心、5万多张GPU卡,服务用户规模突破16万,业务布局覆盖全国,商业化输出总量累计超200亿核时、近2亿卡时,在算力服务企业中位居第一。
![]()
从技术层面来看,并行科技的核心竞争力源于18年积累的行业数据与技术沉淀。我们的算力网络服务模式覆盖了包括行业大模型研发、文生文、文生视频、AI for Science等在内的多元用户场景,基于海量用户的行业运行特征大数据,能够快速为用户提供精准的资源选型匹配服务。
以具身智能场景为例,并行科技在中原区域合作了全国首套2000卡级别的全球性能最先进的智算算力集群,这也是目前全球能够量产的性能领先的算力资源。我们会针对客户的具体应用场景开展类似CT扫描的特征分析,输出GPU利用率、FP16与FP8精度下的运行性能等量化数据,以此判断算力资源的实际使用效率。
![]()
算力的本质在于“更快地完成计算”,充分释放GPU等硬件的性能优势。
我们发现,尽管B200的性能表现领先,但针对某一具身智能客户的需求,H200的性价比更具优势。这一结论也印证了资源选型的重要性:没有绝对最优的算力资源,只有最适配的选择。
![]()
基于历史经验与数据积累,并行科技构建了算力性能预测模型,输入相关参数后,即可有效预测算力的性能加速效果。该模型在小规模算力场景下的预测误差可控制在2%以内,中大规模场景下的误差也仅为个位数,足以支撑用户的资源选型决策。此外,在大规模推理场景中,消费级显卡5090是当前的性价比之王,成为多数客户的首选。
![]()
随着DeepSeek的爆火,MaaS(模型即服务)模式迅速崛起,有观点认为Token将成为未来算力市场的核心要素,并行科技也已布局MaaS平台,紧跟行业发展趋势。
![]()
值得一提的是,并行科技专门设立了国产事业部,在国产算力资源的适配与应用方面持续发力。例如,华为昇腾910B在部分适配场景中,性能可与A100比肩,且在价格具备优势的情况下,能够为用户提供更高的性价比选择。
![]()
最后,我想简要介绍并行科技的市场地位与客户布局。
在客户群体方面,国内前四五百所头部高校均是我们的核心客群。以清华大学为例,并行科技与清华开展校级合作,为全校6万余名师生提供算力支持,以更好开展AI的探索研究。目前,我们与复旦大学、中国计算机学会(CCF)的合作也已推进至第二期,取得了良好的成效,使更多高校的师生和科研机构的研究员们享用到普惠的算力。
![]()
除高校外,科研机构是并行科技的另一大核心客群,中科院旗下数百家有算力需求的研究所,均已纳入我们的精准服务体系。在企业端,美的、三一重工、比亚迪、小鹏汇天等知名企业,以及智谱 等 AI 领域的标杆企业,也都是并行科技的重要客户。
毋庸置疑,AI将是驱动未来数年乃至数十年产业发展的核心引擎,而算力则是这一进程中的关键基石。有专家将算力比作“水电”,这一比喻十分贴切,如同水电支撑社会生产生活一样,算力已成为数字经济时代的基础设施。相关报告显示,算力指数每增长1个百分点,将带动GDP实现千亿级别的提升。
未来,并行科技愿与行业同仁携手并行,以优质的算力服务与算网运营能力,助力科技强国建设。谢谢大家!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.