2025年12月26日,极新主办的【想象·2025极新AIGC峰会】在上海浦东浦软大厦成功召开。金山云公有云事业部解决方案架构师宋烨先生在会上发表题为《大模型技术演进与想象力引擎构建》的重要演讲,分享大模型技术发展趋势与普惠算力实践。
![]()
金山云公有云事业部解决方案架构师宋烨
宋烨重点提到以下几点:
“效率革命是提升社会工作效率的关键”
“公有云的本质是解放客户生产力”
“普惠算力让AI汇集到千行万业”
以下为宋烨演讲全文,经极新整理:
各位早上好!我是金山云解决方案架构师团队负责人宋烨,今天非常荣幸能有机会,与大家分享 AIGC 浪潮下金山云的实践探索,以及行业与技术的发展趋势。本次汇报主题为《大模型技术演进与想象力引擎构建》。
01效率革命与AI驱动
“效率革命是提升社会工作效率的关键”
首先要提出“效率革命”这一核心概念。用经济学公式可对人均 GDP(衡量国民生活幸福程度的重要参考指标)进行拆解:人均GDP=GDP÷总人口,进一步迭代为(GDP÷工作人口)×(工作人口÷总人口)。
随着社会发展,等式右侧“工作人口÷总人口”的比值正持续下降,我国面临老龄化加剧、出生人口低迷的现状,未来这一趋势难以逆转。因此,提升人均GDP的唯一路径,就是提高“GDP÷工作人口”的比值,这一数值本质上就是国家整体生产效率。AIGC 的诞生与发展,核心作用正是提升社会工作效率,这也是中美等世界主要国家争相在 AIGC 领域加大资源投入的根本原因,目前中美已成为该领域最发达的两个国家。
基于这一判断,金山云领导层坚定认为 AIGC 是必须布局的核心赛道。早在三年前,公司CEO就提出“奥运 AI”战略口号,始终践行相关发展目标。人工智能虽已发展多年,但自Transformer等传统模型提出后,行业迎来爆发式增长,吸引了大量投资与技术跟进。
金山云始终紧跟行业浪潮,技术布局与上述方向高度契合,主要聚焦三大核心工作:其一,基座模型研发支持。2023-2024年基座模型是热门投资方向,金山云前两年重点为基座模型厂商提供大规模算力支持,这一过程极具挑战性;
其二,融合感知技术研发,即多模态技术。除语言研究外,进一步覆盖视觉、听觉等人类核心感知维度,而视觉感知尤为重要。众多知名科学家提出,语言无法完美描述世界,例如模型对“重力”等物理世界的感知存在欠缺,需通过视觉等多模态能力弥补,当前世界模型的研究已在机器人、自动驾驶等领域广泛开展;
其三,普惠化落地探索。核心目标是让AI算力与技术惠及千行万业。对于初创企业等成本敏感型主体而言,GPU算力投入门槛极高,金山云正致力于降低AI工具使用门槛,助力各类主体快速运用AI实现创新突破。
02算力集群构建挑战
“公有云的本质是解放客户生产力”
首先要明确公有云的核心本质:解放客户生产力。客户无需在基础架构上投入精力,可将全部资源集中于核心业务创新,把基础架构相关的技术工作交由公有云承接,这正是公有云的核心价值。也正因如此,在AI爆发的这几年,公有云服务了大量客户,行业内国内外相关企业的股价均表现亮眼,金山云也不例外。
接下来重点分享金山云在算力集群领域的实践。过去三年,我们持续投入大量精力构建算力集群,而大模型的工程落地并非简单采购机器即可,中间涉及复杂的实施过程,需满足高性能、高带宽、高存储等多重需求。
在网络构建阶段,工程师曾为避免光纤在运输中沾染灰尘,用酒精棉签擦拭,却导致集群构建后信号抖动严重,酒精蒸发后残留的痕迹会影响信号传输;在硬件部署层面,GPU服务器功耗极高,传统机柜适配性差,部分机柜仅能容纳一台机器,运行时的啸叫堪比飞机起飞,且对散热要求严苛。
更具挑战的是机房空间问题:客户常需从256台扩展至512台规模,但多数机房难以满足需求,被迫搬家时还需规避北方冬季的冷凝水风险,低温环境运输的机器进入高温机房后,极易产生冷凝水,严重影响设备寿命。此外,物理服务器选型、机房筛选等环节也面临诸多考验。
除物理层难题外,网络组网方案的优化同样关键。技术层面主要有两种选择:IB和ROCE。IB方案性能更优,但成本是ROCE的三倍。为此,金山云专门组建网络团队,持续迭代优化 ROCE 网络性能,目前已实现接近IB的水平,这一过程中交换机系统等相关组件也在不断升级,投入了大量技术资源。
至今,我们仍在持续承接超大规模算力集群项目,这些集群的核心用途是作为模型训练的底座。为保障交付给客户的环境稳定,我们对所有服务器选型进行严格筛选与检测,交付前需经过数天的加电稳定性测试,覆盖服务器、网络等全环节。
03普惠算力实践
“普惠算力让AI汇集到千行万业”
接下来重点分享当前我们聚焦的“普惠算力”相关实践,核心围绕 API 服务的落地与应用展开。先通过一张海外权威报告说明行业趋势:海外顶尖 token 服务公司OpenRoad在2025年5月至11月的调研显示,其平台上各类模型调用需求中,“角色扮演(Role Play)”占比最高,这类应用涵盖陪伴、情感陪护等场景;其次是代码生成,此外技术、财务、学术、科学、法务、翻译、健康等领域的需求也较为突出。
![]()
这里的API服务核心价值在于降低AI使用门槛:初创企业无需搭建复杂的算力集群,只需通过现成的AI API服务,即可调用各类先进模型,OpenRoad本质就是这样的模型中转站,而金山云也已同步布局该领域,面向用户提供托管式及公有API服务。
我们的API服务布局分为两大方向,背后对应不同的技术与运营团队:一方面,金山云自主部署并调优市场上主流的开源模型,用户通过公有云账号即可直接访问这些模型的API;另一方面,搭建模型中转服务,对于未开源的商业API,用户无法直接获取模型部署权限,金山云作为中转方对接原厂商,凭借海量客户资源争取更优合作价格,为此专门设立采购团队与模型厂商洽谈折扣,同时组建技术团队保障开源模型的快速上线,实现“模型发布次日即可在平台提供服务”的响应速度。
从技术架构来看,所有API服务提供商均需覆盖资源层、平台组件等核心模块,而行业竞争的关键在于两点:一是性价比,满足用户对低成本使用AI服务的需求;二是性能稳定性,通过KB/PB分离、TPP并行等优化算法,提升推理速度与服务可靠性,这也是金山云API服务的核心竞争力,更是普惠算力的重要落地方式。
实际应用中,AI API服务的用户群体广泛,有同事在出差途中与陌生人交流后,对方当场注册金山云账号并启用API服务。目前我们已积累了各类行业用户,其中包括国内多家知名大型模型厂商(作为中立云厂商,我们为其提供多元服务支持)。
值得一提的是,代码生成是当前热门赛道,金山云也针对性开发了内部研发工具。公司内部对该工具的使用极为重视,管理层已调研所有程序员的使用频率,以此推动内部AI工具的深度应用。
结合网上的“AIGC适用度四象限图”,不同场景的AI应用适配性存在差异:右上角“想象力优先”象限的应用最为广泛;右下角代码生成等赛道已有实际落地案例;左上角容错率低的场景目前应用较少;左下角最严谨的领域则有部分企业主攻。而金山云的核心目标,正是为各领域用户提供“助飞想象”的AI引擎。
![]()
最后,金山云为用户提供完整的技术支持体系。最底层是基础设施层,提供高性能算力集群。在此基础上是AI平台层,用户可通过金山云调用各种市场常用模型。
目前我们的平台支持近30种不同模型,包括Kimi、Deepseek等热门模型,甚至一些海外模型。通过一站式访问渠道,用户能专注于业务创新。
总之,金山云始终致力于从技术底座层面帮助用户实现想象力,推动AI技术在各行各业的落地应用。
更多干货分享敬请注我们的公众号与视频号~超多精彩对话内容等待您的解锁!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.