网易首页 > 网易号 > 正文 申请入驻

大模型算力,宁畅不想拆盲盒

0
分享至

有钱就能做算力,已经成为过去式。

大模型对于算力的指数级需求,一度让不少企业蠢蠢欲动,2023年,光倒卖英伟达GPU卡就是一门来钱快、利润高的生意,但到了年末,部分企业发现即便有钱能买到GPU卡,算力却不是堆卡就能堆起来的。

量变引起质变,根本原因是大模型算力的复杂度变化,例如业内通常千卡集群训练千亿参数大模型,万卡集群才能较好训练万亿参数大模型,即便是精调等算力相对较小的需求,也存在着大量的算力浪费。

在通用算力为主的算力时代,互联网等上层应用基本趋于稳定,底层通用算力的优化也没有太多文章可做,但是大模型是全新的业务负载,本身还处于快速演进阶段,与之相匹配的算力也较难做到针对优化。

大模型算力,既是服务器厂商的机会,也可能成为洗牌的开始。

宁畅总裁秦晓宁指出,大模型在细分行业落地过程中,已经不再局限于算力性能这一单一竞争要素,面临算效、适配、应用等问题日益复杂,愈发需要系统性AI计算方案提供全方位、全周期支持。

算法协同优化、数据处理能力、模型可解释性以及与特定行业应用的融合度,都成为了智能计算能否成功推动技术创新和实际落地的核心因素。

大模型算力,是系统级工程

据此前报道,OpenAI训练GPT-4在大约25000个A100上训练了90到100天,算力利用率在32%到36%之间,被视为业内标杆的大模型尚且如此,可以想象,更多大模型一边摸索一遍训练,相当比例的算力都会白白浪费掉。

大模型与算力,是新时代的掘金者与卖水人,不管大模型发展得如何,为大模型提供算力的厂商赚得盆满钵满,但随着大模型行业的收敛,卖水这门生意也有了足够高的门槛。

秦晓宁提到,大模型的1.0阶段,即百模大战时期。流行这样一句话,大模型厂商第一要务就是购买更多的GPU服务器,很多算力提供商并不需要过多关注客户需求,大模型客户只需要更快更强的硬件产品。

2024年,大模型从参数竞赛进入到商业化、产业化的落地阶段,企业不仅需要算力硬件,更多是整个支撑能力体系的升级,就像“木桶原理”一样,任何一个短板都可能造成系统的瓶颈。

举例来说,算、网、存、管四个方面,超大规模算力集群需要超强的稳定性,同时需要多台集群GB级数据规模的通信能力,存储的读写和容量也要跟上大模型的需求,管理需要减少损失、设备故障等方面问题。

“今年在产业垂直落地的场景当中,需要我们精调的行业模型客户越来越多,而且客户对于算效的需求不像前一类客户需求那么强烈,他们需要极高的模型精度和效率,95%是行业模型精度的门槛,在To C场景,60%的精准度已经可以满足普通大众的需求了。”秦晓宁透露。


从大模型精度方面看,需要考虑的因素也更复杂。例如行业数据本身涉及到内部信息、客户数据等,需要考虑数据的安全合规性,在此基础上还要进行高质量的数据治理,做好清洗、标注等一系列工作,避免低质量数据导致模型的置换问题。另外,还需要算法、调优硬件加速包括软件工具等各方面的支持。

当大模型训练完之后,在部署阶段需要确保训练推理业务之间的软硬件数据,实现无缝实时对接,同时模型部署阶段会有很多的冗余,需要进一步做好模型的精简、蒸馏、压缩,算力平台也可以实时加速推理,算力调度可实现轻量级一键式甚至分钟级部署。

在管理大模型应用的过程中,需要一个稳定的运行环境,同时对整体资源进行实时全面监管,高效稳定的体系。

“不管是万卡时代的算效彩票还是深入行业的精度盲盒,以及高效调用的服务瓶颈,这是我们当下急需要解决的问题。”秦晓宁总结道。

全局智算,服务器厂商的战略升维

大模型算力的复杂度,已经让算力厂商不得不加速迭代自己的技术栈,宁畅的应对之策是全局智算战略,比起过去以提供硬件产品为主的能力,宁畅相当于给自己来了一次能力升维。


全局智算共分为六个层面,最底层是硬件资源层,也是广泛熟知硬的产品,包括传统通用服务器、GPU、整机柜、存储、网络多种形态产品。

硬件层之上是集群设计层,这一层不是将海量硬件进行简单的连接堆叠,而是分析整个业务运行的特征和系统的量化需求,提供从微架构、网络、存储、AI模型特征等一系列的方案化设计。

集群层之上是算子优化层,宁畅为了降本增效提供了整体AI算子自优化能力,减少模型执行的时间,降低了资源的消耗,提高了能效比,使得大模型能够在有效的资源上高效地运行。

再往上AI中台层,目前宁畅已经全面支持NVIDIA AI Enterprise,并基于此提供AI算力系统深度整合的工作栈。

更高是业务层和场景层,宁畅可以根据不同的业务和场景,针对性优化大模型效果。如此,宁畅可以提供从咨询、测试、运维、售后的全服务场景,满足客户从大模型的开发、适配、部署、全场景的全行业的需求,并且根据客户的不同阶段,提供极具性价比定制化智算部署方案。


以某车企的大模型算力需求为例,宁畅首先搭建了集群互联方案,其中搭载了液冷整机柜产品,实现了电液盲插,非常方便运维和部署。

在软件层面,由于自动驾驶对实时性和延迟性要求非常高,针对于自动驾驶特定的算法和模型,软件栈提供了优化的深度学习框架和加速库,包括了宁畅为自动驾驶场景的预训练模型、模型压缩、加速技术,以及车辆特定的硬件平台优化深度学习库。

为了确保自动驾驶系统的安全性,车企需要进行大量的模拟测试,软件栈包含模拟和测试工具,支持虚拟环境创建、场景重现,测试用例自动生成和执行。自动驾驶企业还需要处理和标注大量的数据,宁畅能够支持数据预处理自动标注等,提高了数据的利用效率,加速模型的训练过程。

大模型算力是全新的复杂系统,不论是宁畅还是其他算力供应商,都在参与并构建新时代的算力生态,这也将成为未来一段时间的行业主旋律。

(本文首发钛媒体APP 作者|张帅,欢迎添加作者mr3right爆料、交流)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
塔帅谈孙兴慜对曼城单刀不进:孩子们都双手抱着围着桌子转圈

塔帅谈孙兴慜对曼城单刀不进:孩子们都双手抱着围着桌子转圈

懂球帝
2024-05-18 06:38:37
长城炮车主被车顶电动帐篷卡脖身亡,双方回应!涉事帐篷仍在销售

长城炮车主被车顶电动帐篷卡脖身亡,双方回应!涉事帐篷仍在销售

每日经济新闻
2024-05-15 12:56:10
擦边营销无休止,涉事汽车门店火了?

擦边营销无休止,涉事汽车门店火了?

户外小阿隋
2024-05-15 19:53:24
1-4月全国城镇调查失业率平均值为5.2%,比上年同期下降0.2个百分点

1-4月全国城镇调查失业率平均值为5.2%,比上年同期下降0.2个百分点

红星新闻
2024-05-17 10:39:16
再下一城!乌军在赫尔松取得重大突破,成功收复涅斯特里亚岛

再下一城!乌军在赫尔松取得重大突破,成功收复涅斯特里亚岛

娱宙观
2024-05-17 15:49:47
皮尔斯:季后赛里健康决定命运 如果19年杜兰特没受伤会怎么样

皮尔斯:季后赛里健康决定命运 如果19年杜兰特没受伤会怎么样

直播吧
2024-05-17 22:50:05
中俄会晤不到24小时,美要求中方停止对俄合作,否则对华采取行动

中俄会晤不到24小时,美要求中方停止对俄合作,否则对华采取行动

前沿天地
2024-05-17 13:12:25
没想到红牌竟然导致成都蓉城踢出本赛季最好的一场球

没想到红牌竟然导致成都蓉城踢出本赛季最好的一场球

刺头体育
2024-05-18 00:52:49
63岁北京知青重返陕北看初恋,发现自己竟已儿孙满堂:我对不起你

63岁北京知青重返陕北看初恋,发现自己竟已儿孙满堂:我对不起你

铿锵玫瑰r
2024-03-10 18:23:47
最新战报!22-25,中国女排出师不利,得分王哑火,吴梦洁首局6分

最新战报!22-25,中国女排出师不利,得分王哑火,吴梦洁首局6分

刘姚尧的文字城堡
2024-05-18 05:12:46
陈凯歌的两个儿子,同一个爸同一个妈,两人颜值差距不是一般大

陈凯歌的两个儿子,同一个爸同一个妈,两人颜值差距不是一般大

娱乐八卦木木子
2024-05-18 07:55:13
这才是成都蓉城大胜梅州客家的原因,原来是这几件事造成的

这才是成都蓉城大胜梅州客家的原因,原来是这几件事造成的

阿牛体育说
2024-05-18 07:50:03
王曼昱被故意淘汰?陈梦和孙颖莎的比赛成绩,是真实水平的体现

王曼昱被故意淘汰?陈梦和孙颖莎的比赛成绩,是真实水平的体现

二郎神侃球
2024-05-15 22:41:02
人际交往:与任何人相处都不紧张、不尴尬的方法,就在于这七个字

人际交往:与任何人相处都不紧张、不尴尬的方法,就在于这七个字

唯唯安
2024-05-15 19:19:39
太恶心了!NBA紧急重罚森林狼!第一支保送西部决赛球队

太恶心了!NBA紧急重罚森林狼!第一支保送西部决赛球队

刺头体育
2024-05-17 17:38:35
季后赛对阵卫冕冠军最大赢球分差:森林狼狂胜掘金45分居首!

季后赛对阵卫冕冠军最大赢球分差:森林狼狂胜掘金45分居首!

直播吧
2024-05-18 07:31:24
广东12所大学毕业证如同废纸,已被官方点名曝光,家长报考需谨慎

广东12所大学毕业证如同废纸,已被官方点名曝光,家长报考需谨慎

手工制作阿爱
2024-05-18 00:38:40
普京访华果然不简单,只为3件事而来,答不答应?中方回应很直接

普京访华果然不简单,只为3件事而来,答不答应?中方回应很直接

星辰故事屋
2024-05-17 18:42:00
贵州这条快速通道预计明年通车,​不收费!

贵州这条快速通道预计明年通车,​不收费!

贵阳网
2024-05-17 09:19:47
河南64岁大爷五年间染指55名女性,只因太了解女性心理

河南64岁大爷五年间染指55名女性,只因太了解女性心理

真实故事汇
2024-05-06 13:31:30
2024-05-18 08:40:49
钛媒体APP
钛媒体APP
独立财经科技媒体
101442文章数 858475关注度
往期回顾 全部

科技要闻

京东拼增长,大力出奇迹

头条要闻

台"内阁"新名单被指令人细思极恐 4人系推动"台独"旗手

头条要闻

台"内阁"新名单被指令人细思极恐 4人系推动"台独"旗手

体育要闻

中超疯狂星期五!5场28球,单场5球起步

娱乐要闻

《庆余年2》首播口碑出炉!有好有坏

财经要闻

重磅!楼市王炸来了 多部门出手救楼市

汽车要闻

内饰与配置全新升级 全新途观L PRO将于5月30日上市

态度原创

艺术
亲子
游戏
时尚
公开课

艺术要闻

真诚度101%,35岁的诚品画廊为什么选择北京?

亲子要闻

爸爸带娃的窒息时刻,爸爸和儿子相处的快乐时光。网友:娃双手接杯的那一刻就已经赢了

物华弥新:从技能机制分析江山图的强度!这核心效果真给改没了么

若你年纪过了40岁,今年夏天建议这样打扮自己,显年轻还显瘦

公开课

父亲年龄越大孩子越不聪明?

无障碍浏览 进入关怀版