网易首页 > 网易号 > 正文 申请入驻

百度飞桨的含金量还在上升

0
分享至

支撑大模型训练,最重要的东西是啥?

有人说当然是GPU啊、算力卡啊。

的确,以算力为核心的硬件部分很重要,但是这些你只要有钱就可以买到。

你知道吗,其实软的部分同样重要,没软件的话,算力卡就是砖头。

软件这部分呢,主要包含两大块:

1、计算库,比如大家熟知的CUDA里面的cuDNN、cuBLAS等等;
2、深度学习框架,比较流行的有:PyTorch、飞桨(PaddlePaddle)、TensorFlow等,这三大框架也被称为“PPT组合”。

如果拿大家熟悉的电脑举例子↓

算力卡相当于电脑硬件,计算库相当于硬件驱动,而深度学习框架就相当于操作系统。

这么说吧,在大模型训推场景里,深度学习框架的地位堪比电脑领域的操作系统,重要程度可想而知。

为什么这么重要?还堪比操作系统?我再来举个更通俗的例子——

把训练大模型比作盖楼,那么大楼就是大模型,而各种建材就相当于数据。

盖楼的过程就是模型训练的过程,这其中有三类角色起到关键作用↓

GPU/算力卡:相当于先进的施工机械,具备快速盖楼能力。

计算库:相当于精通机械操作的工人,有了他们机器才能开动。

飞桨、Pytorch等深度学习框架:相当于施工总指挥

总指挥要负责把设计图(模型架构、训练逻辑)翻译成具体指令,安排工人(CUDA、cuDNN等)去操控施工机械(GPU)。

他还要管理施工过程中的各个细节,如施工进度、材料调配、返工调整等。

正经定义:深度学习框架是基于对神经网络表示和计算的抽象封装,为开发、训练、部署AI模型提供全流程支撑的AI基础软件。
核心功能包括模型定义与构建、数据预处理与加载、自动微分、算力卡及其计算库适配对接、计算图执行和加速优化、分布式训练、推理部署等等。

一个大楼盖下来,人们往往看到机械运转(算力卡),工人忙碌(计算库),却忘记了背后的那个运筹帷幄、统揽全局的总指挥(深度学习框架)。

实际上,不管传统AI、机器学习时代,还是如今的大模型时代,深度学习框架都是不可或缺的铁三角之一。

今年,AI圈的行情又有了新变化!

DeepSeek井喷之后,国产大模型的训练、优化,以及推理应用越来越普及。

一方面国内大厂纷纷推出新一代的基础模型,另一方面这些模型迅速在各行各业落地生根。

这波新行情来势汹汹,在技术层面生态层面,对深度学习框架提出了新要求。

技术层面看,大规模分布式训练和并行推理成为新常态,同时模型迭代周期变短,需要框架提供更好的支持,无论训推的性能上还是开发的灵活性上。

生态层面看,大量国产算力芯片、国产模型开始唱主角,同样需要框架能够适配。

面对这些新变化,哪个框架能快速适应,就会更受欢迎。

事实上,三大主流框架中(P、P、T),百度飞桨(PaddlePaddle)早早就做好了准备。

一、先看技术层面

大规模分布式训练本质上是多个节点协作完成神经网络训练任务,涉及到复杂的计算图优化、通信优化,同时又需要保证开发灵活性与执行效率之间的平衡。

飞桨拥有一项独门绝技:动静统一,可以完美契合这种需求。

啥是「动静统一」呢?

在深度学习中,神经网络的计算过程通常都可以抽象成计算图,这个图的作用至关重要。

计算图把复杂的数学运算用图(节点与边)直观地表示出来,进而实现自动计算、自动优化、自动求导。

这就好比盖楼时需要施工图,有了施工图,所有人才知道如何正确施工、如何合理搭配建材、如何提高效率缩短工期。

计算图通常由两种,一种叫做动态图,就是在运行时动态来构建计算图。

就好比你一边盖楼,一边画施工图,随建随画,按需灵活修改。

与动态图相对应的,是静态图,是指在编译或构建阶段实现确定图结构,然后再执行训练或推理。

就好比盖楼的时候,施工前所有的图纸必须是定好了的,然后盖楼一气呵成,效率才有保障。

说白了,动态图在计算时创建,易于动态控制、快速迭代,适合搞研究和开发。

而静态图结构固定,可以提前优化好,执行效率高,但没法按需动态调整,灵活性不够。适合严肃的生产级部署场景、高效推理。

动态图灵活,但分布式效率低,静态图性能高,但分布式开发体验差。偏偏新时代的“盖楼”需求,两样都想要。

此时,压力就给到施工总指挥(深度学习框架)这里了,只有把静态图和动态图两者的优势统一起来,才能更好地适应新时代“盖楼”节奏。

这种“鱼和熊掌兼得”,恰恰就是百度飞桨提出并一直在强调的「动静统一」能力。

飞桨允许灵活选择动静模式,一键转换,无缝支持大规模训推。

开发时用动态图模式,保证灵活性与易用性, 训练、部署时自动转换为静态图,实现分布式性能优化(通信优化、并行优化、减少冗余操作)。

# PaddlePaddle动态图模式
import paddle
paddle.disable_static() # 启用动态图模式
x = paddle.to_tensor(1.)
y = paddle.to_tensor(2.)
print(x + y)
# 转为静态图
paddle.enable_static() # 启用静态图模式

就这样,动静统一让百度飞桨成为当下分布式训推场景表现更优秀的框架。

当然,飞桨的技术亮点远不止动静统一。

比如飞桨提供了对模型训练的特别优化,有效提升训练吞吐率、训练有效率和收敛效率,并提供软硬一体的大模型自动容错方案。

我们来讲个提升训推性能的黑科技↓

在大模型训推过程中,需要处理大量数据,经常要用到一种叫「注意力机制(Attention)」的计算方法。

让模型从长长的文本中,找出哪些信息是重要的,哪些信息可以忽略。

飞桨首创了「FlashMask 动态注意力掩码」:加速大模型灵活注意力掩码计算,有效提升长序列建模能力和训练效率。

这项独门技术,巧妙地对注意力机制的计算过程进行优化和简化,支持灵活多样的注意力掩码模式,减少模型在进行长文本处理时不必要的计算和存储需求。

从而模型在处理更长文本时,速度更快,占用显存更少,优化长文处理能力和多轮交互表现。

同时,针对多模态模型长序列等关键训练场景以及训练突刺训练资源变化训练中断恢复等实际问题,飞桨创新性的拿出了一系列优化技术。

这些技术包括:多模型结构混合并行、分片切分并行、灵活批次虚拟流水线、存算平衡的重计算、AdaGC自适应梯度裁剪和ZCC Ckpt高效转存等技术等等。

然后,再结合模型算法特点和实际训练场景,从并行策略、计算优化、算法效率、集群容错等各个方面进行全栈优化。

不仅如此,面对当下火爆的大模型推理需求,飞桨针对推理场景也做了大量优化。

比如飞桨PaddleSlim技术,为模型压缩瘦身,在效果无损的前提下,大幅降低推理算力开销。

刚刚发布的飞桨框架3.0,又为我们带来了更多技术亮点↓

比如自动并行、神经网络编译器自动优化等等,所有这一切都是为大规模分布式训练和推理未雨绸缪。

二、再看生态层面

目前,国产化算力已经开始全面上线(昆仑芯、昇腾、海光、寒武纪、沐曦……),算力短缺的情况会缓解,未来的大模型训推,国产算力会逐渐唱主角。

但是,市面上的其他流行框架,对国产算力卡、计算库、国产模型的支持,存在严重短板。

飞桨则拥有更加开放的生态,对国产化算力的支持,在业内是独一无二的,而且,飞桨也支持所有主流大模型。

同时,飞桨框架3.0还进一步简化了硬件适配,为大模型硬件适配提供了功能完善且低成本的方案。

3月16日,百度发布了新一代原生多模态基础大模型文心4.5,通过多个模态联合建模实现协同优化,多模态理解能力优秀;具备更精进的语言能力,理解、生成、逻辑、记忆能力全面提升,去幻觉、逻辑推理、代码能力显著提升。

在文心4.5的训练和部署上线过程中,飞桨发挥了重要的作用。

可以想象一下,未来几年的名场面:国产AI框架的统筹调度之下,国产算力卡、国产计算库、国产大模型协同作战…

总指挥、工人、施工机械,全国产化方案,一条龙盖楼喽!

百度飞桨的含金量,还在上升…

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
直接起飞,中国男篮重大喜讯,专打日本队

直接起飞,中国男篮重大喜讯,专打日本队

宗介说体育
2026-05-28 16:56:57
iPhone 18 Pro Max 曝光,钛金属回归?

iPhone 18 Pro Max 曝光,钛金属回归?

果粉俱乐部
2026-05-28 13:05:03
73年宋希濂去韶山,不愿进毛主席旧居,杜聿明:不要忘了陈毅的话

73年宋希濂去韶山,不愿进毛主席旧居,杜聿明:不要忘了陈毅的话

浩渺青史
2026-05-28 18:49:56
87岁车主身亡!特斯拉Autopilot系统失控:撞上配电箱后沉入池塘

87岁车主身亡!特斯拉Autopilot系统失控:撞上配电箱后沉入池塘

快科技
2026-05-28 18:17:45
两性关系:夫妻过了六十岁,尽量要同居。

两性关系:夫妻过了六十岁,尽量要同居。

游戏收藏指南
2026-05-28 18:52:26
北京这一天,徐璐穿透视装,吉娜勒出沙漏腰,张俪头上像顶个抹布

北京这一天,徐璐穿透视装,吉娜勒出沙漏腰,张俪头上像顶个抹布

阿裤趣闻君
2026-05-27 17:51:00
单局造21-7惨案!刘圣书/谭宁2-0横扫世界第14,晋级新加坡赛八强

单局造21-7惨案!刘圣书/谭宁2-0横扫世界第14,晋级新加坡赛八强

钉钉陌上花开
2026-05-28 20:01:13
64岁陈秀雯近况曝光,“消失”6年变了模样,那么美却被婚姻毁了

64岁陈秀雯近况曝光,“消失”6年变了模样,那么美却被婚姻毁了

文刀贰
2026-05-13 23:25:20
董明珠回应“不用海归派”言论:本意不是说“海归派”不好,坚信中国高校能培养出世界级的优秀人才

董明珠回应“不用海归派”言论:本意不是说“海归派”不好,坚信中国高校能培养出世界级的优秀人才

每日经济新闻
2026-05-27 23:38:01
印度急得跳脚!中巴联合声明提克什米尔,新德里怒斥:谁让你管的

印度急得跳脚!中巴联合声明提克什米尔,新德里怒斥:谁让你管的

面包夹知识
2026-05-28 17:10:16
14年儿子乘坐马航失联,10年后父亲竟然收到来信,看完后崩溃大哭

14年儿子乘坐马航失联,10年后父亲竟然收到来信,看完后崩溃大哭

白云故事
2025-05-20 05:10:03
他武功比赵云吕布还高,却一生未遇明主,鲜为人知,结局如何?

他武功比赵云吕布还高,却一生未遇明主,鲜为人知,结局如何?

鹤羽说个事
2026-05-26 23:02:11
斩首?泽连斯基住所被炸:导弹击中了停机坪,并穿透至地下停车场

斩首?泽连斯基住所被炸:导弹击中了停机坪,并穿透至地下停车场

三毛看世界
2026-05-26 19:27:41
美军证实伊朗打击美驻科威特基地,称伊方“严重违反停火”

美军证实伊朗打击美驻科威特基地,称伊方“严重违反停火”

界面新闻
2026-05-28 19:58:20
西红柿的最佳搭配不是鸡蛋,而是它!夏天吃护血管,远离便秘

西红柿的最佳搭配不是鸡蛋,而是它!夏天吃护血管,远离便秘

芹姐说生活
2026-05-28 15:08:48
OnlyFans霸屏美剧背后:创作者警告"别被一夜暴富骗了"

OnlyFans霸屏美剧背后:创作者警告"别被一夜暴富骗了"

赴一场山海啊
2026-05-27 00:16:56
一把“27元的勺子”,揭开富养女的真面目:不赚钱就不知道心疼

一把“27元的勺子”,揭开富养女的真面目:不赚钱就不知道心疼

妍妍教育日记
2026-05-28 18:35:06
海产姐妹交大毕业!梁靖崑添新身份 凉皮哭着练球 孙颖莎续约深大

海产姐妹交大毕业!梁靖崑添新身份 凉皮哭着练球 孙颖莎续约深大

颜小白的篮球梦
2026-05-28 11:33:19
研究表明:性生活次数不达标,不管男女容易早衰且癌症风险增高!

研究表明:性生活次数不达标,不管男女容易早衰且癌症风险增高!

番外行
2026-05-11 08:49:20
两性关系:55-65岁这十年,惜命最好的方式,不是锻炼,做好这6点

两性关系:55-65岁这十年,惜命最好的方式,不是锻炼,做好这6点

三农老历
2026-04-13 17:10:06
2026-05-28 20:51:00
AI全球总部
AI全球总部
全球最新、最酷AI解决方案
1185文章数 715关注度
往期回顾 全部

科技要闻

利润跌27%:快手只剩“可灵”这张牌?

头条要闻

20万飞天茅台搭售40万黔茅酒 老板参加"峰会"后称被耍

头条要闻

20万飞天茅台搭售40万黔茅酒 老板参加"峰会"后称被耍

体育要闻

如果雷霆拼图是这水平 马刺确实打不过

娱乐要闻

林俊杰七七与大哥嫂子的瓜剪不断理还乱

财经要闻

长鑫科技IPO过会,市值会到几万亿?

汽车要闻

新款吉利星愿6.18万起售 一镜到底寻找爆款密码

态度原创

教育
房产
本地
家居
公开课

教育要闻

满老师把"压箱底"的升学数据公开了!近万份报告随便查,腾讯ima内测

房产要闻

突发重磅!三亚新机场公司正式成立!

本地新闻

用剪纸的方式,打开江苏扬州

家居要闻

蜂鸟餐椅 线面交错

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版