网易首页 > 网易号 > 正文 申请入驻

开发者故事 | 构建高性能 DPU 数据面开发框架

0
分享至

在第三届 NVIDIA DPU 黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI 网络、存储和安全等领域的创新突破。

黄昕阳、刘博文、任正行、张云轩、刘翔洲组成的 Axio 团队在本届黑客松中展现出卓越的技术实力,其创新项目“面向 DPU 加速的业务的高性能数据面开发框架”,荣获第三名。该项目通过系统化的设计原则和编程接口,有效突破了传统数据面开发方法的性能瓶颈,显著提升了 DPU 程序的开发效率。

DPU 数据面开发框架的创新设计与实现

在现代数据中心网络中,DPU 的硬件架构为高性能数据处理提供了新的可能性,然而传统的开发方法难以充分发挥其潜力。基于以往 DPU 的开发经验,Axio 团队发现 DPU 数据面和 CPU 或 GPU 数据面的设计原则存在显著差异,采用传统的数据面设计方法开发 DPU 加速的应用程序会导致性能下降。基于这一问题,Axio 团队提出了一套全新的 DPU 数据面开发框架。该框架系统化了 DPU 硬件架构的设计原则,开发出相应的编程接口和运行时框架,从而显著提升了 DPU 加速的应用程序的性能。

从需求分析到技术实现的全过程中,Axio 团队展现了扎实的专业知识和高效的协作能力。

攻克底层难题,实现性能提升

在开发过程中,团队面临的核心挑战来自于底层编程库的“无人区”。由于框架开发涉及最底层的编程库(如 librdma 和 flexio),网络上几乎找不到可参考的案例,团队遇到的每一个 bug 都像一道需要原创解法的高数题。

“每次遇到问题,我们都需要花费大量时间排查。”黄昕阳解释道。依托 DOCA 社区的帮助,团队仔细阅读底层代码库的文档,逐步验证每一个 API 调用的正确性。此外,团队还编写了一些示例来验证 DPU 的配置的合理性。最终,成功解决了这些问题,构建出高性能的数据面框架,为后续开发防火墙、虚拟交换机等功能奠定了基础。

对未来数据中心网络的展望

本次项目的创新之处在于其系统化的设计原则和高性能的编程接口。Axio 团队的框架不仅解决了 DPU 开发中的性能瓶颈,还为未来数据中心网络的高效运行提供了新的可能性。展望未来,团队计划结合 NVIDIA DOCA 软件框架和 NVIDIA BlueField-3 DPU 强大的硬件特性,继续深入探索 DPU 在 AI 和云场景中的更多应用,例如加速终端内部的数据搬运和协议栈处理,实现终端负载均衡。

谈及未来 DPU 领域的发展前景,黄昕阳指出:“在 AI 时代,DPU 凭借其独特的生态位展现出巨大潜力——不仅能作为加速器优化 GPU 间通信,还可以充当控制器实现以 AI 为中心的智能组网,这让我对 DPU 的未来充满信心。”

DOCA 开发者快问快答

Q

您是从哪里了解到 NVIDIA DPU 黑客松竞赛的?参赛的目标是什么?

A

我们通过 NVIDIA 官方微信公众号了解到本次竞赛。参赛的核心目标是与其他同行交流,听取大家对我们项目的建议,同时提升我们在 DPU 开发领域的技术能力。

Q

赛前举办的 DPU 线上技术训练营对您的备赛起到哪些帮助?

A

训练营让我们对 DPU 开发库有了更全面的了解,也提供了与 NVIDIA 专家直接沟通的机会,帮助我们少走了许多弯路。

Q

参与 NVIDIA DPU 黑客松竞赛有哪些收获?

A

最大的收获是与同行交流,解决了一些项目遗留的问题。例如,在实现 DPA 处理 RDMA 流时,我们通过交流发现并纠正了 DPU 配置中的错误,顺利完成了后续开发。

Q

您是从什么渠道了解到 NVIDIA DOCA 的?什么契机使您成为 DOCA 开发者?

A

作为网络研究领域的博士生,我们一直关注最新的网络设备。DPU 是网络研究的重要工具,而 DOCA 简化了 DPU 开发流程,因此成为 DOCA 开发者也是一种必然。最早在 2022 年接触 DOCA 时,我主要研究 BlueField-2 DPU 的 RDMA 可编程化应用。随着 BlueField-3 DPU 的发布,我便转向探索 DPU 在数据加速和 AI 负载均衡的应用,这促使我们参加黑客松以寻求更多技术交流。

Q

最初从事 DOCA 开发时,有具体明确的目标吗?

A

最初的目标是探索 DPU 在高速网络中的生态位,研究其能否加速 CPU/GPU 网络 I/O。后来逐渐转向 DPU OS 的优化和特定应用的数据面框架开发。这些都是服务于网络系统的研究。

Q

过往有其他成功的 DOCA 开发经历吗?

A

最近我们用 DPU 和 DOCA 实现了对 CPU I/O 通信中的 L3 缓存资源的优化,也作为成果发表在 ACM SIGCOMM 中。这个项目重点使用 DPU 中的 DPA 和 Arm 核心作为网络 I/O 通信的控制器,在网络数据流进入 L3 缓存前预先调速,防止 L3 缓存出现溢出;并且利用 DPU 片上 DRAM 资源去预防网络 burst 等场景。

我认为 DPU 和 DOCA 是实现学术想法的一个的理想工具,其一是 DPU 具备强大的性能支撑,可提供高达 400Gbps 的网络带宽;其二是 DOCA 框架大幅降低了开发门槛,特别是 DPA 核的引入使得功能开发更加完备,相比传统 FPGA 开发方式显著提升了效率。

Q

成为 DOCA 开发者对未来职业发展有何帮助?

A

成为 DOCA 开发者也可以参与到现在最热门的 AI 数据中心的网络研究中,这大大提升未来就业的竞争力。

Q

NVIDIA DOCA 中国开发者社区对你们有何帮助?

A

社区提供了丰富的技术资源和友好的交流环境,帮助我们解决了许多开发中的难题,也让我们能够与其他开发者分享经验。

开发者寄语

“高性能网络是现代数据中心的基石,也是最具挑战性的领域之一。我们希望更多志同道合的朋友加入进来,成为 DOCA 开发者,共同为下一代 AI 和云数据中心的网络技术贡献力量。”

——Axio 团队队长 黄昕阳

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
钱赚够了名声没了,英皇风波再升级!荒唐一幕出现,霍震霆也遭殃

钱赚够了名声没了,英皇风波再升级!荒唐一幕出现,霍震霆也遭殃

青杉依旧啊啊
2026-05-07 09:41:09
陈昊宇再次开启靓姐路线,亮白色吊带搭配同款西服尽显女王风采!

陈昊宇再次开启靓姐路线,亮白色吊带搭配同款西服尽显女王风采!

说不尽的人心
2026-05-13 20:32:19
中午11时,中美磋商准时开始,特朗普发现:中国比他想象中更厉害

中午11时,中美磋商准时开始,特朗普发现:中国比他想象中更厉害

天气观察站
2026-05-13 18:54:21
爱德华兹:今晚文班做的某些事真的是无解,你只能祈祷他投丢

爱德华兹:今晚文班做的某些事真的是无解,你只能祈祷他投丢

懂球帝
2026-05-13 15:11:36
山东济南一蔬菜市场仓库发生火灾,现场浓烟明显,官方通报:起火物质为保温材料,火灾未造成人员被困,具体起火原因正在调查中

山东济南一蔬菜市场仓库发生火灾,现场浓烟明显,官方通报:起火物质为保温材料,火灾未造成人员被困,具体起火原因正在调查中

潇湘晨报
2026-05-13 15:22:08
尊重历史,青海马家军在陕西山西河南跟日军血战八年,是真的吗?

尊重历史,青海马家军在陕西山西河南跟日军血战八年,是真的吗?

鹤羽说个事
2026-05-12 22:36:35
最新,章建平建仓股曝光!牛散天团押注“AI+商业航天”(附名单)

最新,章建平建仓股曝光!牛散天团押注“AI+商业航天”(附名单)

数据宝
2026-05-13 12:30:19
访华专机起飞前,美方突然改口摊牌,认为有三件事中国必须解决

访华专机起飞前,美方突然改口摊牌,认为有三件事中国必须解决

呼呼历史论
2026-05-13 18:51:48
女子吃霸王餐给差评:正脸曝光,自认为没错,要上媒体跟老板对质

女子吃霸王餐给差评:正脸曝光,自认为没错,要上媒体跟老板对质

阅微札记
2026-05-13 14:31:03
释永信被一女子爆料:她们姐妹住少林寺3天,争着往释永信房间跑

释永信被一女子爆料:她们姐妹住少林寺3天,争着往释永信房间跑

江山挥笔
2026-03-23 15:40:31
特斯拉宣布停产,震惊全网!

特斯拉宣布停产,震惊全网!

财经三分钟pro
2026-05-12 15:10:58
两次嫁给梁靖崑,退圈安心照顾两个儿子,如今丈夫成为大学教授

两次嫁给梁靖崑,退圈安心照顾两个儿子,如今丈夫成为大学教授

泠泠说史
2026-05-13 21:12:47
贝索斯花了7000万,让桑切斯在Met Gala出尽风头,梅根没收到邀请

贝索斯花了7000万,让桑切斯在Met Gala出尽风头,梅根没收到邀请

小书生吃瓜
2026-05-11 15:36:21
2026年电费新规来了!7月1日起执行,看完再用电,每月少花几十块

2026年电费新规来了!7月1日起执行,看完再用电,每月少花几十块

陈博世财经
2026-05-12 17:03:49
75岁大爷与保姆生下儿子,做亲子鉴定后,大爷却被子女们气得心梗

75岁大爷与保姆生下儿子,做亲子鉴定后,大爷却被子女们气得心梗

黄家湖的忧伤
2025-03-06 09:30:21
“手擀”是商标,面是机器做的!产品已下架

“手擀”是商标,面是机器做的!产品已下架

南方都市报
2026-05-13 19:16:39
一场未上的向鹏算不算世界冠军?队内已承认,8年前国乒有先例

一场未上的向鹏算不算世界冠军?队内已承认,8年前国乒有先例

米修体育
2026-05-13 00:25:29
梁靖崑两盘3-2有四大特效:急疯教练吓晕观众,气死对手爽歪自己

梁靖崑两盘3-2有四大特效:急疯教练吓晕观众,气死对手爽歪自己

老高说体育
2026-05-13 15:41:20
詹姆斯今年季后赛得到232分,大于历史其他41岁以上球员总和

詹姆斯今年季后赛得到232分,大于历史其他41岁以上球员总和

懂球帝
2026-05-13 14:50:08
卡塔尔主帅被打服!印尼则表示:U17国足华而不实出线靠运气!

卡塔尔主帅被打服!印尼则表示:U17国足华而不实出线靠运气!

去山野间追风
2026-05-13 13:43:16
2026-05-13 21:59:00
NVIDIA英伟达中国 incentive-icons
NVIDIA英伟达中国
英伟达(中国)官方账号
3518文章数 1447关注度
往期回顾 全部

科技要闻

腾讯一季度营收1964.6亿元 同比增9%

头条要闻

媒体:黄仁勋绝非"顺路同行" 而是美方刻意纳入的筹码

头条要闻

媒体:黄仁勋绝非"顺路同行" 而是美方刻意纳入的筹码

体育要闻

14年半,74万,何冰娇没选那条更安稳的路

娱乐要闻

白鹿掉20万粉,网友为李晨鸣不平

财经要闻

美国总统特朗普抵达北京

汽车要闻

C级纯电轿跑 吉利银河"TT"申报图来了

态度原创

手机
本地
游戏
公开课
军事航空

手机要闻

好消息:安卓17已正式发布!坏消息:留给开发者的时间不多了!

本地新闻

用苏绣的方式,打开江西婺源

曝PS5破解再次取得重大突破!越狱门槛还挺高

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

沙特被指3月曾对伊朗发动多次“报复性”空袭

无障碍浏览 进入关怀版