网易首页 > 网易号 > 正文 申请入驻

F5携手NVIDIA提升AI工厂经济效益,赋能加速AI推理

0
分享至

  基于NVIDIA BlueField DPU加速的 F5 BIG-IP Next for Kubernetes 实现更高Token吞吐、更低单Token成本,并支持安全的多租户AI基础设施,助力智能体时代下的AI工厂转型。

  西雅图-全球领先的应用交付和API安全解决方案提供商F5(NASDAQ: FFIV)日前宣布,进一步扩展与NVIDIA的深度合作,旨在加速并优化AI推理基础设施。

  此次升级整合了F5 BIG-IP Next for Kubernetes与 NVIDIA BlueField-3 DPU,构建出具备智能化与遥测感知能力的基础设施层。在提升GPU利用率的同时,该解决方案能够显著提升GPU利用率及Token吞吐量、降低时延,并支持在大规模环境下构建安全的多租户AI平台。

  在AI系统中,Token是衡量AI输出的基本单位,即在推理过程中生成和处理的词语、符号或数据片段。Token产出的规模与速度,直接决定了用户体验、基础设施效率以及单加速器的收益能力。

  随着企业与GPU即服务(GPUaaS)提供商加速推动AI商业化,并从实验阶段迈向规模化创收,基础设施效率正成为关键衡量指标。当前,行业衡量标准正从单纯的GPU部署规模,转向更精细化的Token经济指标,包括Token吞吐量、首个Token时间(TTFT)、单Token成本以及单GPU收入等。F5与NVIDIA的联合解决方案,正是围绕这些核心指标进行优化设计,助力客户实现AI投资回报最大化。

通过智能化 AI 基础设施优化 Token 经济性

  从以应用为中心的推理转向由智能体驱动的AI工作流,迫切需要新的架构设计,以提升token吞吐效率并降低成本。F5 BIG-IP Next for Kubernetes现已深度集成NVIDIA NIM 统计数据、Dynamo运行时信号以及GPU遥测信息,实现在推理执行前即可进行感知推理状态的流量调度决策。通过实时将工作负载匹配至最合适的加速器资源,该解决方案在提升持续利用率的同时,有效降低推理时延与重复计算。

  F5首席产品官Kunal Anand表示,“AI基础设施已不再只是获取GPU资源或扩大部署规模,而是演进为如何最大化单块加速器所产生的经济价值。通过与NVIDIA的合作,我们助力AI工厂将Token产出转化为可量化的业务指标。BIG-IP Next for Kubernetes提供所需的智能调度与治理能力,帮助企业提升GPU产出效率、降低单Token成本,并更自信地扩展共享型AI平台。”

经验证的基础设施效率提升:结构性跃迁

  性能数据充分印证了这一点。在The Tolly Group的验证测试中,基于NVIDIA BlueField-3 DPU加速的F5 BIG-IP Next for Kubernetes,实现了最高达40%的Token吞吐提升、首个Token时间加快61%,以及整体请求时延降低34%。

  这并非渐进式优化,而是架构层面的效率跃迁。通过将网络处理、TLS/加密、AI感知负载均衡及流量管理等任务卸载至NVIDIA BlueField-3 DPU,BIG-IP Next for Kubernetes能够有效释放主机CPU资源,并让GPU专注于其核心职责,即在大规模场景下执行持续、高吞吐的AI推理计算。这一架构实现了GPU利用率显著提升、排队延迟减少,以及Token产出能力增强,从而在固定基础设施规模下实现更低的单Token成本。更为关键的是,这一系列性能提升无需对模型本身进行任何修改,可直接应用于现有AI工厂基础设施。对于在Token经济学赛道展开竞争的企业及NeoCloud服务提供商而言,这意味着从限制AI产出的基础设施,迈向加速AI产出的关键转变。

  NVIDIA网络业务高级副总裁Kevin Deierling表示,“NVIDIA加速计算基础设施与F5具备AI的应用交付与安全平台相结合,能够显著提升AI工厂的Token 经济效益,并在无需修改模型的前提下,实现可扩展且具备成本效率的推理能力。F5与NVIDIA正携手助力企业以更高效、更经济的方式扩展AI工厂推理能力。”

面向智能体驱动AI与多租户平台构建

  现代AI工作负载正日益呈现出智能体驱动、持久化与上下文感知。这类新型负载对流量调度提出了更高要求,传统负载均衡已难以胜任。F5 BIG-IP Next for Kubernetes增强版现已支持以下核心能力:

  ·面向智能体AI工作流的推理感知路由。

  ·集成NVIDIA DOCA Platform Framework(DPF),简化NVIDIA BlueField DPU的部署与全生命周期管理。

  ·基于EVPN-VXLAN与动态VRF的网络级多租户隔离能力。

  ·在Kubernetes AI环境中内建安全能力、Token治理与可观测性。

  这些能力赋能企业与NeoCloud服务提供商能够在共享 GPU 基础设施的同时,实现跨业务单元或外部客户的安全隔离,在保障性能隔离性的前提下,维持可预测的服务水平。

面向AI工厂经济学的控制平面

  F5与NVIDIA为企业提供经过验证的工具与最佳实践,助力优化推理架构。基于上述能力升级,F5 BIG-IP Next for Kubernetes正在演进为AI工厂经济学的战略级控制平面,实现治理Token消耗、优化流量路径,并最大限度地提升基础设施的投资回报率(ROI)。

  基于此,企业无需再通过过度资源预留来弥补效率损耗,而是能够从现有已部署GPU资源中释放更高的经济价值。由此带来一系列关键业务收益,包括:单GPU收入提升、运维成本降低,并能构建起支撑持续增长的可扩展AI服务。通过深度融合NVIDIA的基础设施遥测与DPU加速能力,以及F5在流量智能与安全领域的核心优势,双方正助力企业将AI工厂从计算资源平台转化为高效、可变现的业务平台,从而为智能体时代做好充分准备。

附加资源

· 博客文章:AI工厂需要智能化基础设施:The Tolly Group最新测试结果深度解析
·技术报告:The Tolly Group独立测试报告:F5 BIG-IP Next for Kubernetes性能验证全记录

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
49岁的她穿条睡裤去看球,竟把全场贵妇装秒成了渣

49岁的她穿条睡裤去看球,竟把全场贵妇装秒成了渣

娱圈观察员
2026-07-01 00:54:24
最快18分钟直达广州!今天,广东这一新高铁站正式开通

最快18分钟直达广州!今天,广东这一新高铁站正式开通

匹夫来搞笑
2026-07-01 17:57:02
75岁好莱坞女星自曝:有一种健身我打死不碰,因太好强怕进医院

75岁好莱坞女星自曝:有一种健身我打死不碰,因太好强怕进医院

热搜摘要官
2026-06-30 00:59:43
亚马尔:我达不到梅罗的高度;若小蜘蛛来巴萨会张开双臂欢迎他

亚马尔:我达不到梅罗的高度;若小蜘蛛来巴萨会张开双臂欢迎他

懂球帝
2026-07-01 17:33:05
美联储,重磅来袭!科技股,盘前大跌

美联储,重磅来袭!科技股,盘前大跌

证券时报
2026-07-01 18:33:09
大家都抢军校警校,没人留意这5条小路,低分考生偷偷捡大漏

大家都抢军校警校,没人留意这5条小路,低分考生偷偷捡大漏

户外阿毽
2026-06-29 18:29:28
人民日报痛批车企:新能源车越大、越重越不安全;给社会造成负担

人民日报痛批车企:新能源车越大、越重越不安全;给社会造成负担

胡同里有只猫A
2026-06-30 17:50:01
她是著名歌唱家,与著名大导演离婚,带儿子嫁高官,如今定居北京

她是著名歌唱家,与著名大导演离婚,带儿子嫁高官,如今定居北京

嘴角上翘的弧度
2026-06-29 20:36:25
詹姆斯离开湖人原因曝光!彻底拆队:斯玛特、八村、肯纳德全走了

詹姆斯离开湖人原因曝光!彻底拆队:斯玛特、八村、肯纳德全走了

Tracy的篮球博物馆
2026-07-01 10:11:52
菲总统府被围,首都一片混乱,焦头烂额的马科斯,对华喊出一句话

菲总统府被围,首都一片混乱,焦头烂额的马科斯,对华喊出一句话

青烟小先生
2026-07-01 17:09:28
国家正式出手!住院护工大洗牌,以后老人看病不用子女熬夜

国家正式出手!住院护工大洗牌,以后老人看病不用子女熬夜

据说说娱乐
2026-06-29 09:34:53
IBM盗用“韬定律”?

IBM盗用“韬定律”?

西楼饮月
2026-06-30 22:57:46
装不装空调,在欧洲成了政治议题

装不装空调,在欧洲成了政治议题

参考消息
2026-06-30 18:40:34
现货黄金突破4080美元/盎司,日内涨1.84%

现货黄金突破4080美元/盎司,日内涨1.84%

每日经济新闻
2026-07-01 21:49:18
荷兰贸易大臣率阿斯麦等17家企业访华!临行承诺:绝不提台湾问题

荷兰贸易大臣率阿斯麦等17家企业访华!临行承诺:绝不提台湾问题

策前论
2026-06-30 23:24:18
1572天的惊天乱账!俄乌伤亡数据全是假的,真实损耗远超认知。

1572天的惊天乱账!俄乌伤亡数据全是假的,真实损耗远超认知。

阿七说史
2026-06-29 15:41:56
主力资金 | 7股遭主力资金大幅出逃

主力资金 | 7股遭主力资金大幅出逃

数据宝
2026-07-01 21:07:45
Shams:科林斯和公牛达成2年1700万美元的提前续约合同

Shams:科林斯和公牛达成2年1700万美元的提前续约合同

北青网-北京青年报
2026-07-01 19:54:02
托卡耶夫的话把俄媒气坏了,邻国总统亲自给俄罗斯上眼药

托卡耶夫的话把俄媒气坏了,邻国总统亲自给俄罗斯上眼药

新一说史
2026-06-22 12:17:39
2分钟涨停!002407,3连板

2分钟涨停!002407,3连板

证券时报
2026-07-01 10:13:08
2026-07-01 23:03:00
过往看客
过往看客
每天不停的吧啦吧啦的说
1840文章数 28关注度
往期回顾 全部

科技要闻

Claude Code被曝“植入木马”识别中国用户

头条要闻

前往日本周边海域的中国军舰 在日本防卫省网站"刷屏"

头条要闻

前往日本周边海域的中国军舰 在日本防卫省网站"刷屏"

体育要闻

卖球衣救子的门将,把德国扑出了世界杯

娱乐要闻

张凌赫:我连心疼你都隔着时差

财经要闻

新氧贷款:宣传年化15%,实际顶格24%

汽车要闻

上半年累计销量突破142万辆 吉利6月销量出炉

态度原创

数码
家居
本地
艺术
时尚

数码要闻

GPD预告9.06" PC掌机WIN MAX 3,Max+ 395 / 388处理器

家居要闻

传奇筑 日常诗

本地新闻

强烈建议,全国高校都向这所大学看齐!

艺术要闻

西安美术学院,2026届油画系硕士研究生毕业作品选(二)

Meiinpsn的穿衣风格,清新又叛逆

无障碍浏览 进入关怀版