网易首页 > 网易号 > 正文 申请入驻

迈向Token经济时代,F5以“AI赋能交付”筑基智能新生态

0
分享至

这也是AI应用落地进入新阶段后出现的关键变化。过去,企业关注的是模型能否生成结果。而现在,企业还需要解决推理请求如何在异构算力之间高效调度、首Token时延如何进一步压缩、GPU利用率如何持续提升、AI应用如何在多云和跨区域环境下实现安全、稳定、合规运行等问题。

围绕这一变化,F5 给出的思路是将其长期积累的应用交付能力,进一步延伸至AI应用交付与安全平台。其核心逻辑是通过其ADSP平台,基于Token的负载均衡方案TBLB(Token Based Load Balancing),以及 “AI红队”“AI护栏”与自动化修复能力,把算力、应用、Token和安全纳入同一套交付体系,进行统一治理。

01 Token经济改写应用交付逻辑

其实,F5三十年的发展始终随着应用形态变化而演进。

1996年,F5推出BIG-IP,围绕互联网应用的稳定性、扩展性和访问性能,推动ADC应用交付控制能力的发展。

进入云计算阶段后,应用加速云化、API化和微服务化,F5的能力也扩展到私有云、公有云和多云环境,进入ADC 2.0阶段。

到了AI时代,应用形态再次变化。大模型、智能体、数据、API和算力基础设施共同构成新的应用体系。“如今,企业需要处理的不再仅仅是传统访问流量,更多的是模型调用、推理排队、Token生成、AI安全防护和跨云协同等问题。”F5北亚区总裁黄彦文指出。


F5北亚区总裁 黄彦文

应用交付对象发生变化后,衡量交付效率的单位也随之变化。F5中国区产品及解决方案总经理陈亮提到,目前中国每天产生的Token规模已达到约140万亿,折算约为每秒16亿Token。当交付规模进入这一量级后,Token 已不再只是模型输出的计量单位,而开始直接对应计算成本、资源消耗、用户体验以及最终的业务价值。

换句话说,每一次Token的生成、调度与交付效率,都会影响企业的AI投入产出比。

围绕Token经济,陈亮提出了四个核心支柱。其一,AI 集群的高并发供给能力决定 Token的生产能力,是整个系统的产能底座;其二,首Token 时延与端到端响应流畅度直接影响用户体验;其三,单位Token的 ROI 决定企业的经济效益;其四,全链路安全能力与长期运行稳定性,决定AI应用能否实现持续、可靠交付。

本质上来看,这是一套围绕Token构建的交付体系,覆盖生成、传输、调度到安全防护的完整生命周期。

02 TBLB解决异构算力的调度难题

当Token成为新的治理对象,算力调度的复杂性也被进一步放大。尤其在中国市场,很多企业会同时使用NVIDIA、AMD、华为、寒武纪、海光信息等不同品牌、不同代际的算力资源。


这种部署方式虽然提升了灵活性,但也带来了模型适配和调度的复杂度。

原因在于,AI推理请求并不像普通Web请求,其代码重构、视频生成、图像生成、文档总结等任务,对后端GPU、模型和推理引擎的消耗并不相同。如果调度系统只能基于连接数、请求数或服务器状态进行分发,就容易出现部分GPU节点拥塞、部分节点低负载的情况。

这也正是F5提出TBLB的背景。在这一机制中,Token除了作为模型输出的计量单位,更作为资源调度的核心对象。系统会结合大模型服务(LLM)运行状态、算力负载、请求排队情况、Token时延,以及推理成功率等信息,实时完成任务分发与资源匹配。


其关键逻辑在于,让不同类型、不同优先级的推理任务,匹配更合适的算力资源,从而在保障响应体验的同时,提高整体资源利用效率。

从具体场景来看,TBLB的价值体现在提升既有资源的使用效率上。

就比如,某汽车行业客户采用6块NVIDIA A40与8块L20的混合部署,通过F5的赋能,在未增加额外算力投入的情况下,实现了首Token生成速度提升30.3%,端到端访问速度提升48.68%;某运营商客户基于华为Ascend 910B算力资源,引入F5能力后,并发用户承载能力提升至少75%,首Token生成速度提升99%。另一家银行业的客户,采用3块阿里平头哥PPU与3块NVIDIA H20的异构架构,优化后首Token生成速度提升42.2%,Token输出流畅度提升7.1%。

F5亚太区首席技术官Mohan Veloo从成本视角解释了这一能力的意义。在他看来,企业建设AI工厂往往意味着数十亿美元级别的算力投入,因此,即便GPU综合利用率仅提升20%,也足以释放可观的经济价值。尤其在GPU采购成本持续增加、供给周期较长、硬件迭代不断加速的背景下,相比持续追加采购,更可持续的路径,是优先激活并释放既有算力资源的潜力。


F5亚太区首席技术官 Mohan Veloo

03 同步推进AI安全闭环与本土创新

如果说TBLB解决的是AI推理阶段的交付效率问题,那么F5围绕AI应用交付平台提供的“AI红队”(AI Red Teaming)与“AI护栏”(AI Guardrails)能力,解决的则是AI应用规模化后的安全治理问题。前者负责主动发现风险,后者负责在运行时防护,两者共同构成AI应用交付过程中的安全闭环。

原因在于,随着Token交付链路不断延长、模型调用场景持续复杂化,AI系统暴露出的攻击面也在快速扩大。企业面对的风险,开始延伸至模型输入、推理过程与输出结果的全链路安全。

Mohan Veloo指出,AI正在改变攻防关系。攻击者已经能够借助AI更快生成攻击载荷、发现漏洞并实现自动化利用,而许多企业的防御体系仍停留在依赖人工研判与静态规则的阶段。这种“攻击自动化、防御人工化”的能力失衡,正在持续放大安全压力。

对此,F5的策略是,通过引入AI能力,形成“发现—防护—修复”的完整闭环。

具体来说,AI红队承担了发现风险的角色,通过AI智能体模拟真实用户行为和攻击路径,对提示词注入、数据泄露、越权访问、越狱攻击等风险进行持续探测。AI护栏则部署在模型调用链路中,对输入、输出以及上下文交互过程进行实时语义分析、策略控制与风险拦截,实现运行时治理。

进一步地,AI红队发现的问题还能够自动调用为AI护栏策略,并结合虚拟补丁能力完成持续修复,在不中断业务运行的前提下缓解安全风险,从而形成从发现到治理再到修复的闭环能力。

从第三方评测结果来看,在SecureIQLab测试中,F5 的AI护栏面对约2万次攻击取得98.36%的总体安全得分。其中,直接提示词注入防御达到99.3%,过度代理防护达到98.7%,敏感数据泄露防护达到99.0%。


针对中文应用场景,F5还基于清华大学公开发布的中文大模型安全数据集进行了验证。材料显示,在脏话侮辱、违法犯罪、偏见歧视等多类敏感内容识别,和指令型攻击场景下F5整体保持领先。

安全能力之外,F5也将AI用于自身服务体系建设。

陈亮介绍,F5已在内部服务体系中引入大模型能力,并命名为ServiceGPT。通过该系统可以打通产品开发体系、知识库、案例系统,辅助服务团队快速完成问题定位与根因分析,使问题研判效率提升约23%,平均定位时间缩短至约0.8天。

这些能力建设,也对应着F5中国战略方向的调整。

黄彦文提到,F5中国战略已从“创新中国,服务中国”升级为“创新中国,链接全球”。TBLB、ServiceGPT,以及新成立的F5 AI应用工程部,都是中国团队推动形成的本土创新成果。这也意味着,中国市场正在成为原创能力向全球输出的重要节点。

在生态层面,F5北亚区区域副总裁及解决方案资深架构咨询师张振伦补充表示,F5将持续投入全球及中国开源生态建设,NGINX也将继续保持开源版本迭代更新。面向中国AI生态,F5计划兼容国内主流推理引擎、开源组件与开发平台,帮助开发者和企业用户更顺畅地接入AI创新能力与安全能力。

此外,针对Kubernetes生态中部分入口控制器后续维护策略调整带来的影响,陈亮表示,作为CNCF黄金会员,F5将持续投入技术与资源,为用户提供成熟、平滑的迁移替代路径。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
首映轰下3537万,《四渡》强势夺冠,好莱坞超级英雄大片被打懵了

首映轰下3537万,《四渡》强势夺冠,好莱坞超级英雄大片被打懵了

电影票房预告片
2026-06-26 23:59:32
全红婵现身杭州,带“娃”乘坐西湖摇橹船,一路拍拍拍;网友:全妹瘦了

全红婵现身杭州,带“娃”乘坐西湖摇橹船,一路拍拍拍;网友:全妹瘦了

大象新闻
2026-06-27 12:46:05
6月27日,2026年退休人员养老金调整通知公布了吗?补发700元难吗

6月27日,2026年退休人员养老金调整通知公布了吗?补发700元难吗

社保小达人
2026-06-27 10:15:34
比韩国还脏!首个世界冠军出局,粗野踢法输球输人,三大败因曝光

比韩国还脏!首个世界冠军出局,粗野踢法输球输人,三大败因曝光

吴蛛旅行ing
2026-06-27 12:02:32
陈露宣布与过去和解!泪流满面,称13年把全部青春给了爱的男孩

陈露宣布与过去和解!泪流满面,称13年把全部青春给了爱的男孩

乡野小珥
2026-06-26 07:13:35
从涨停到跌停,超4万股民坐上过山车!东北老牌药企发生了什么

从涨停到跌停,超4万股民坐上过山车!东北老牌药企发生了什么

21世纪经济报道
2026-06-27 14:58:57
投资大佬罕见发出警告:A股热门票恐跌八九成,崩盘倒计时开始?

投资大佬罕见发出警告:A股热门票恐跌八九成,崩盘倒计时开始?

晓帝爱八卦
2026-06-27 12:33:27
毛岸英入朝作战牺牲,主要责任人是谁?毛主席其实早就点明过真相

毛岸英入朝作战牺牲,主要责任人是谁?毛主席其实早就点明过真相

听风行天涯
2026-06-25 17:37:54
封杀12年,50岁黄海波定居北京,开办表演培训班,妻子对他不离弃

封杀12年,50岁黄海波定居北京,开办表演培训班,妻子对他不离弃

做一个合格的吃瓜群众
2026-06-27 15:41:38
吴越后台偶遇陈建斌侧身避开,成年人的边界,不必勉强大度

吴越后台偶遇陈建斌侧身避开,成年人的边界,不必勉强大度

草莓解说体育
2026-06-19 14:10:53
没有尊严的百姓,没有人性的精英,没有未来的王朝!

没有尊严的百姓,没有人性的精英,没有未来的王朝!

梦归秋辰
2026-06-26 16:38:01
别被本科线骗了,今年真正能上本科的分,比你想象的高

别被本科线骗了,今年真正能上本科的分,比你想象的高

牛锅巴小钒
2026-06-26 11:53:43
查分页面跳出467,母子俩沉默了一秒,下一秒,开夜班出租的妈妈说出的话,让所有人破防

查分页面跳出467,母子俩沉默了一秒,下一秒,开夜班出租的妈妈说出的话,让所有人破防

台州交通广播
2026-06-26 15:42:50
革命卫队为何如此霸道?在海峡上犯了三个严重错误,已成地区公害

革命卫队为何如此霸道?在海峡上犯了三个严重错误,已成地区公害

林子说事
2026-06-26 14:39:34
增强成人内容生成,已成马斯克旗下Grok的主要流量增长策略

增强成人内容生成,已成马斯克旗下Grok的主要流量增长策略

不看车bukanche
2026-06-25 11:12:54
留美专家发声呼吁国人反思:中国应专心搞建设,劝说放弃核武器

留美专家发声呼吁国人反思:中国应专心搞建设,劝说放弃核武器

易昂杨
2026-06-27 12:33:15
美国没想到,俄罗斯也没料到,连中国自己都不敢想!

美国没想到,俄罗斯也没料到,连中国自己都不敢想!

粤语音乐喷泉
2026-06-27 14:57:56
委内瑞拉震后24小时,美军开进灾区时,中国救援队就地开工

委内瑞拉震后24小时,美军开进灾区时,中国救援队就地开工

甜到你心坎
2026-06-27 04:23:58
河南南阳通报“‘无主’冻货在南阳被查扣并拍卖”:依法查处无检验检疫合格证明的冷冻肉食品,涉事均为过境车辆,拍卖期间未收到认领申请

河南南阳通报“‘无主’冻货在南阳被查扣并拍卖”:依法查处无检验检疫合格证明的冷冻肉食品,涉事均为过境车辆,拍卖期间未收到认领申请

大风新闻
2026-06-26 15:21:55
广东队,CBA新赛季主教练3选1

广东队,CBA新赛季主教练3选1

体育哲人
2026-06-26 23:11:44
2026-06-27 17:43:00
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
19621文章数 49712关注度
往期回顾 全部

科技要闻

GPT-5.6发布,你暂时用不了!Mythos也放行

头条要闻

美媒对比亮了:世界各国都在争抢石油 中国仍接近满仓

头条要闻

美媒对比亮了:世界各国都在争抢石油 中国仍接近满仓

体育要闻

世界杯最火门将,站到了阿根廷和梅西面前

娱乐要闻

四提白玉兰终封后,杨紫:仍觉不真实

财经要闻

OpenAI推迟IPO重创软银!

汽车要闻

首搭华为乾崑智驾ADS5 启境GT7上市售价20.99万-32.99万元

态度原创

家居
旅游
教育
房产
军事航空

家居要闻

绿意盎然 自然之境

旅游要闻

偶遇“万商之门”脚下的白鹭洲雨水花园,绿意葱茏且野趣盎然

教育要闻

25万位次考生能上河南师范大学?心动吗?中外合作办学第一年招生,电气专业及自动化 物理学 计算机 专业多多任你选

房产要闻

全国高考大放水,300分就能上本科!论上岸率,海南没输过!

军事要闻

黎以美达成三方框架协议

无障碍浏览 进入关怀版