网易首页 > 网易号 > 正文 申请入驻

Arrcus推出策略感知网络架构解决AI推理瓶颈

0
分享至


随着AI使用规模的持续扩大,一种独特的应用流量正在对网络产生影响。问题不在于训练,而在于推理。

训练在可预测的时间表上运行于集中式集群中。而推理是分布式的,对延迟敏感,并受制于功耗可用性、数据主权和成本等实时约束。路由这些流量的网络架构正日益成为瓶颈,传统的硬件定义网络并非为处理这种情况而构建。

这正是Arrcus要解决的问题。这家位于圣何塞的网络软件公司花费了十年时间构建ArcOS,这是一个旨在将路由和交换工作负载与专有硬件解耦的网络操作系统。该公司向数据中心、电信和企业市场销售产品,在全球数千个网络节点中投入生产运行。本周,Arrcus报告称2025年的订单增长了三倍,并宣布推出Arrcus推理网络架构(AINF),这是一款专门构建用于在分布式基础设施中动态引导AI推理流量的产品。

Arrcus董事长兼首席执行官Shekar Ayyar告诉Network World:"为了通过改善响应时间来促进智能体AI的采用,网络需要变得具有AI感知能力。"

理解ArcOS的实际作用

要理解Arrcus在AINF方面的工作,需要了解ArcOS到底是什么,以及它相对于SONiC或VMware的NSX等其他网络技术的定位。

SONiC是一个专注于交换的操作环境,适合希望通过直接的数据包转发来扩展数据中心容量的运营商。NSX在虚拟化层作为计算环境的网络覆盖层运行。ArcOS在第3层工作,专为策略丰富的路由使用案例而设计:运营商的5G网络切片、数据中心互连,以及可编程流量引导重要的环境。软银部署Arrcus进行SRv6移动用户平面是一个公开披露的例子。

Ayyar解释说:"交换本质上是一个更简单的操作。你只是发送一个数据包或者不发送。路由是一个更复杂的操作。你告诉数据包去哪里以及做什么。在路由方面,你拥有更多的丰富性和策略。"

这种策略丰富的路由基础正是Arrcus现在应用于AI推理的核心。

应对分布式推理的挑战

随着AI工作负载从集中式训练转向分布式推理,网络面临着不同类别的需求。

推理节点在地理上分散分布,必须同时满足延迟、吞吐量、功耗容量、数据驻留和成本等约束条件。这些约束因位置而异,并实时变化,而传统的硬件定义网络并非设计用于动态处理这些约束。

Ayyar说:"这些推理节点现在将变得极其重要,需要准确理解这些推理点的确切约束是什么。你是否有功耗约束?是否有延迟约束?是否有吞吐量约束?如果有,你将如何引导和操控你的流量?"

AINF通过在基于Kubernetes的编排和底层硅片之间引入策略抽象层来解决这个问题。模型通过API接口公开其需求,披露所需参数。这些需求流向路由层,相应地引导流量。

Ayyar说:"可以把我们想象成加速所有这些需求找到通往路由器路径的过程,然后指导位于这个庞大网络节点网中适当位置的路由节点做正确的事情,以满足推理策略。"

运营商定义包括延迟目标、数据主权边界、模型偏好和功耗约束在内的业务策略。AINF实时评估这些条件,并将推理流量引导到最优节点或缓存。组件包括基于查询的推理路由与策略管理、互连路由器和边缘网络。该系统与vLLM、SGLang和Triton推理框架集成。前缀感知用于优化KV缓存使用,帮助推理应用程序满足吞吐量、延迟、数据主权、功耗和成本的服务级目标。

面临的挑战与前景

Ayyar指出了采用的两个近期障碍。首先是认知度。他注意到许多潜在客户一直在设计推理架构时没有将策略感知架构作为一个选项来考虑。其次是现有厂商的锁定,思科和Juniper的用户需要确保AINF能够与现有基础设施干净地互操作。Ayyar表示,Arrcus在互操作性测试方面进行了大量投资来解决这个问题。

Arrcus预计在2026年的订单将超过1亿美元,这个目标是在AINF做出任何贡献之前设定的。该公司计划在巴塞罗那移动世界大会和圣何塞的Nvidia GTC上展示该产品。

Ayyar说:"我们看到的关于AI和AI相关基础设施的所有讨论大多只是冰山一角。人们还没有意识到的是水下的东西,我们相信效率提升和有效性提升就隐藏在水下。一旦这些浮现出来,就像在上面投射X光透视,让人看到,瞧,这就是世界的发展方向。现在就开始吧。"

Q&A

Q1:Arrcus推理网络架构AINF是什么?它能解决什么问题?

A:AINF是Arrcus开发的一款专门用于动态引导AI推理流量的网络产品。它通过在Kubernetes编排和底层硬件之间引入策略抽象层,能够根据延迟、功耗、数据主权等实时约束条件,智能地将推理流量引导到最优的节点或缓存,解决分布式AI推理中的网络瓶颈问题。

Q2:ArcOS与SONiC、VMware NSX有什么区别?

A:SONiC专注于交换操作,适合需要扩展数据中心容量的简单数据包转发;VMware NSX在虚拟化层作为计算环境的网络覆盖层;而ArcOS工作在第3层,专为策略丰富的路由使用案例设计,如5G网络切片、数据中心互连等需要可编程流量引导的复杂环境。

Q3:为什么AI推理比训练对网络要求更高?

A:AI训练在可预测时间表上运行于集中式集群,而推理是分布式的、对延迟敏感的。推理节点地理分散,必须同时满足延迟、吞吐量、功耗、数据驻留和成本等多种约束,这些约束因位置而异且实时变化,传统网络无法动态处理这些复杂需求。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
英格兰2026世界杯阵容预测:首发11人+26人大名单全解析,贝林厄姆成最大悬念

英格兰2026世界杯阵容预测:首发11人+26人大名单全解析,贝林厄姆成最大悬念

夕落秋山
2026-02-25 14:35:25
玩心挺重!莫雷加德单局6-3做实验险被翻盘,3-0稳稳晋级16强

玩心挺重!莫雷加德单局6-3做实验险被翻盘,3-0稳稳晋级16强

乒谈
2026-02-25 20:24:57
她拒唱国歌,否认中国籍,俩儿子也落户国外,如今她过得怎么样了

她拒唱国歌,否认中国籍,俩儿子也落户国外,如今她过得怎么样了

阅微札记
2026-02-25 16:56:12
28岁北京独子王荻娶50岁德国妻子,宁断香火也要成婚,现状太意外

28岁北京独子王荻娶50岁德国妻子,宁断香火也要成婚,现状太意外

谈史论天地
2026-02-25 06:53:06
星链大降价!马斯克:无关竞争对手 我只想平价服务大众

星链大降价!马斯克:无关竞争对手 我只想平价服务大众

快科技
2026-02-25 10:33:12
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
全国统一执行!3月1日起,公职人员戴上紧箍咒,老百姓迎来大便利

全国统一执行!3月1日起,公职人员戴上紧箍咒,老百姓迎来大便利

福建平子
2026-02-25 10:54:52
悲剧!20岁球员生日夜殴打母亲 决绝跳海赴死:第1次失败后重跳

悲剧!20岁球员生日夜殴打母亲 决绝跳海赴死:第1次失败后重跳

风过乡
2026-02-25 10:32:10
女护士处理男患者隐私部位,会感觉难为情吗?美女护士说出大实话

女护士处理男患者隐私部位,会感觉难为情吗?美女护士说出大实话

第7情感
2025-09-17 12:12:15
李亚鹏年初六到陈光标家做客!为陈光标儿子送行,陈太太罕见露脸

李亚鹏年初六到陈光标家做客!为陈光标儿子送行,陈太太罕见露脸

洲洲影视娱评
2026-02-25 15:25:18
公司市值近百亿!“关键先生”除夕前去世,享年61岁……5天前还在开会

公司市值近百亿!“关键先生”除夕前去世,享年61岁……5天前还在开会

上观新闻
2026-02-25 14:12:07
国家税务总局:2月25日起个税综合所得年度汇算清缴可以预约办理

国家税务总局:2月25日起个税综合所得年度汇算清缴可以预约办理

中国能源网
2026-02-25 10:17:12
欧冠奖金曝光 小组赛踢完拜仁就拿1亿欧 倒数第一也超2000万欧

欧冠奖金曝光 小组赛踢完拜仁就拿1亿欧 倒数第一也超2000万欧

智道足球
2026-02-25 20:05:49
WTT新加坡大满贯:女单16强诞生!国乒7人日本6人,伊藤美诚过关

WTT新加坡大满贯:女单16强诞生!国乒7人日本6人,伊藤美诚过关

全言作品
2026-02-25 21:05:41
港股总市值升至50万亿港元 香港有望在一两年内成为全球最大的跨境财富管理中心

港股总市值升至50万亿港元 香港有望在一两年内成为全球最大的跨境财富管理中心

每日经济新闻
2026-02-25 17:15:06
卫冕冠军高歌猛进!孙颖莎3-1力克欧洲老将,1/8决赛将迎来德比战

卫冕冠军高歌猛进!孙颖莎3-1力克欧洲老将,1/8决赛将迎来德比战

钉钉陌上花开
2026-02-25 20:37:23
新娘爸爸婚礼现场退还18.8万彩礼?新娘回应:是真的,一开始就没想过要收彩礼

新娘爸爸婚礼现场退还18.8万彩礼?新娘回应:是真的,一开始就没想过要收彩礼

扬子晚报
2026-02-25 07:33:40
卢比奥是继基辛格、康.赖斯以来,美国最出色的国务卿!

卢比奥是继基辛格、康.赖斯以来,美国最出色的国务卿!

百态人间
2026-02-25 15:35:06
网传被判赔小米500万元的自媒体账号实控人为李斌,相关人士否认

网传被判赔小米500万元的自媒体账号实控人为李斌,相关人士否认

IT之家
2026-02-25 20:14:13
省委批准:开除焦卫星党籍!升正厅不到5个月落马

省委批准:开除焦卫星党籍!升正厅不到5个月落马

上观新闻
2026-02-25 14:54:04
2026-02-25 22:07:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
16299文章数 49691关注度
往期回顾 全部

科技要闻

“机器人只跳舞,没什么用”

头条要闻

被指涉爱泼斯坦案 挪威前首相自杀未遂命悬一线

头条要闻

被指涉爱泼斯坦案 挪威前首相自杀未遂命悬一线

体育要闻

曝雄鹿计划今夏追小卡 字母哥渴望与其并肩作战

娱乐要闻

黄晓明新恋情!与小22岁美女同游新加坡

财经要闻

上海楼市放大招,地产预期别太大

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

艺术
游戏
家居
本地
公开课

艺术要闻

这位艺术家的马赛克画让人惊叹不已!

曾经跟GTA叫板的IP日薄西山了!母公司始终保持沉默

家居要闻

艺居办公 温度与效率

本地新闻

津南好·四时总相宜

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版