提升AI智能体工作流的速度与能效|客户端节点

提升AI智能体工作流的速度与能效

2026-06-25 22:19:04　来源: 至顶科技

北京举报

分享至

智能体工作流是一种由AI驱动的软件系统，它通过串联多个模型与外部工具来处理复杂任务，例如分析视频并回答相关问题。

然而，这类高度分散化系统在设计和部署方式上往往存在效率问题，导致算力、能源和成本的浪费。

为了提升效率，麻省理工学院与微软的研究人员联合开发了一套智能系统，旨在简化智能体工作流的设计流程，并自动优化工作流的执行方式。

借助这一新方法，开发者只需用自然语言描述希望工作流实现的功能，无需提前逐一指定应用的所有技术细节。

系统会自动确定最适合的模型与工具，并在云服务商执行工作流时，自动配置最优的硬件方案和算力资源分配策略。

同时，系统会根据每位用户的优先需求——例如降低成本或提升速度——动态调整配置方案。

在多项智能体工作负载测试中，与传统方法相比，这套新系统在不影响性能的前提下，显著减少了部署所需的计算单元数量，大幅降低了能耗与成本。

"智能体工作流正变得越来越复杂，并迅速成为云服务商业务的核心支撑。能源消耗是一个重大问题，因此我们必须高度关注工作流的效率。资源过度分配极易发生，进而造成能源和资金的浪费。让云服务商能够智能地优化这些工作流的资源利用，对所有相关方来说都是一件好事。"论文第一作者、麻省理工学院电气工程与计算机科学系博士生 Gohar Chaudhry 表示。

论文的其他作者包括：麻省理工学院电气工程与计算机科学系副教授、MIT计算机科学与人工智能实验室成员 Adam Belay，以及微软Azure技术研究员兼公司副总裁、通讯作者 Ricardo Bianchini 等来自微软Azure的研究人员。该论文将在USENIX操作系统设计与实现研讨会上正式发表。

配置难题

智能体工作流是由多个自主AI智能体协同构成的系统，这些智能体通过调用各类模型与工具（如数据库或Python程序），动态完成数据处理、代码生成等多步骤任务。

这类工作流通常作为后台进程，为面向用户的应用程序提供支撑。

传统做法要求开发者在开发阶段就将所有技术选型硬编码固定。他们需要明确选用哪些AI智能体、模型和工具，以及调用顺序，还需指定运行工作流的硬件配置，并在速度与成本等方面进行权衡。

这一过程尤为复杂，因为智能体工作流往往整合了多个黑盒模型和各类工具，每个组件都有各自的配置选项，而这些组件可能来自不同的厂商。

一旦有新的AI模型发布，可以提升应用的精度或效率，开发者就不得不推倒重来。

"即便你想手动完成所有配置，也很难达到最优效果，因为可能的配置空间实在太大了。"Chaudhry 说。

此外，为用户部署应用的云数据中心无法深入工作流内部，也就难以在用户发起请求时以最高效的方式分配硬件资源。

为此，研究团队开发了这套名为 Murakkab 的新系统——这是一个乌尔都语词汇，意为"多种事物的组合"——旨在对整个智能体工作流进行全面优化。

动态决策机制

首先，Murakkab 允许开发者以高层次的语言描述应用意图来创建智能体工作流，而无需详细说明工作流各组件的具体组合方式。

例如，开发者可以描述一个视频问答应用，该应用需提取关键帧、生成文字记录，并回答用户关于视频内容的问题。

"实现这一目标的方式有很多，而不同的模型和工具选择，都会影响应用完成任务的速度。"他说。

Murakkab 会根据开发者的简单描述，自动识别并整合最合适的现有模型与工具，构建完整的工作流。

系统还会判断哪些组件需要顺序执行，哪些可以并行处理，以提升整体性能。

"该平台会随时间动态调整配置决策，因此即使明天出现了新的模型或GPU加速器，开发者也无需为此担心。"他说。

当云服务商为用户部署该应用时，Murakkab 会根据用户的约束条件（如在满足延迟要求的前提下优先保障精度）对工作流进行优化，实时动态识别最优硬件分配方案和部署计划，最终生成可供云服务商直接执行的工作流。

"我们的系统还为云服务商提供了跨多个工作负载的可视化能力，使其能够在满足用户约束的前提下，以最高效的方式共享计算资源。"他说。

在针对视频问答和代码生成等多样化智能体工作流的测试中，Murakkab 在满足用户需求的同时，仅需其他方法约35%的计算量，能耗约为27%，成本不足25%。

Murakkab 的动态特性还赋予用户灵活权衡各项指标的能力。在一个测试案例中，系统将某智能体工作流的能耗降低了逾一个数量级，而精度仅下降约2%。

系统还为视频帧选取模型找到了一种出乎意料的最优配置，显著提升了视频问答任务的性能。Chaudhry 表示，这类优化几乎不可能由开发者手动实现。

下一步，研究团队计划将系统扩展至更复杂的工作流和更大规模的计算集群，并探索优化新型智能体应用的可能性。

"让这些工作流更加资源高效、大幅降低能耗的潜力是巨大的，但我们需要从大型云平台的规模来思考这个问题。"Chaudhry 说。

本研究部分获得半导体研究公司及美国国防高级研究计划局的资助支持。

Q&A

Q1：Murakkab系统是什么？它能解决什么问题？

A：Murakkab 是由麻省理工学院与微软联合开发的智能系统，名称来源于乌尔都语，意为"多种事物的组合"。它能自动优化AI智能体工作流的设计与执行，解决传统方式中资源过度分配、配置复杂繁琐、能耗和成本浪费等问题。开发者只需用自然语言描述需求，系统即可自动完成模型选择、硬件配置和资源调度。

Q2：Murakkab在实际测试中表现如何？

A：在视频问答和代码生成等多种智能体工作流测试中，Murakkab 仅需传统方法约35%的计算量，能耗约为27%，成本不足25%，同时不影响整体性能。在一个具体案例中，系统将工作流能耗降低了逾一个数量级，而精度仅下降约2%。

Q3：Murakkab如何应对新模型或新硬件的出现？

A：Murakkab 采用动态决策机制，能够持续跟踪并自动整合最新的模型和GPU加速器，开发者无需重新配置工作流。系统会实时根据用户的优先需求调整配置，确保工作流始终以最优状态运行，从而避免了传统方式中每次更新都需从头开发的问题。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.