网易首页 > 网易号 > 正文 申请入驻

AutoGen架构全景解读:v0.4到Microsoft Agent Framework的变化

0
分享至

Microsoft AutoGen 曾是构建 LLM 多智能体系统的标杆性开源框架。2023 年末由 Microsoft Research 发布后迅速成为研究人员和开发者的默认选择:智能体之间可以互相对话、调用工具、编写并执行代码、在流程中引入人类审批,以对话式的协调方式取代了单条长 Prompt 链条。



到 2026 年初,AutoGen v0.4(2025 年初重新设计的版本)是其技术上的巅峰之作。但是 2025 年末 Microsoft 正式把 AutoGen 与 Semantic Kernel 合并,统一为 Microsoft Agent Framework(MAF)。不过,很多人在谈到源自 AutoGen 的多智能体编排风格时依然习惯说"AutoGen"。本文梳理 AutoGen 的来龙去脉:它是什么、为什么重要、哪些核心设计在 2026 年仍然存续、v0.4/v0.7 时代的架构与典型用法、代码示例、利弊,以及当前的整体现状。

AutoGen 为什么在 2023–2024 年迅速走红

AutoGen 出现之前,LLM 的主流用法只有两种:单线程链式调用(LangChain 风格)和简单的工具调用智能体(ReAct 循环)。

AutoGen 带来了一套完全不同的心智模型——智能体是对话的参与者,整个系统就是一个群聊,有时有结构,有时自由发挥。智能体之间可以委派任务、互相批评与纠正、调用工具、编写并执行代码、向人类发起询问,在目标达成后自行终止。没有任何一个中央控制器需要提前知晓完整计划。

这套流程和人类解决复杂问题的方式高度吻合:分工、讨论、审查输出。早期几个病毒式传播的 demo(编码者 + 评审者 + 执行者联合解数学题、网络研究小组、股票分析团队)在许多任务上展现出比单智能体高 2–10 倍的表现。

AutoGen v0.4——大改版(2025)

v0.4(2025 年初发布)本质上是 AutoGen 2.0。旧的阻塞式同步 GroupChat 被三层新架构取代:autogen-core 负责底层事件驱动原语(RoutedAgent、订阅、发布/订阅消息传递);autogen-agentchat 是大多数人实际使用的高层 API(AssistantAgent、UserProxyAgent、GroupChat、initiate_chat);autogen-ext 则是可插拔的扩展层(OpenAI Assistant API、MCP 工作台、gRPC 分布式智能体等)。

核心改进包括完全异步化带来的更好可扩展性与可观测性、模块化的自定义组件(内存、模型、编排)、改进的错误恢复与检查点机制,以及跨语言支持的尝试——当然 Python 始终是主力。

2025 年末 / 2026 年初的典型安装方式:


pip install -U "autogen-agentchat" "autogen-ext[openai]"

经典双智能体模式(2026 年仍在使用和教学中)


from autogen import AssistantAgent, UserProxyAgent, config_list_from_json
# Usually load from OAI_CONFIG_LIST or env
config_list = config_list_from_json("OAI_CONFIG_LIST")
assistant = AssistantAgent(
name="helpful_engineer",
llm_config={"config_list": config_list},
system_message="You are a senior Python engineer. Write clean, efficient code."
)
user_proxy = UserProxyAgent(
name="user",
human_input_mode="NEVER", # NEVER / ALWAYS / TERMINATE
max_consecutive_auto_reply=10,
code_execution_config={"work_dir": "coding", "use_docker": False},
)
user_proxy.initiate_chat(
assistant,
message="Write a Python class that downloads daily OHLCV data from Yahoo Finance for any ticker and caches it in parquet."
)

短短几行代码就已经具备了完整的闭环:一个能做规划的 LLM 智能体、代码编写与本地执行、自动重试/错误修复循环、终止条件判定。

群聊——AutoGen 的标志性模式


from autogen import GroupChat, GroupChatManager
researcher = AssistantAgent(name="Researcher", system_message="Find latest information.", llm_config=llm_config)
critic = AssistantAgent(name="Critic", system_message="Be skeptical and point out flaws.", llm_config=llm_config)
writer = AssistantAgent(name="Writer", system_message="Write in engaging blog-post style.", llm_config=llm_config)
user_proxy = UserProxyAgent(name="User", code_execution_config=False, human_input_mode="TERMINATE")
groupchat = GroupChat(
agents=[user_proxy, researcher, critic, writer],
messages=[],
max_round=12
)
manager = GroupChatManager(
groupchat=groupchat,
llm_config=llm_config,
# speaker_selection_method="auto" / "round_robin" / custom func
)
user_proxy.initiate_chat(
manager,
message="Write a 800-word article about newest developments in small modular nuclear reactors in 2026."
)

2025–2026 年的实际项目中,5–12 个智能体的配置很常见:规划者 → 研究者 → 编码者 → 测试者 → 评审者 → 文档编写者 → 用户审批者,或干脆由智能体自行决定何时拆分子团队。

AutoGen 的突出优势

涌现行为是 AutoGen 最令人意外的特质:智能体经常以出乎预料的方式完成分工。人机协作的颗粒度做到了任意节点的审批与编辑,而非仅在流程末尾给一个是/否。代码执行能力让智能体能自己修复 bug形成"编写-运行-修复"的闭环。框架本身对实验非常宽容,规则容易打破,适合快速试错。社区围绕它衍生出了 MCP 支持、Perplexity 研究智能体、gRPC 扩展等一系列生态。

痛点(2024–2025)

成本是最直接的问题:一次 8 个智能体参与的 GPT-4o 对话,处理复杂任务时费用可达 5–30 美元。非确定性带来的复现与测试困难、长对话导致的 Token 爆炸和上下文窗口耗尽、调试时难以追溯"谁在什么时候说了什么",以及 v0.4 后期补丁出现之前几乎不存在的检查点/恢复机制,这些都是真实落地时绕不开的问题。

2025–2026 年的过渡——Microsoft Agent Framework(MAF)

2025 年 10 月,Microsoft 宣布 AutoGen 不再作为独立库接收重大功能更新。取而代之的是:AutoGen 的概念并入 Microsoft Agent Framework(Python 与 .NET 双语言支持),Semantic Kernel 负责企业级规划基础,AutoGen 部分则承载多智能体编排和对话模式。

MAF 延续了 AutoGen 的核心精神——对话式智能体、群聊编排、工具调用——但在此基础上补齐了工程化短板:内置检查点与恢复、基于 OpenTelemetry 的可观测性(追踪与指标)、对 MCP(Model Context Protocol)/A2A/OpenAPI 的原生支持、与 Azure AI Foundry / Dynamics 365 / M365 Copilot 的深度集成,以及将 Semantic Kernel 规划器与 AutoGen 风格团队混用的统一 SDK。

迁移指南很快就出现在 Microsoft Learn 和 GitHub 上。不过在 2026 年初仍有大量开源项目在使用旧的 autogen-agentchat 包——对于原型开发来说,它足够熟悉,也确实还能用。

当前状态(2026 年 3 月)

在原型开发、研究和教学场景中,经典 AutoGen v0.4 / v0.7 的代码依然随处可见。生产和企业环境则几乎全面转向 Microsoft Agent Framework,或正在迁移途中。社区围绕 MAF + AutoGen 风格模式保持着很高的活跃度。CrewAI、LangGraph、OpenAI Swarm、Magentic-One 等后来者,都或多或少借鉴了 AutoGen 率先提出的多智能体协作理念。

AutoGen 留下了什么

AutoGen 的贡献不止于一个库。它从根本上改变了开发者对 LLM 应用的认知框架——从"一个 Prompt 统治一切"转向"组建一支 LLM 专家团队,让它们彼此对话"。多智能体协作作为一等原语,到 2026 年已经渗透到整个行业。即便不再写一行 AutoGen 代码,日常使用的系统里大概率已经携带着 AutoGen 的基因。

框架本身作为独立产品已经"退役",但其架构思路深度嵌入了 Microsoft Agent Framework 和更广泛的智能体生态。2026 年 3 月起步的新项目应直接从 Microsoft Agent Framework 文档开始;维护旧代码或偏好原始简洁性的场景下,v0.4 agentchat API 大概率还能继续运行多年。

Microsoft Agent Framework(MAF)

Microsoft Agent Framework(MAF)是 Microsoft 当前一代的开源智能体框架,覆盖构建、编排、部署与管理的全流程,尤其面向多智能体系统。2025 年 10 月进入公开预览,它是两个前代项目的官方继任者:AutoGen 带来了对话式多智能体编排、涌现团队行为和面向研究的灵活性;Semantic Kernel 则贡献了企业级基础——类型安全、中间件、可观测性、插件/连接器体系以及生产稳定性。

到 2026 年初,MAF 已被定位为 Python 与 .NET 双语言智能体开发的统一长期路径,与 Azure AI Foundry 深度绑定,但同时保持完全开源和模型无关。

MAF 要解决的,正是 2024–2025 年开发者不断碰到的那道两难题:想快速做原型、让多个智能体自由协作,选 AutoGen;想要生产级的可靠性、追踪、持久化、类型安全和企业连接器,选 Semantic Kernel。MAF 在单个 SDK 和运行时中把两边的能力合到了一起——来自 AutoGen 的简洁智能体/团队抽象,来自 Semantic Kernel 的会话状态管理、中间件管道、OpenTelemetry、过滤器和检查点,再加上全新的一层:基于图的显式工作流,用于确定性的多智能体编排。

Python最小单智能体


from agent_framework import AIAgent
from azure.ai.openai import AzureOpenAIClient # or openai.OpenAI etc.
import os
client = AzureOpenAIClient(
endpoint=os.getenv("AZURE_OPENAI_ENDPOINT"),
credential=…, # DefaultAzureCredential() etc.
)
agent = client.get_chat_client("gpt-4o-mini").as_ai_agent(
instructions="You are a concise technical writer.",
name="TechWriter"
)
response = await agent.run("Explain Microsoft Agent Framework in one paragraph.")
print(response.content)

C#类似的最小智能体


using Azure.AI.OpenAI;
using Azure.Identity;
using Microsoft.Agents.AI;
var endpoint = Environment.GetEnvironmentVariable("AZURE_OPENAI_ENDPOINT");
var client = new AzureOpenAIClient(new Uri(endpoint), new AzureCliCredential());
var chatClient = client.GetChatClient("gpt-4o");
var agent = chatClient.AsAIAgent(
instructions: "You are a friendly assistant. Keep answers brief.",
name: "HelloAgent"
);
var response = await agent.InvokeAsync("Hello! Tell me about yourself.");
Console.WriteLine(response.Content);

多智能体群聊(风格上仍然很 AutoGen):2026 年初的多数示例在模式上与 AutoGen 0.4 群聊高度相似,区别在于底层多了持久性支持:


from agent_framework import GroupChat, GroupChatManager, AssistantAgent
# … define researcher, critic, writer agents …
group = GroupChat(
agents=[user_proxy, researcher, critic, writer],
max_rounds=15,
# now supports persistent session id, checkpointing, etc.
)
manager = GroupChatManager(group=group)
await user_proxy.initiate_chat(
manager,
message="Research & write 600-word post on SMR nuclear progress in 2026"
)

对话式群聊之外,MAF 新增了基于图/DAG 的工作流编排。节点可以是智能体、函数、条件判断或循环,执行路径是确定性的——非常适合业务流程与合规场景。单个节点内部仍然可以使用对话模式,类型安全的输入/输出在 .NET 中尤其顺手。Azure AI Foundry 在 2026 年初还提供了可视化工作流设计器的预览版。

GroupChat 和 Workflow 面向的场景有明确区分:前者适合开放式研究和调试,后者用于订单处理、贷款审批、事件响应一类必须按严格顺序和分支逻辑运行的流程。

继承自 AutoGen 的能力(在 MAF 中延续)

整合之前AutoGen 在 2024–2025 年多项学术/研究 Benchmark 上处于领先或并列位置。GAIA 基准测试(开放式推理)中,AutoGen 多智能体团队在 2024 年至 2025 年初频繁占据榜首,困难子集上的成功率通常在 70–85% 区间,单智能体同期为 40–60%。SWE-bench Verified(软件工程)上,多智能体 AutoGen 变体在代码修复任务中比单智能体高出 25–40%。Microsoft 的行业案例(如 Novo Nordisk 的数据科学流水线)报告了约 25% 的迭代周期缩短。

MAF 保留了这些对话/群聊模式,涌现能力基本得以继承,而新增的确定性图编排与持久化机制预计会在不过多牺牲灵活性的前提下提升整体可靠性。

总结

看学术/研究 Benchmark(GAIA、WebArena 等),经典 AutoGen 积累的排行榜成绩更多;MAF 因为发布晚(RC 阶段),相关数据还不充分。看生产可行性、一致性、延迟、可调试性、持久化、Azure 集成等早期数据指向 MAF RC 在开发者综合 Benchmark 和企业指标上领先多数替代方案。多数谨慎的采用者在等 3 月底的 GA 版本,届时 API 将稳定,文档和示例也会更完整,预计会带出一波来自 Foundry 和第三方的正式 Benchmark。

https://avoid.overfit.cn/post/c00881ddd6f34c5ebcb34c4a862cc977

by JOLALF

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗下令轰炸美空军基地,此时全世界才惊觉:中国有句话说得很对

伊朗下令轰炸美空军基地,此时全世界才惊觉:中国有句话说得很对

黑鹰观军事
2026-06-02 20:08:42
全国第一铜企,囤货660亿!

全国第一铜企,囤货660亿!

投研邦V
2026-06-02 19:40:23
2010年深圳女子重症抢救,丈夫拔掉呼吸机致其死亡,法院判决亮了

2010年深圳女子重症抢救,丈夫拔掉呼吸机致其死亡,法院判决亮了

猫眼观史
2025-04-11 22:19:55
割四赔五后续:麦客撤了,麦烂了,农户跪了,这锅谁背?

割四赔五后续:麦客撤了,麦烂了,农户跪了,这锅谁背?

爱下厨的阿椅
2026-06-01 14:25:12
埋进土里一万年:为什么玻璃才是人类文明的“终极硬盘”?

埋进土里一万年:为什么玻璃才是人类文明的“终极硬盘”?

心中的麦田
2026-06-01 20:59:23
太敢说了!魏建军直播直言被紧急叫停,部分汽车厂商惊出一身冷汗

太敢说了!魏建军直播直言被紧急叫停,部分汽车厂商惊出一身冷汗

火山詩话
2026-06-02 06:07:10
不好笑,日菲要封了中国的出海口?两记重拳打出,菲律宾的天塌了

不好笑,日菲要封了中国的出海口?两记重拳打出,菲律宾的天塌了

谛听骨语本尊
2026-06-01 19:30:05
何猷君奚梦瑶婚礼现场曝光!四代同堂好温馨,姐姐何超盈低调现身

何猷君奚梦瑶婚礼现场曝光!四代同堂好温馨,姐姐何超盈低调现身

流云随风去远方
2026-06-02 22:04:16
反腐不再靠举报!2026年纪委大数据这样“揪”出腐败

反腐不再靠举报!2026年纪委大数据这样“揪”出腐败

职场资深秘书
2026-05-24 20:56:49
今日最惨股,6个跌停后昨日再跌90%,今又跌停,重仓的亏得心碎!

今日最惨股,6个跌停后昨日再跌90%,今又跌停,重仓的亏得心碎!

丁丁鲤史纪
2026-06-02 14:25:39
从58万到169万!一网友哭诉自己被高收入绑架,丢掉了生活的意义

从58万到169万!一网友哭诉自己被高收入绑架,丢掉了生活的意义

火山詩话
2026-05-31 10:57:09
上海女选手裸照被围观这件事,扯下了“体育赛事照片直播”遮羞布

上海女选手裸照被围观这件事,扯下了“体育赛事照片直播”遮羞布

马拉松跑步健身
2026-06-02 20:24:16
“都把儿子养雌化了!”初中男孩出现雌化现象,家长却执迷不悟

“都把儿子养雌化了!”初中男孩出现雌化现象,家长却执迷不悟

妍妍教育日记
2026-05-29 07:55:13
张嘉益这“陕军班底”,把内娱塑料兄弟情脸都扇肿了

张嘉益这“陕军班底”,把内娱塑料兄弟情脸都扇肿了

阿废冷眼观察所
2026-06-02 00:43:55
张学良送蒋介石回南京是幼稚?毛主席道破天机:不去,内战停不了

张学良送蒋介石回南京是幼稚?毛主席道破天机:不去,内战停不了

鹤羽说个事
2026-06-01 22:37:53
与恩师穆里尼奥重聚皇马?德布劳内吐槽孔蒂,映射阿囧足球也乏味

与恩师穆里尼奥重聚皇马?德布劳内吐槽孔蒂,映射阿囧足球也乏味

穆里尼奥主义者
2026-06-01 21:21:25
一月八万不够花,李双江“赖”学校不退休,儿子改名出国后再作妖

一月八万不够花,李双江“赖”学校不退休,儿子改名出国后再作妖

一盅情怀
2026-05-16 20:12:47
三百名医生已证实:散步、跑步与高血压的真相,最好花点时间看看

三百名医生已证实:散步、跑步与高血压的真相,最好花点时间看看

健康科普365
2026-06-02 20:15:05
帅气!41岁C罗戴墨镜抵达训练营:开启第6次世界杯之旅 志在夺冠

帅气!41岁C罗戴墨镜抵达训练营:开启第6次世界杯之旅 志在夺冠

风过乡
2026-06-02 06:23:54
董路:杨毅一年赚3000万!中国篮球迷比足球迷活得好 消费能力强

董路:杨毅一年赚3000万!中国篮球迷比足球迷活得好 消费能力强

念洲
2026-06-01 23:03:19
2026-06-02 23:04:49
deephub incentive-icons
deephub
CV NLP和数据挖掘知识
2005文章数 1462关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

小学教师疑因打井纠纷杀害邻居 死者留下两未成年儿子

头条要闻

小学教师疑因打井纠纷杀害邻居 死者留下两未成年儿子

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

健康
本地
教育
手机
公开课

违规干细胞应用,暗藏致命隐患!

本地新闻

用剪纸的方式,打开江苏扬州

教育要闻

逐梦盛夏 全城护航 | 冲刺高考政治:把握命题新导向 精准发力稳拿分

手机要闻

折叠屏“iPhone Ultra”或配备液态金属铰链 原型机已送测运营商

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版