网易首页 > 网易号 > 正文 申请入驻

可验证的Agentic Workflow?MermaidFlow开启安全、稳健的新范式

0
分享至

随着大语言模型技术的持续突破与火热发展,AI 智能体正从单点能力迈向复杂系统协作,多智能体系统(Multi-Agent Systems, MAS)成为学术和产业界聚焦的新前沿。在这一背景下,「Agentic Workflow」作为面向智能体自主决策与协作流程自动生成的技术理念,正成为多智能体系统研究和应用的探索热点。

为提升智能体系统的自主化与智能化,谷歌、上海 AI Lab 等国内外领先团队陆续推出了Meta-GPT、ADAS、AFlow等创新性 Agentic Workflow 工作,大力推动利用大模型实现任务规划、分工协作与流程优化的自动化进程。

尽管这些系统能够灵活的表达工作流,但在自动化搜索工作流的过程中,存在合理性难以保证、可验证性不足、 难以直观表达等突出挑战,严重制约了多智能体系统的可靠落地与规模化部署。

近日,来自新加坡 A*STAR 的 Centre for Frontier AI Research (CFAR) 研究所与南洋理工大学的研究团队联合发布了创新性工作流框架「MermaidFlow」,推动智能体系统迈向结构化进化与安全可验证的新范式。

  • 论文链接:https://arxiv.org/pdf/2505.22967
  • GitHub 开源代码:https://github.com/chengqiArchy/MermaidFlow

Mermaid 破局:

让结构式工作流表达取代脚本混战

传统瓶颈:命令式脚本使工作流频频 「翻车」

在现有多智能体系统中,大模型生成的工作流往往以 Python 脚本或 JSON 树等命令式(imperative)代码直接输出,ADAS, AFlow 等主流系统也普遍采用了这种表达范式。这种低层次、混杂的生成方式,将流程规划与具体实现深度耦合,结构信息隐含在复杂代码中,直接导致了以下三大核心瓶颈:

  • 结构不透明:工作流整体架构深藏在杂乱代码里,流程关系难以一目了然,协作全局难以把控。
  • 合理性难验证:流程逻辑与实现细节高度耦合,缺乏静态检查和自动验证机制,容易隐藏致命漏洞。
  • 调试与优化困难:错误往往只有在实际运行时才暴露,流程复现、问题定位和后续优化极为低效。

MermaidFlow: 引领结构化与可验证工作流表达

MermaidFlow 以结构化图语言 Mermaid 为基础,提出了一种全新的工作流表达机制。不同于直接输出可执行脚本的方式,MermaidFlow 强调将智能体行为规划过程显式建模为结构化流程图谱,并引入形式化语义,确保流程清晰、可查、可验证。

相比传统的 Python/JSON 脚本,基于 Mermaid 的工作流表达具有以下核心特点:

  • 图式结构清晰可见:每一个智能体定义、依赖关系、数据流都被结构化地表达成图中的节点与连边,使整个工作流一目了然、可交互、可审查.
  • 流程验证内嵌其中:MermaidFlow 引入了多类语义约束(如依赖闭环、角色一致性、输入输出类型匹配等),支持静态结构验证与生成时一致性检查,避免生成不符合规则的图。
  • 天然支持演化与调试:结构化工作流图更易于进行片段级替换、增量修复与版本比较,支持可控的演化式优化(见后节)。

图1 MermaidFlow:从结构化图到可验证执行的一站式工作流表达闭环 。左侧部分展示了基于 Mermaid 的声明式工作流表达,结构清晰、依赖显式,具备良好的人类可读性。人们可以清晰得知道, 在该工作流中存在什么节点, 他们之间的连接情况是怎么样的。

借助 MermaidFlow 所提出的结构化图式表达,多智能体协作的工作流规划过程不再是脆弱难控的黑盒编排,而是具备清晰结构、可视节点与可验证语义的 「白盒流程」。这种方式极大地提升了Agentic Workflow 的可解释性、可验证性与后续演化的可操作性,为大规模部署打下坚实基础。

作者研究发现大语言模型对Mermaid 语言具备天然的生成优势。这也让MermaidFlow 与 LLM 的结合变得格外丝滑又强大✨

MermaidFlow 中的安全演化策略:

工作流的自我升级之道

MermaidFlow 基于Mermaid 语言对智能体工作流进行显式建模,使每个任务节点、数据依赖与执行顺序都成为可视、可解析、可操作的语义单元。相比传统的命令式脚本,结构化表达更具模块化特性,支持按节点插入、删除与替换,天然适配图级别的优化操作。每一次结构调整都具备清晰的语义边界,显著降低了修改的不确定性与调试复杂度

得益于 MermaidFlow 引入的静态验证机制(如节点类型匹配、输入输出闭环、角色一致性等约束),每一代演化生成的工作流候选都能在生成阶段就进行结构合规性检查,过滤掉语义不完整或存在潜在风险的 「劣质图」。这种 「先验校验 + 后验优化」 的策略,显著提高了搜索空间的质量和鲁棒性,避免了大量无效或不合法的探索路径

图 2 MermaidFlow 的安全演化式优化流程概览。 本系统以结构化的 Mermaid 图表达作为工作流起点,通过安全约束的进化算法(Safety-Aware Evolutionary Programming)在类型保持(typed)、结构可感知(structure-aware)、静态可验证(static verifiable)等维度上持续优化工作流结构。

实验性能

MermaidFlow 不再依赖具备强编程能力的大语言模型,也能生成高质量的工作流。在 GSM8K、MATH、HumanEval、MBPP 等多个主流任务数据集上,MermaidFlow 均展现出优秀的性能,体现出较强的实用价值。更关键的是,得益于结构化表达与静态可验证机制,MermaidFlow 在进化流程中生成可执行且结构合理工作流的成功率超过 90%,相比于传统基于脚本拼接的方法,极大提升了智能体系统的可控性和鲁棒性,为智能体系统的稳健部署提供了坚实的支撑。

图 3 MermaidFlow 在主流任务上的评测结果。

下图展示了 MermaidFlow 在结构化表示下的进化过程示例。得益于每个节点及其连接关系均具备明确的语义边界,系统能够便捷且安全地进行局部片段的替换、重组与演化操作(如 crossover、节点替换、连边调整等)。图中演示了系统如何通过对 Workflow 5 和 Workflow 4 进行 crossover 操作,生成结构更健壮的 Workflow 8,引入了更优的 ensemble 与 test 模块。这一结构可控的演化机制,有效提升了工作流生成过程的安全性、可控性与可维护性。

图 4 MermaidFlow 灵活的工作流进化合成过程。

结语

随着多智能体系统和大模型 AI 持续演进,如何实现结构化、可验证与高效进化的工作流,已成为智能体研究的重要命题。MermaidFlow 提出的结构化可验证工作流表达方式,为智能体系统实现高效、可控的协作流程提供了基础支撑。未来的 AI 协作,也许正需要这样一套「看得见、查得清、能进化」的流程底座。随着应用领域的不断拓展与工程落地,这一框架有望为智能体生态的持续进步提供有益参考。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大S雕像正式完工!具俊晔巧妙设计让人泪目,一举动暴露真实感情

大S雕像正式完工!具俊晔巧妙设计让人泪目,一举动暴露真实感情

林雁飞
2026-01-31 23:38:43
姚振华实名举报江苏官员,再次证明了一件事

姚振华实名举报江苏官员,再次证明了一件事

作家加野
2026-02-01 10:56:14
“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

流史岁月
2026-01-26 10:58:30
英超综述:阿森纳4-0暂7分领跑 切尔西输2追3+绝杀 利物浦6轮首胜

英超综述:阿森纳4-0暂7分领跑 切尔西输2追3+绝杀 利物浦6轮首胜

我爱英超
2026-02-01 06:48:03
全球唯一一只不属于中国的熊猫,叫欣欣,吃不到竹子吃的是仙人掌

全球唯一一只不属于中国的熊猫,叫欣欣,吃不到竹子吃的是仙人掌

西楼知趣杂谈
2026-01-31 13:18:43
刘强东上千亿身家背后,儿子却是他一生的痛,感谢章泽天视如己出

刘强东上千亿身家背后,儿子却是他一生的痛,感谢章泽天视如己出

以茶带书
2026-01-30 17:15:28
泸州白骨案侦破内幕,全靠两个关键人物:一个说漏嘴,一个记性好

泸州白骨案侦破内幕,全靠两个关键人物:一个说漏嘴,一个记性好

社会日日鲜
2026-01-23 08:44:02
爱泼斯坦恶魔岛再曝350万页猛料!盖茨染病传前妻、马斯克狂欢?

爱泼斯坦恶魔岛再曝350万页猛料!盖茨染病传前妻、马斯克狂欢?

阿芒娱乐说
2026-01-31 23:18:19
大S一家没说谎,主动放弃遗产,面相全变的具俊晔,证实她们的话

大S一家没说谎,主动放弃遗产,面相全变的具俊晔,证实她们的话

银河史记
2026-01-31 16:06:46
A股:刚刚,政治局会议召开,释放一信号,下周一将迎来新的行情

A股:刚刚,政治局会议召开,释放一信号,下周一将迎来新的行情

云鹏叙事
2026-02-01 00:00:07
郑爽头发都白了!抱孩子画面首次曝光,一家人和张恒当街吵架

郑爽头发都白了!抱孩子画面首次曝光,一家人和张恒当街吵架

萌神木木
2026-01-31 18:23:54
大量变压器工厂已经处于满产的状态 其中部分面向数据中心的业务订单已排到2027年

大量变压器工厂已经处于满产的状态 其中部分面向数据中心的业务订单已排到2027年

财联社
2026-01-31 19:20:12
金晨“肇事逃逸”危机,第一波受害者出现了!

金晨“肇事逃逸”危机,第一波受害者出现了!

李东阳朋友圈
2026-01-30 14:10:20
她是正国级领导的女儿,投行界的拔尖人物,敢闯敢拼让人打心底佩服

她是正国级领导的女儿,投行界的拔尖人物,敢闯敢拼让人打心底佩服

老杉说历史
2026-01-29 22:51:13
今年腊月二十九除夕,四类人要穿红,3种人不要去拜年,有你吗?

今年腊月二十九除夕,四类人要穿红,3种人不要去拜年,有你吗?

阿龙美食记
2026-01-29 11:03:56
官方:大型活动的治安缓冲区从15%调降到全国统一的10%

官方:大型活动的治安缓冲区从15%调降到全国统一的10%

懂球帝
2026-01-31 11:53:20
欧洲快马加鞭减少乌对美情报依赖,华人对乌捐款名列全球第14位

欧洲快马加鞭减少乌对美情报依赖,华人对乌捐款名列全球第14位

史政先锋
2026-01-31 20:52:08
2月4日立春,今年立春不一般,5个生肖要躲春,别忘:吃3样忌3事

2月4日立春,今年立春不一般,5个生肖要躲春,别忘:吃3样忌3事

小茉莉美食记
2026-01-30 07:27:46
中国男篮拒绝输球!全力击败日本队,赵睿挑大梁,央视直播

中国男篮拒绝输球!全力击败日本队,赵睿挑大梁,央视直播

体坛瞎白话
2026-02-01 07:48:13
皇马认真考虑邀请穆帅,放权能吸引穆帅,曼联球星有望转会皇马

皇马认真考虑邀请穆帅,放权能吸引穆帅,曼联球星有望转会皇马

福酱的小时光
2026-02-01 10:51:05
2026-02-01 14:16:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12226文章数 142560关注度
往期回顾 全部

科技要闻

腾讯元宝宣布:10亿现金红包,今日开抢

头条要闻

媒体:宝可梦十年间三次踩线 可不是简单的"工作失误"

头条要闻

媒体:宝可梦十年间三次踩线 可不是简单的"工作失误"

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

马年春晚第三次联排,多位明星现身

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

新款宾利欧陆GT S/GTC S官图发布 V8混动加持

态度原创

亲子
时尚
游戏
手机
军事航空

亲子要闻

萌娃爆笑模仿爸爸打呼噜,逗得妈妈哈哈大笑

上年纪的女人买“上衣”:避开3个坑,这样选时髦又显气质

《古神:风里希》“游先看”PV解析:重塑上古神话

手机要闻

老外看不下去了!吐槽国产手机抄袭iPhone:为了像苹果 3个摄像头里有1个是假的

军事要闻

伊朗民众:伊朗不会屈服于美国霸权

无障碍浏览 进入关怀版