![]()
2024年全球AI Agent(智能体)市场规模冲到52亿美元,年复合增长率47%。但有个数字更扎心:Gartner调研显示,78%的企业部署了多个Agent后,发现它们根本聊不到一块——就像你手机里的微信和钉钉,消息永远不通。
这就是Agentic AI(智能体驱动的AI系统)的"巴别塔困境"。每个厂商都在造自己的Agent,OpenAI有GPTs,谷歌有Vertex AI Agent,微软有Copilot Studio,Anthropic有Claude的Computer Use。它们各自为战,企业用户被迫当"翻译官"。
AgentBench的诞生:一个被"逼出来"的标准
Solo.io这家公司,名字听着像搞音乐的,其实是云原生网络的老炮。他们做的Istio(服务网格技术)和Envoy(开源代理),支撑着全球大半K8s集群的流量调度。2023年,他们的客户开始集体吐槽:Agent太多了,怎么管?
Solo.io CEO Idit Levine的原话很直接:「互操作性是Agentic AI领域最大的未解难题。」("Interoperability is the biggest unsolved problem in agentic AI.")她没说的是,这个问题已经拖了三年——从2022年AutoGPT爆火算起,行业一直在等一个"通用插座"。
AgentBench的核心设计像个"三头插座"。第一头是A2A协议(Agent-to-Agent,智能体间通信协议),谷歌今年3月刚开源,定义了Agent怎么发现彼此、怎么协商任务。第二头是MCP(Model Context Protocol,模型上下文协议),Anthropic去年11月推的,解决Agent怎么调用外部工具。第三头是Solo.io自己补的"粘合层",让不同协议的Agent能互相理解意图。
说白了,AgentBench不是造新轮子,而是给现有的轮子造个"变速箱"。
技术细节:为什么这事比想象中难
![]()
互操作性的坑,不在"传数据",在"传意图"。两个Agent交换JSON很容易,但A说的"预订会议室"和B理解的"预订会议室",可能一个是查日历、一个是调灯光、一个是订外卖——歧义无处不在。
Solo.io的解法是做"语义中间件"。AgentBench在A2A和MCP之上加了一层意图解析引擎,把自然语言任务拆解为标准化的"动作图谱"。举个例子:用户说"安排下周三的客户拜访",系统会自动拆成查日历→找联系人→订机票→订酒店→发邀请,每个子任务匹配最优Agent执行。
更关键的是安全。多Agent协作意味着权限的链式传递,一个被攻破的Agent可能带着全家桶一起翻车。AgentBench内置了零信任架构,每个动作都要验签,执行记录上链存证——这思路直接从Istio的服务网格安全搬过来的。
目前AgentBench已开源,GitHub仓库48小时收获2300星。但开源只是第一步,生态才是硬仗。
行业反应:有人捧场,有人观望
谷歌云第一时间表态支持,把A2A协议的主导权部分让渡给AgentBench社区——这很少见,通常大厂宁愿自己攥着标准。Anthropic的态度更微妙:MCP被纳入AgentBench,但官方博客只字未提,只是在技术文档里加了个链接。
国内厂商的动作更快。字节跳动的Coze平台、阿里的ModelScope Agent,都在测试AgentBench的适配。一位阿里云工程师在开发者社区留言:「终于不用为每个Agent写适配器了,以前接一个Agent要两周,现在两天。」
但质疑声也有。Hugging Face的AI伦理研究员Margaret Mitchell在X上发文:「互操作性是技术问题,更是权力问题。谁定义标准,谁就定义了Agent能做什么、不能做什么。」她的担忧指向AgentBench的治理结构——目前由Solo.io和谷歌主导,其他厂商话语权有限。
![]()
Idit Levine的回应很产品经理:「第一版先跑起来,治理可以慢慢吵。」
一个被忽略的时间线
AgentBench的发布时机值得玩味。2025年4月,OpenAI刚被曝出内部代号"Operator"的通用Agent项目,预计年底发布;谷歌I/O大会定档5月,A2A协议会有重大更新;Anthropic的Claude 4也在蓄势。AgentBench抢在三大巨头的产品周期之前卡位,意图明显。
更深层的变化是商业模式。Solo.io过去卖服务网格软件,按节点收费;AgentBench转向"协议层免费、工具链收费"——和企业版Kubernetes的打法一模一样。如果AgentBench成为事实标准,Solo.io就能从"网络基础设施"跃迁到"AI基础设施",估值逻辑完全不同。
这不是赌技术,是赌生态位。
AgentBench的GitHub Issues区有个有趣的标签:「real-world-pain」。里面全是企业用户的吐槽:某银行跑了17个不同厂商的Agent,某车企的客服Agent和库存Agent天天"吵架",某电商的推荐Agent和风控Agent互相拆台。这些案例被Solo.io整理成"互操作性灾难博物馆",挂在官网最显眼的位置。
最后一个细节:AgentBench的Logo是个插着三根线的插座,但仔细看,插头的形状各不相同——A2A是圆的,MCP是扁的,第三根是Solo.io自己设计的六边形。这个设计没有解释,但开发者社区已经有人开始P图:有人把六边形P成了美元符号,有人P成了问号。
如果Agentic AI的未来真的是多Agent协作,那这个"插座"能插多少种插头,可能决定了下一个十年的权力格局。你觉得,OpenAI会接这个插座吗?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.