Solo.io甩出AgentBench|谷歌|插座|新系统|知名企业|agentbench

Solo.io甩出AgentBench

2026-03-30 14:08:58　来源: 爬虫饲养员

北京举报

分享至

2024年全球AI Agent（智能体）市场规模冲到52亿美元，年复合增长率47%。但有个数字更扎心：Gartner调研显示，78%的企业部署了多个Agent后，发现它们根本聊不到一块——就像你手机里的微信和钉钉，消息永远不通。

这就是Agentic AI（智能体驱动的AI系统）的"巴别塔困境"。每个厂商都在造自己的Agent，OpenAI有GPTs，谷歌有Vertex AI Agent，微软有Copilot Studio，Anthropic有Claude的Computer Use。它们各自为战，企业用户被迫当"翻译官"。

AgentBench的诞生：一个被"逼出来"的标准

Solo.io这家公司，名字听着像搞音乐的，其实是云原生网络的老炮。他们做的Istio（服务网格技术）和Envoy（开源代理），支撑着全球大半K8s集群的流量调度。2023年，他们的客户开始集体吐槽：Agent太多了，怎么管？

Solo.io CEO Idit Levine的原话很直接：「互操作性是Agentic AI领域最大的未解难题。」（"Interoperability is the biggest unsolved problem in agentic AI."）她没说的是，这个问题已经拖了三年——从2022年AutoGPT爆火算起，行业一直在等一个"通用插座"。

AgentBench的核心设计像个"三头插座"。第一头是A2A协议（Agent-to-Agent，智能体间通信协议），谷歌今年3月刚开源，定义了Agent怎么发现彼此、怎么协商任务。第二头是MCP（Model Context Protocol，模型上下文协议），Anthropic去年11月推的，解决Agent怎么调用外部工具。第三头是Solo.io自己补的"粘合层"，让不同协议的Agent能互相理解意图。

说白了，AgentBench不是造新轮子，而是给现有的轮子造个"变速箱"。

技术细节：为什么这事比想象中难

互操作性的坑，不在"传数据"，在"传意图"。两个Agent交换JSON很容易，但A说的"预订会议室"和B理解的"预订会议室"，可能一个是查日历、一个是调灯光、一个是订外卖——歧义无处不在。

Solo.io的解法是做"语义中间件"。AgentBench在A2A和MCP之上加了一层意图解析引擎，把自然语言任务拆解为标准化的"动作图谱"。举个例子：用户说"安排下周三的客户拜访"，系统会自动拆成查日历→找联系人→订机票→订酒店→发邀请，每个子任务匹配最优Agent执行。

更关键的是安全。多Agent协作意味着权限的链式传递，一个被攻破的Agent可能带着全家桶一起翻车。AgentBench内置了零信任架构，每个动作都要验签，执行记录上链存证——这思路直接从Istio的服务网格安全搬过来的。

目前AgentBench已开源，GitHub仓库48小时收获2300星。但开源只是第一步，生态才是硬仗。

行业反应：有人捧场，有人观望

谷歌云第一时间表态支持，把A2A协议的主导权部分让渡给AgentBench社区——这很少见，通常大厂宁愿自己攥着标准。Anthropic的态度更微妙：MCP被纳入AgentBench，但官方博客只字未提，只是在技术文档里加了个链接。

国内厂商的动作更快。字节跳动的Coze平台、阿里的ModelScope Agent，都在测试AgentBench的适配。一位阿里云工程师在开发者社区留言：「终于不用为每个Agent写适配器了，以前接一个Agent要两周，现在两天。」

但质疑声也有。Hugging Face的AI伦理研究员Margaret Mitchell在X上发文：「互操作性是技术问题，更是权力问题。谁定义标准，谁就定义了Agent能做什么、不能做什么。」她的担忧指向AgentBench的治理结构——目前由Solo.io和谷歌主导，其他厂商话语权有限。

Idit Levine的回应很产品经理：「第一版先跑起来，治理可以慢慢吵。」

一个被忽略的时间线

AgentBench的发布时机值得玩味。2025年4月，OpenAI刚被曝出内部代号"Operator"的通用Agent项目，预计年底发布；谷歌I/O大会定档5月，A2A协议会有重大更新；Anthropic的Claude 4也在蓄势。AgentBench抢在三大巨头的产品周期之前卡位，意图明显。

更深层的变化是商业模式。Solo.io过去卖服务网格软件，按节点收费；AgentBench转向"协议层免费、工具链收费"——和企业版Kubernetes的打法一模一样。如果AgentBench成为事实标准，Solo.io就能从"网络基础设施"跃迁到"AI基础设施"，估值逻辑完全不同。

这不是赌技术，是赌生态位。

AgentBench的GitHub Issues区有个有趣的标签：「real-world-pain」。里面全是企业用户的吐槽：某银行跑了17个不同厂商的Agent，某车企的客服Agent和库存Agent天天"吵架"，某电商的推荐Agent和风控Agent互相拆台。这些案例被Solo.io整理成"互操作性灾难博物馆"，挂在官网最显眼的位置。

最后一个细节：AgentBench的Logo是个插着三根线的插座，但仔细看，插头的形状各不相同——A2A是圆的，MCP是扁的，第三根是Solo.io自己设计的六边形。这个设计没有解释，但开发者社区已经有人开始P图：有人把六边形P成了美元符号，有人P成了问号。

如果Agentic AI的未来真的是多Agent协作，那这个"插座"能插多少种插头，可能决定了下一个十年的权力格局。你觉得，OpenAI会接这个插座吗？

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.