网易首页 > 网易号 > 正文 申请入驻

Claude的Agent四件套终于来了!Agents是新一代应用形式

0
分享至

来源:市场资讯

(来源:51CTO技术栈)


Anthropic 在短短几年内就成为了OpenAI 的最强劲敌!

刚刚,Anthropic CEO Dario Amodei 透露:Anthropic 第一季度的收入和使用量同比增长了 80 倍。

它在以超快的速度跻身 AI 领域的第一梯队之后,Agent 成为它的下一个方向。

在4月份,Anthropic 重磅推出 Claude Managed Agents;

然后在昨天,Anthropic 旧金山举办的“Code with Claude” 开发者大会,围绕Managed Agents 一口气增加了四项新功能——梦境(Dreaming)、结果验收(Outcomes)、多智能体编排、以及 Webhooks

X上的网友评论:Agents 不仅仅是功能,它们是新一代应用形式 !

这四项新功能都有什么特长?我们一起来看一下!

四项新功能:

结果验收(Outcomes) 加上 Webhooks 才是真正的护城河!

梦境(Dreaming):自我改进

前段时间,Claude Code 源代码泄露之后,就有大佬扒出了ClaudeCode 7层记忆机制里就有做梦机制。

两者都借鉴人类睡眠“做梦”的概念,让 AI 主动回顾过去会话记录,提取模式、整合记忆。

这也就是为什么在X上有网友提出质疑:“他们竟然把一个内存压缩功能命名为“梦境”,这对于一个本质上只是具有一定野心的日志文件来说,真是太夸张了。”


那么这两个有什么不同吗?

7层记忆机制里的做梦是进行会话内的后台短期记忆管理,解决上下文窗口不足;而 Claude Managed Agents 里的梦境则是扩展智能体的记忆能力 ,从而帮助智能体实现自我改进。

在官方博客里表示,“在启用梦境之后,Harvey 的任务完成率提高了约 6 倍。”

梦境能够揭示单个智能体自身无法发现的模式,包括重复出现的错误、智能体趋同的工作流程以及团队共享的偏好。它还能重构记忆,使其在演化过程中保持高信号强度。这对于长时间运行的任务和多智能体编排尤为有用。


结果验收(Outcomes):自动化闭环

在过去,AI 生成的内容往往需要用户再次评估。

现在 Outcomes 将评估这一环也交给了AI,真正实现了闭环。

“开发者编写评分标准,评分员(grader) 检查输出结果,如果结果不符合标准,则自动迭代。”

也就是说现在的流程变成了“AI 生成 → AI 验收 → AI 自动返工 → AI 再提交”

而且,评分员(grader) 会在自己的上下文窗口中,根据设定的标准评估输出结果,评估结果并不会被其他智能体影响。

根据 Claude 的官方测评,结果验收(Outcomes)功能相比标准提示循环,任务成功率最多可提升 10 个百分点,在最难的问题上提升最为显著。此外还提高了文件生成质量,在内部基准测试中,docx 文件的任务成功率提升了 8.4%,pptx 文件的任务成功率提升了 10.1%。

当智能体知道“好”的标准是什么时,它们就能发挥出最佳水平。例如,一个结构框架、一个呈现标准,或者一套需要满足的要求。有了结果,智能体就可以对照这个标准检查自己的工作,并进行自我修正,直到输出结果足够好,而无需人工审核每一次尝试。

多智能体编排(Multiagent Orchestration):并行分工

传统 Agent 往往是:一个模型串行执行所有任务。

多智能体编排也就意味着,当单个 Agent 难以胜任多个工作时,主代理就会将任务分解成多个部分,并将每个部分委派给专门的智能体执行。

这些 Agent 在共享文件系统上并行工作,并为主 Agent 提供整体上下文信息。由于事件是持久的,每个 Agent 都会记住自己执行的操作,因此主 Agent可以在工作流程中途与其他 Agent 进行通信。

用户还可以实时跟踪:哪个 Agent 执行了什么操作、执行顺序以及原因。

这并非串行链式执行,而是真正的并行分工!


Webhooks:主动通知进度

这个功能简单来说就是:在完成任务的时候喊你一声。

会话和存储库事件的异步通知。Agent 会在任务完成后主动回调,从而从一个交互式工具转变为一个可集成的后端服务。

有网友对这个功能特别兴奋:Outcomes 加上 Webhooks 才是真正的护城河!Anthropic 正在悄然构建类似 Stripe Webhook 的代理功能。


网友:

这对持续性人工智能工作流程来说意义重大!

在X上的网友对Claude 的这次更新表示兴奋:

“这对持续性人工智能工作流程来说意义重大!”

“说实话,真正吸引我的是梦境功能。不是多智能体之类的东西,也不是网络钩子。而是你的智能体在你睡觉的时候回顾它过去的运行记录,找出它总是出错的地方,并在下次运行前更新记忆。这才是真正意义上的实用功能。”



当然也有网友质疑:

“如果 Dreams 基于有缺陷的反馈进行训练,那么随着规模扩大,它的表现只会越来越差。我很好奇 Anthropic 是如何让团队自行定义“改进”的真正含义的。”

Reddit 上的网友表示“梦境机制只会白白消耗你的代币!”



在这段时间的AI竞赛里,各大AI巨头接连推出新的模型、新的功能。


当 Anthropic 推出这些功能之后,有人评论:“又一批初创公司倒下了!”

这句话虽然有些夸张,但也折射出一个越来越清晰的现实:基础能力正在快速被平台化,行业的竞争门槛正在被拉高。

谁最后能在这场竞赛中成功走出来?

各位大佬体验过新功能了吗?欢迎在评论区分享~

Claude Managed Agents 的新功能:梦想、成果和多代理协调 | Claude --- New in Claude Managed Agents: dreaming, outcomes, and multiagent orchestration | Claude

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
赖清德回台湾,三个东盟国家为其开放领空

赖清德回台湾,三个东盟国家为其开放领空

混沌录
2026-05-06 22:50:16
北京17岁女学生教室产子,孩子生父身份曝光后,父母崩溃了

北京17岁女学生教室产子,孩子生父身份曝光后,父母崩溃了

清茶浅谈
2025-04-16 13:39:37
震惊!月薪9500元男子被相亲女嫌弃,直言不合适,其对话登上热搜

震惊!月薪9500元男子被相亲女嫌弃,直言不合适,其对话登上热搜

火山詩话
2026-05-06 06:50:06
地球上即将诞生一个新国家,与北京市面积相当,仅有28万人

地球上即将诞生一个新国家,与北京市面积相当,仅有28万人

明月清风阁
2026-05-07 08:10:15
我的个天啊!一个二轮秀,拿着1.5亿大合同,季后赛场均27分

我的个天啊!一个二轮秀,拿着1.5亿大合同,季后赛场均27分

球毛鬼胎
2026-05-07 18:57:34
雍正赏李卫五百亩地,李卫次日分佃农,雍正怒查:他家茶壶都没盖

雍正赏李卫五百亩地,李卫次日分佃农,雍正怒查:他家茶壶都没盖

阿器谈史
2026-05-07 18:52:13
脱欧十年后,英国房产买家版图彻底变了:当美国人涌入,中国投资者的机会在哪里?

脱欧十年后,英国房产买家版图彻底变了:当美国人涌入,中国投资者的机会在哪里?

英国那些事儿
2026-05-06 23:35:25
基恩和内维尔一致认为英超球队下赛季“陷入大麻烦”

基恩和内维尔一致认为英超球队下赛季“陷入大麻烦”

夜白侃球
2026-05-08 09:27:30
12 万亿遗产税结清!三星豪门全员凑钱,只为保住下一代“王位”

12 万亿遗产税结清!三星豪门全员凑钱,只为保住下一代“王位”

毒sir财经
2026-05-07 21:38:07
兰大再现骨干离职,中西部名校出路何在

兰大再现骨干离职,中西部名校出路何在

冰川思想库
2026-05-07 11:07:42
别不信,现在很多公交集团员工连求饶的机会都没有了

别不信,现在很多公交集团员工连求饶的机会都没有了

音乐时光的娱乐
2026-05-07 16:01:35
最高检挂牌督办湖南浏阳烟花爆炸重大责任事故案

最高检挂牌督办湖南浏阳烟花爆炸重大责任事故案

界面新闻
2026-05-07 21:27:04
真相大白!巴尔韦德回应皇马内讧:没动手,队内矛盾被过度解读

真相大白!巴尔韦德回应皇马内讧:没动手,队内矛盾被过度解读

夜白侃球
2026-05-08 09:10:07
张学良90岁的一句大实话:杨虎城全家被杀,是因为他才是事变主角

张学良90岁的一句大实话:杨虎城全家被杀,是因为他才是事变主角

触摸史迹
2026-04-21 19:53:04
倾家荡产,不顾西方威胁,也要支持中国!如今我们猛砸80亿援助

倾家荡产,不顾西方威胁,也要支持中国!如今我们猛砸80亿援助

抽象派大师
2026-05-08 00:10:02
醪糟再次被关注!医生发现:高血脂患者喝醪糟,不用多久4大变化

醪糟再次被关注!医生发现:高血脂患者喝醪糟,不用多久4大变化

芹姐说生活
2026-04-19 15:52:53
19岁全红婵全面退赛!内情不简单,郭晶晶早就说过跳水不易

19岁全红婵全面退赛!内情不简单,郭晶晶早就说过跳水不易

小叨娱乐
2026-05-07 17:36:52
峨眉山推猴男社死!律师曝猛料,景区拉黑只是开始,严重的在后面

峨眉山推猴男社死!律师曝猛料,景区拉黑只是开始,严重的在后面

阿雹娱乐
2026-05-08 07:34:40
巴西宣布对中国公民免签

巴西宣布对中国公民免签

新华社
2026-05-07 19:58:11
马斯克宣布解散xAI:11位创始人全部跑光,3年烧掉2500亿,最后只剩他一个人

马斯克宣布解散xAI:11位创始人全部跑光,3年烧掉2500亿,最后只剩他一个人

互联网思想
2026-05-07 19:48:03
2026-05-08 09:48:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3138251文章数 7229关注度
往期回顾 全部

科技要闻

追赶星舰:中国商业火箭离SpaceX有多远?

头条要闻

牛弹琴:一觉醒来美伊又打起来了 阿联酋被指首次参战

头条要闻

牛弹琴:一觉醒来美伊又打起来了 阿联酋被指首次参战

体育要闻

巴黎再进欧冠决赛,最尴尬的情况还是发生了

娱乐要闻

Lisa主持!宁艺卓观看脱衣秀风波升级

财经要闻

一觉醒来,美伊又打起来了

汽车要闻

雷克萨斯全新纯电三排SUV 全新TZ全球首发

态度原创

教育
时尚
健康
家居
游戏

教育要闻

为啥数理天才一抓一大把,化学天才却很罕见?

今年母亲节,和妈妈一起变漂亮

干细胞治烧烫伤面临这些“瓶颈”

家居要闻

破茧成蝶 土味精装房爆改

《GTA6》NS2版重磅传闻!R星希望首发上线 机能太强

无障碍浏览 进入关怀版