网易首页 > 网易号 > 正文 申请入驻

Anthropic 工程师深度解读 Skills:AI Agent 的专业进化之路

0
分享至

  

  最近刷屏Skills是什么,发布5周出现了数千个 Skills,他们有哪些类型,Skills为什么重新定义了 AI Agent 的开发方式,又有令人兴奋的应用场景?我们详细拆解了Claude Code 两位核心开发者的演讲视频(Stop building agents, build skills instead),带你一文读懂Skills如何让AI从"每次从头学"变成"越用越懂你"。

  

  Barry Zhang 和 Mahesh Murag 是 Anthropic 的工程师,他们发现,如今许多人已经将 AI Agent 深度融入了日常工作。即便如此,差距依然存在,生成的回报里仍夹杂着不少低质内容。

  问题的本质是:AI Agent 虽然聪明、有能力,但未必具备解决实际业务所需的专业经验。

  举个例子,Mahesh 是智商 300 的数学天才,Barry 是经验丰富的税务专家,当你需要报税时,你会找谁?毫无疑问,我会选 Barry。我不希望 Mahesh 从第一性原理中推导出 2025 年的税法,我需要的是领域专家那种稳定、可靠的执行力。

  这里可以做个类比:AI Agent = 智商 300 的 Mahesh,极其聪明,在深度引导下能做出惊人成绩,但在起步阶段往往缺乏关键的背景信息。

  你想要的理想状态 = Barry:拥有领域专家的稳定、可靠执行力,无需从头推导就能给出专业答案。

  想要达到理想状态,AI Agent 暴露出有三个缺陷:

  无法高效吸收你的专业经验

  无法随时间自我进化

  起步阶段缺乏关键背景信息

  这也是 Skills 诞生的原因。

  在分享解决方案之前,Barry 和 Mahesh 先回顾了 Anthropic 内部的三个关键认知转变。这些认知是理解 Skills 设计的基础。

  三大关键认知

  认知 1:"代码即一切"

  过去的认知:

  不同领域的 AI Agent 在架构上会大相径庭

  需要各自的工具链和底层脚手架

  每个用例、每个领域都要独立开发一个 AI Agent

  在开发 Claude Code 后,团队意识到:

  代码不仅是应用场景,更是通往数字世界的通用接口

  底层 Agent 逻辑比预想中更具通用性

  举个例子,生成一个财务报告,让我们看这个任务具体的任务分解:

  调用 API 抓取数据

  在文件系统整理资料

  用 Python 分析数据

  合成特定格式报告

  底层仅需:Bash 环境 + 文件系统

  结论:底层核心架构可以极其精简,但扩展性极强。

  认知 2:文件是最佳协作单元

  Skills 的本质:文件的有序集合(就是一个个文件夹)

  Skills 是文件的有序集合,它为 AI Agent 打包了可组合的过程性知识。通俗点说,它们就是一个个文件夹。

  为什么选择文件作为 Skills 的载体?为什么选择如此"原始"的形式? Anthropic 团队有 3 大设计理念:

  1. 普适性

  任何拥有电脑的人都能创建和使用

  开发者可以用

  AI Agent 自己也可以用(这点很关键)

  2. 兼容性

  完美融入现有工作流:

  用 Git 做版本控制

  存在 Google Drive

  打包分享给团队

  3. 永恒性

  几十年来,文件一直是最基础的协作单元,既然好用,为何要改变呢?选择文件作为载体,工具生态成熟,学习成本为零,迁移成本为零。

  认知 3:代码胜过传统工具定义

  这也是最关键的一个认知。

  传统工具定义的四大缺陷:

  指令含糊不清

  无法自我修改:模型执行受阻时陷入"冷启动"困境

  持续占用上下文:定义会一直占用上下文窗口空间

  缺乏灵活性

  相比之下,代码的三大优势:

  自文档化:代码本身就是最好的说明

  可随时修改:AI 可以自己优化工具

  按需加载:平时存储在文件系统,仅在需要时调用

  举个例子:Claude 经常重复编写相同的 Python 脚本来调整幻灯片样式,每次都要重新编写,浪费 tokens,质量不稳定。

  现在给个解决方案:让 Claude 将这段脚本保存为一项 Skill,现在只需直接运行脚本即可,效率和一致性大幅提升将"重复劳动"转化为"可复用知识"。

  Skills 系统架构设计

  1. 核心组成

  Skills 包含什么?

  Markdown 文件(核心指令)

  软件包

  可执行文件和二进制文件

  脚本

  各类资产

  复杂度演进:

  初期:简单的 Markdown 文件(几分钟完成)

  现在:综合体(需数周甚至数月精耕细作)

  

  2. 逐步披露策略

  当你拥有成百上千个 Skills 时,出现一个问题:如果全部加载到上下文窗口,会瞬间耗尽 tokens。因此,Anthropic 采用了一个逐步披露策略。

  如何实现?运行时流程:

  初始状态:模型只看到 Skills 元数据

  需要使用时:AI Agent 读取 SKILL.md 文件

  获取:核心指令 + 目录索引

  效果是,即使拥有成千上万个 Skills,系统依然高效。

  举个例子:假设一个 AI Agent 拥有 500 个 Skills,

  初始状态:

  Context window:仅包含 500 个 Skills 的元数据

  占用空间:约 5-10K tokens

  用户请求:"帮我生成一份销售报告"

  执行流程:

  Agent 扫描元数据 → 识别出 "sales_reporting" Skill

  加载 sales_reporting/SKILL.md → 读取核心指令和文件结构 → 占用空间:约 1-2K tokens

  按需加载具体脚本 → 读取 generate_report.py → 读取 format_template.json → 执行完毕后从 context 中清除

  这种设计的好处是支持成千上万个 Skills ,上下文窗口消耗始终可控,不需要的 Skills 不占用空间 ,可以动态组合多个 Skills ,支持复杂的工作流编排。

  

  统一架构模型

  经过一年的探索,Anthropic 观察到一个趋势:通用 AI Agent 的架构正趋于统一。

  新兴通用 AI Agent 架构的四大组件:

  Agent Loop:职责是大脑,理解用户意图、规划执行步骤、管理上下文窗口、决定何时调用哪些工具或 Skills。

  运行时环境:执行环境,提供代码执行能力、管理文件系统、处理进程隔离和安全。

  MCP:负责外部世界的物理连接,连接外部 API、访问数据库、调用第三方服务。

  Skills:职责是知识与经验,提供灵魂(专业知识),包含领域专业知识、最佳实践、过程性经验等。

  两者完美互补,形成完整生态。

  

  Skills 生态三大类别

  自发布以来,Skills 生态已经拥有数千项 Skills,主要分为 3 大类。

  1. 基础 Skills

  赋予 AI Agent 全新的通用能力或领域能力。

  案例:

  Document Skills:创作和编辑专业办公文档,支持 Word、PPT、Excel 等格式,理解文档结构和业务逻辑,让 Claude 具备创作和编辑专业办公文档的能力。

  基础 Skills 扩展了模型的基础能力边界,就像为操作系统增加新的系统调用。

  2. 第三方 Skills

  让 Claude 更好地适配第三方产品和服务。

  案例:

  Cadence - 科学研究 Skills:使 Claude 在 EHR 数据分析上表现远超原生模型,熟练应用 Python 生物信息库。

  Browserbase - Stagehand Skills:为开源浏览器自动化工具构建专属 Skills,让 Claude 更熟练地操控浏览器。

  Notion - 工作空间 Skills:深度理解用户的 Notion 工作空间,进行跨文档研究。

  3. 企业私有 Skills

  最令人兴奋的应用场景,针对公司特定场景构建的 Skills。

  典型用例:

  传授组织最佳实践:将公司独特的工作方法编码为 Skills,让新来的 AI 立即理解公司文化,按规矩办事。

  内部软件培训:教会 AI 如何使用公司特有工具,让 AI 像老员工一样熟悉内部系统。

  代码规范遵循:让 Claude Code 遵循内部代码风格和工作流,代码一致性大幅提升。

  

  Anthropic 的工程师观察到的三大趋势

  趋势 1:非技术人员也在构建 Skills

  来自以下领域的专业人士正在创建 Skills:有财务部门、招聘团队、会计师事务所、法律顾问。Skills 让 AI Agent 变得触手可及,即使不擅长编程也能让 AI 适配日常工作。

  趋势 2:Skills 与 MCP 形成完美互补

  开发者正在利用 Skills 编排多个 MCP 工具的工作流

  分工明确:MCP 负责连接,专注于"能不能",MCP 开发者不需要了解所有业务场景。Skills 负责智慧和业务逻辑,专注于"该不该"和"怎么做",Skills 创建者不需要处理底层连接细节。

  N 个 MCP Servers × M 个 Skills,灵活性远超单一工具。

  趋势 3:Skills 日益复杂化

  从简单 Markdown 到包含多种资产的综合体,开发周期从几分钟到数周/数月。为什么复杂化是好事?说明 Skills 开始承载真实业务逻辑,生态走向成熟。

  Anthropic 内部应用成果

  在分享中, Anthropic 工程师还介绍了公司内部的垂直领域落地案例。在 Skills 功能发布后,Anthropic 紧接着推出了两个专业方案:

  金融服务专业方案

  生命科学专业方案

  实现方式:预装 MCP 服务器 + Skills 包 → Claude 立即成为领域专家助手。传统方式开发垂直领域 AI 需要 6-12 个月,Skills 方式配置垂直领域 AI 仅需数周。不只可以快速迭代和调整,Skills 还可以跨场景使用。

  Skills 未来探索的四大方向

  1. 软件工程化管理

  需求:像对待软件一样对待 Skills

  具体措施:

  引入测试与评估机制

  开发更好的触发工具(确保正确时间触发正确 Skills)

  建立输出质量衡量标准

  完善版本控制系统

  2. Skills 依赖关系管理

  目标:让 Skills 可以引用其他 Skills、MCP 服务器或环境包

  价值:

  AI Agent 在复杂环境下行为更可控、更精准

  通过多 Skills 组合,激发处理高级任务的潜力

  3. 共享与分发生态

  愿景:企业内部拥有由员工与 AI 共同维护、不断进化的能力知识库

  复利效应:企业内部能力知识库的不断进化。

  4. 持续学习

  核心突破:Skills 是迈向持续学习的具体步骤

  记忆具象化:

  过去:信息的堆砌

  现在:针对特定任务的过程性知识

  学习可能性:标准化格式保证:Claude 记录的任何经验都能被未来的自己高效继承。

  灵活优势:随着合作时间增加,瞬间习得新能力,根据需求不断优化,果断舍弃过时操作。

  终极目标

  "与你共事 30 天后的 Claude,表现应当远优于第 1 天。"

  当前进展:Claude 已可利用 Skill Creator 自动生成 Skills。

  Skills 的定位

  让每个人都能通过简单的文件夹,将创意与专业知识转化为解决现实问题的力量。

  Anthropic 的工程师表示,Skills,只是这场变革的起点。Skills 系统,通过极简的文件格式,解决了 AI Agent 缺乏领域专业知识的核心痛点,并构建了一个开放、可组合、可进化的生态系统。AI 持续学习,让专业经验自由流动,让组织知识的永久沉淀。

  真正的价值不在于构建更聪明的 AI,而在于让 AI 具备可复用、可积累、可共享的专业经验。这才是 AI Agent 走向实用的关键路径。

  | 文章来源:数字开物

   • END

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
福建小伙在柬埔寨街头流浪,被打致身上多处伤口,当地华人救助后开直播帮忙找到家人

福建小伙在柬埔寨街头流浪,被打致身上多处伤口,当地华人救助后开直播帮忙找到家人

潇湘晨报
2026-01-16 19:52:12
李湘还能活多久

李湘还能活多久

求实处
2026-01-16 19:43:38
原来聂卫平的父亲是他,难怪能够十连胜为国争光,真是虎父无犬子

原来聂卫平的父亲是他,难怪能够十连胜为国争光,真是虎父无犬子

以茶带书
2026-01-16 17:17:29
西贝老板昏了头,居然找来一群臭名昭著的微博“爱国大V”帮场子

西贝老板昏了头,居然找来一群臭名昭著的微博“爱国大V”帮场子

云中有一鹤
2026-01-17 01:08:27
国家出手,李湘全网账号被封!知情人曝原因,比闫学晶风波还恶劣

国家出手,李湘全网账号被封!知情人曝原因,比闫学晶风波还恶劣

阿纂看事
2026-01-16 14:58:49
人民日报点名批评,这类主播将被严厉打击,乱象已经存在多年

人民日报点名批评,这类主播将被严厉打击,乱象已经存在多年

新游戏大妹子
2026-01-14 13:07:41
三位离退休“老干部”分别在美国、日本和澳大利亚去世...

三位离退休“老干部”分别在美国、日本和澳大利亚去世...

深度报
2026-01-15 22:44:55
中方高规格接待,卡尼赴京吃晚宴,现场安排特殊,交易迎来窗口期

中方高规格接待,卡尼赴京吃晚宴,现场安排特殊,交易迎来窗口期

浪子阿邴聊体育
2026-01-16 01:25:59
茅台:民企纳税百万可申购平价飞天

茅台:民企纳税百万可申购平价飞天

21世纪经济报道
2026-01-16 18:59:48
5-3!3-2!U23亚洲杯一夜2队晋级4强:越南加时绝杀 日本点球逆转

5-3!3-2!U23亚洲杯一夜2队晋级4强:越南加时绝杀 日本点球逆转

侃球熊弟
2026-01-17 02:24:21
因房东翻倍涨价,北京嫣然天使儿童医院共欠租金2000多万或被关停,李亚鹏的采访视频曝光后,公众涌入捐款入口,捐款金额已达881万

因房东翻倍涨价,北京嫣然天使儿童医院共欠租金2000多万或被关停,李亚鹏的采访视频曝光后,公众涌入捐款入口,捐款金额已达881万

极目新闻
2026-01-16 11:25:23
罗永浩、贾国龙均被禁言

罗永浩、贾国龙均被禁言

扬子晚报
2026-01-16 22:36:42
美国军火商洛马公司因没缴纳中方开出990亿罚单,后果竟如此严重

美国军火商洛马公司因没缴纳中方开出990亿罚单,后果竟如此严重

百态人间
2025-12-13 16:07:09
俄新型无人机首次被发现通过星链网络操控,俄军全面使用星链

俄新型无人机首次被发现通过星链网络操控,俄军全面使用星链

山河路口
2026-01-16 18:52:11
贾国龙宣布晚上10点要全面回应罗永浩后,曝2人账号均已被禁言

贾国龙宣布晚上10点要全面回应罗永浩后,曝2人账号均已被禁言

可达鸭面面观
2026-01-16 22:44:49
宝马X5价格再下放!最高优惠10.9万,网友表示:还要啥奥迪?

宝马X5价格再下放!最高优惠10.9万,网友表示:还要啥奥迪?

汽车网评
2026-01-16 22:07:17
悲壮啊,贾国龙要跟罗永浩拼刺刀了!

悲壮啊,贾国龙要跟罗永浩拼刺刀了!

葱哥说
2026-01-16 20:57:31
拔出萝卜带出泥!李湘全网被禁关,王诗龄身份遭质疑,前夫已被抓

拔出萝卜带出泥!李湘全网被禁关,王诗龄身份遭质疑,前夫已被抓

一娱三分地
2026-01-16 19:22:29
多地接连发生醉驾肇事致多死恶性事故,公安部提示:抵制酒驾

多地接连发生醉驾肇事致多死恶性事故,公安部提示:抵制酒驾

澎湃新闻
2026-01-16 11:05:12
47岁贺娇龙抢救细节太催泪,生前曾一语成谶,和丈夫常分隔两地

47岁贺娇龙抢救细节太催泪,生前曾一语成谶,和丈夫常分隔两地

古希腊掌管松饼的神
2026-01-15 11:14:09
2026-01-17 03:28:49
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4480文章数 37391关注度
往期回顾 全部

科技要闻

贾国龙与罗永浩被禁言,微博CEO回应

头条要闻

美媒披露:美国出动海军陆战队和福特号航母

头条要闻

美媒披露:美国出动海军陆战队和福特号航母

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

李湘翻车,早就有迹可循!

财经要闻

清流|酒店商家在携程和美团之间沦为炮灰

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

艺术
时尚
房产
教育
军事航空

艺术要闻

180米!上海北外滩新地标,设计藏了3个“小心机”

今年冬天最时髦保暖的4组搭配,照着穿美出新高度!

房产要闻

喜封金顶 臻境初呈丨中粮·铂悦壹号3#楼封顶大吉!

教育要闻

初试成绩出来了!404分...

军事要闻

欧洲多国向格陵兰岛派遣军事人员 白宫回应

无障碍浏览 进入关怀版