![]()
最近刷屏Skills是什么,发布5周出现了数千个 Skills,他们有哪些类型,Skills为什么重新定义了 AI Agent 的开发方式,又有令人兴奋的应用场景?我们详细拆解了Claude Code 两位核心开发者的演讲视频(Stop building agents, build skills instead),带你一文读懂Skills如何让AI从"每次从头学"变成"越用越懂你"。

Barry Zhang 和 Mahesh Murag 是 Anthropic 的工程师,他们发现,如今许多人已经将 AI Agent 深度融入了日常工作。即便如此,差距依然存在,生成的回报里仍夹杂着不少低质内容。
问题的本质是:AI Agent 虽然聪明、有能力,但未必具备解决实际业务所需的专业经验。
举个例子,Mahesh 是智商 300 的数学天才,Barry 是经验丰富的税务专家,当你需要报税时,你会找谁?毫无疑问,我会选 Barry。我不希望 Mahesh 从第一性原理中推导出 2025 年的税法,我需要的是领域专家那种稳定、可靠的执行力。
这里可以做个类比:AI Agent = 智商 300 的 Mahesh,极其聪明,在深度引导下能做出惊人成绩,但在起步阶段往往缺乏关键的背景信息。
你想要的理想状态 = Barry:拥有领域专家的稳定、可靠执行力,无需从头推导就能给出专业答案。
想要达到理想状态,AI Agent 暴露出有三个缺陷:
无法高效吸收你的专业经验
无法随时间自我进化
起步阶段缺乏关键背景信息
这也是 Skills 诞生的原因。
在分享解决方案之前,Barry 和 Mahesh 先回顾了 Anthropic 内部的三个关键认知转变。这些认知是理解 Skills 设计的基础。
三大关键认知
认知 1:"代码即一切"
过去的认知:
不同领域的 AI Agent 在架构上会大相径庭
需要各自的工具链和底层脚手架
每个用例、每个领域都要独立开发一个 AI Agent
在开发 Claude Code 后,团队意识到:
代码不仅是应用场景,更是通往数字世界的通用接口
底层 Agent 逻辑比预想中更具通用性
举个例子,生成一个财务报告,让我们看这个任务具体的任务分解:
调用 API 抓取数据
在文件系统整理资料
用 Python 分析数据
合成特定格式报告
底层仅需:Bash 环境 + 文件系统
结论:底层核心架构可以极其精简,但扩展性极强。
认知 2:文件是最佳协作单元
Skills 的本质:文件的有序集合(就是一个个文件夹)
Skills 是文件的有序集合,它为 AI Agent 打包了可组合的过程性知识。通俗点说,它们就是一个个文件夹。
为什么选择文件作为 Skills 的载体?为什么选择如此"原始"的形式? Anthropic 团队有 3 大设计理念:
1. 普适性
任何拥有电脑的人都能创建和使用
开发者可以用
AI Agent 自己也可以用(这点很关键)
2. 兼容性
完美融入现有工作流:
用 Git 做版本控制
存在 Google Drive
打包分享给团队
3. 永恒性
几十年来,文件一直是最基础的协作单元,既然好用,为何要改变呢?选择文件作为载体,工具生态成熟,学习成本为零,迁移成本为零。
认知 3:代码胜过传统工具定义
这也是最关键的一个认知。
传统工具定义的四大缺陷:
指令含糊不清
无法自我修改:模型执行受阻时陷入"冷启动"困境
持续占用上下文:定义会一直占用上下文窗口空间
缺乏灵活性
相比之下,代码的三大优势:
自文档化:代码本身就是最好的说明
可随时修改:AI 可以自己优化工具
按需加载:平时存储在文件系统,仅在需要时调用
举个例子:Claude 经常重复编写相同的 Python 脚本来调整幻灯片样式,每次都要重新编写,浪费 tokens,质量不稳定。
现在给个解决方案:让 Claude 将这段脚本保存为一项 Skill,现在只需直接运行脚本即可,效率和一致性大幅提升将"重复劳动"转化为"可复用知识"。
Skills 系统架构设计
1. 核心组成
Skills 包含什么?
Markdown 文件(核心指令)
软件包
可执行文件和二进制文件
脚本
各类资产
复杂度演进:
初期:简单的 Markdown 文件(几分钟完成)
现在:综合体(需数周甚至数月精耕细作)
![]()
2. 逐步披露策略
当你拥有成百上千个 Skills 时,出现一个问题:如果全部加载到上下文窗口,会瞬间耗尽 tokens。因此,Anthropic 采用了一个逐步披露策略。
如何实现?运行时流程:
初始状态:模型只看到 Skills 元数据
需要使用时:AI Agent 读取 SKILL.md 文件
获取:核心指令 + 目录索引
效果是,即使拥有成千上万个 Skills,系统依然高效。
举个例子:假设一个 AI Agent 拥有 500 个 Skills,
初始状态:
Context window:仅包含 500 个 Skills 的元数据
占用空间:约 5-10K tokens
用户请求:"帮我生成一份销售报告"
执行流程:
Agent 扫描元数据 → 识别出 "sales_reporting" Skill
加载 sales_reporting/SKILL.md → 读取核心指令和文件结构 → 占用空间:约 1-2K tokens
按需加载具体脚本 → 读取 generate_report.py → 读取 format_template.json → 执行完毕后从 context 中清除
这种设计的好处是支持成千上万个 Skills ,上下文窗口消耗始终可控,不需要的 Skills 不占用空间 ,可以动态组合多个 Skills ,支持复杂的工作流编排。
![]()
统一架构模型
经过一年的探索,Anthropic 观察到一个趋势:通用 AI Agent 的架构正趋于统一。
新兴通用 AI Agent 架构的四大组件:
Agent Loop:职责是大脑,理解用户意图、规划执行步骤、管理上下文窗口、决定何时调用哪些工具或 Skills。
运行时环境:执行环境,提供代码执行能力、管理文件系统、处理进程隔离和安全。
MCP:负责外部世界的物理连接,连接外部 API、访问数据库、调用第三方服务。
Skills:职责是知识与经验,提供灵魂(专业知识),包含领域专业知识、最佳实践、过程性经验等。
两者完美互补,形成完整生态。
![]()
Skills 生态三大类别
自发布以来,Skills 生态已经拥有数千项 Skills,主要分为 3 大类。
1. 基础 Skills
赋予 AI Agent 全新的通用能力或领域能力。
案例:
Document Skills:创作和编辑专业办公文档,支持 Word、PPT、Excel 等格式,理解文档结构和业务逻辑,让 Claude 具备创作和编辑专业办公文档的能力。
基础 Skills 扩展了模型的基础能力边界,就像为操作系统增加新的系统调用。
2. 第三方 Skills
让 Claude 更好地适配第三方产品和服务。
案例:
Cadence - 科学研究 Skills:使 Claude 在 EHR 数据分析上表现远超原生模型,熟练应用 Python 生物信息库。
Browserbase - Stagehand Skills:为开源浏览器自动化工具构建专属 Skills,让 Claude 更熟练地操控浏览器。
Notion - 工作空间 Skills:深度理解用户的 Notion 工作空间,进行跨文档研究。
3. 企业私有 Skills
最令人兴奋的应用场景,针对公司特定场景构建的 Skills。
典型用例:
传授组织最佳实践:将公司独特的工作方法编码为 Skills,让新来的 AI 立即理解公司文化,按规矩办事。
内部软件培训:教会 AI 如何使用公司特有工具,让 AI 像老员工一样熟悉内部系统。
代码规范遵循:让 Claude Code 遵循内部代码风格和工作流,代码一致性大幅提升。
![]()
Anthropic 的工程师观察到的三大趋势
趋势 1:非技术人员也在构建 Skills
来自以下领域的专业人士正在创建 Skills:有财务部门、招聘团队、会计师事务所、法律顾问。Skills 让 AI Agent 变得触手可及,即使不擅长编程也能让 AI 适配日常工作。
趋势 2:Skills 与 MCP 形成完美互补
开发者正在利用 Skills 编排多个 MCP 工具的工作流
分工明确:MCP 负责连接,专注于"能不能",MCP 开发者不需要了解所有业务场景。Skills 负责智慧和业务逻辑,专注于"该不该"和"怎么做",Skills 创建者不需要处理底层连接细节。
N 个 MCP Servers × M 个 Skills,灵活性远超单一工具。
趋势 3:Skills 日益复杂化
从简单 Markdown 到包含多种资产的综合体,开发周期从几分钟到数周/数月。为什么复杂化是好事?说明 Skills 开始承载真实业务逻辑,生态走向成熟。
Anthropic 内部应用成果
在分享中, Anthropic 工程师还介绍了公司内部的垂直领域落地案例。在 Skills 功能发布后,Anthropic 紧接着推出了两个专业方案:
金融服务专业方案
生命科学专业方案
实现方式:预装 MCP 服务器 + Skills 包 → Claude 立即成为领域专家助手。传统方式开发垂直领域 AI 需要 6-12 个月,Skills 方式配置垂直领域 AI 仅需数周。不只可以快速迭代和调整,Skills 还可以跨场景使用。
Skills 未来探索的四大方向
1. 软件工程化管理
需求:像对待软件一样对待 Skills
具体措施:
引入测试与评估机制
开发更好的触发工具(确保正确时间触发正确 Skills)
建立输出质量衡量标准
完善版本控制系统
2. Skills 依赖关系管理
目标:让 Skills 可以引用其他 Skills、MCP 服务器或环境包
价值:
AI Agent 在复杂环境下行为更可控、更精准
通过多 Skills 组合,激发处理高级任务的潜力
3. 共享与分发生态
愿景:企业内部拥有由员工与 AI 共同维护、不断进化的能力知识库
复利效应:企业内部能力知识库的不断进化。
4. 持续学习
核心突破:Skills 是迈向持续学习的具体步骤
记忆具象化:
过去:信息的堆砌
现在:针对特定任务的过程性知识
学习可能性:标准化格式保证:Claude 记录的任何经验都能被未来的自己高效继承。
灵活优势:随着合作时间增加,瞬间习得新能力,根据需求不断优化,果断舍弃过时操作。
终极目标
"与你共事 30 天后的 Claude,表现应当远优于第 1 天。"
当前进展:Claude 已可利用 Skill Creator 自动生成 Skills。
Skills 的定位
让每个人都能通过简单的文件夹,将创意与专业知识转化为解决现实问题的力量。
Anthropic 的工程师表示,Skills,只是这场变革的起点。Skills 系统,通过极简的文件格式,解决了 AI Agent 缺乏领域专业知识的核心痛点,并构建了一个开放、可组合、可进化的生态系统。AI 持续学习,让专业经验自由流动,让组织知识的永久沉淀。
真正的价值不在于构建更聪明的 AI,而在于让 AI 具备可复用、可积累、可共享的专业经验。这才是 AI Agent 走向实用的关键路径。
| 文章来源:数字开物
• END •
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.