试想一个场景:你新招了一位实习生,他聪明、反应快,但对你公司的业务流程、内部规范、工具操作一无所知。怎么办?你给他写了一份详细的 SOP 手册,告诉他遇到什么情况该怎么做、用到什么工具、注意什么细节。从此,这位实习生就像一位经验丰富的老员工一样稳定输出。

Agent Skills,就是 AI 智能体的那份 SOP 手册。

🤔 一句话理解 Agent Skills

Agent Skills 是一种轻量级的开放标准,由 Anthropic 于 2025 年底发布,迅速被 OpenAI、Microsoft、GitHub、Cursor 等主流平台采纳。它的核心思想非常简单:

把一个任务的全部“know-how”——操作步骤、判断依据、可执行脚本、参考资料——打包成一个文件夹,AI 智能体在需要时自动读取并严格执行。

Skill 就像 AI 的“即插即用”扩展包。一个 PDF 处理 Skill,让 AI 瞬间掌握提取文本、合并文档的能力;一个发票处理 Skill,让 AI 自动识别发票信息、重命名文件、生成汇总报告。你不必每次都从头教 AI 怎么做,它自己就知道该调用哪个“技能包”。

一个 Skill 长什么样?

Agent Skills 本质是一个按约定组织的文件夹。以 PDF 处理 Skill 为例

pdf-processing/           # 技能文件夹
├── SKILL.md              # 必需:技能定义与工作流
├── references/           # 可选:详细参考资料
│   ├── field-mappings.md
│   └── validation-rules.md
└── scripts/              # 可选:可执行脚本
    └── extract_data.py

核心是 SKILL.md 文件,顶部用 YAML 声明元数据,正文是 Markdown 格式的详细操作说明

---
name: pdf-processing
description: 从 PDF 提取文本和表格,填写表单,合并文档。
---
# PDF 处理工作流

1. 用 `scripts/extract_data.py` 读取 PDF 文件
2. 提取字段:供应商名称、发票号、日期、明细、合计
3. 按 `references/validation-rules.md` 验证数据
4. 按 `references/field-mappings.md` 的 schema 输出 JSON

就是这么简单。AI 读到这个文件,就知道何时该激活这个技能、按什么流程操作、需要时去读取哪些附加文件。

🔄 为什么需要 Skills?——告别“每次重头教一遍”

在 Skills 出现之前,开发者想赋予 AI 专业能力,通常有两种做法:

  1. 写超长 Prompt:把所有操作规范、步骤全部塞进提示词,每次对话都重复一遍,导致上下文臃肿、成本高昂。
  2. 硬编码工具调用:用代码写死调用逻辑,但缺乏灵活性,且不同任务需要写不同的定制 Agent。

Skills 通过 “渐进式披露” 机制,巧妙地解决了这个问题

三步走,按需加载

  • 第一层(元数据) :启动时只加载所有技能的名称和简介,占用极少上下文。
  • 第二层(主体指令) :AI 判断某个技能与当前任务相关时,才加载完整的 SKILL.md
  • 第三层(附加资源) :只有在执行具体步骤时,才读取引用的参考资料或执行脚本。

这种设计让 AI 可以拥有大量专业技能,而不会撑爆上下文窗口。

⚡ Skills vs. MCP Tools:菜谱 vs. 食材

很多人初次接触 Skills 时会问:这和 MCP(Model Context Protocol)工具调用有什么区别?一个生动的比喻可以帮你瞬间厘清

概念比喻解决的问题
MCP Tools🥚 食材(鸡蛋、面粉、盐)“AI 能做什么操作?”(查数据库、调 API、读文件)
Agent Skills📖 菜谱(步骤说明、火候控制)“AI 该怎么做好这件事?”(流程、规范、判断依据)
AI Agent👨‍🍳 厨师根据菜谱选择食材,完成一道菜

MCP 工具是原子化的外部能力——数据库查询、API 调用、文件读写——每个工具只做一件小事。而 Skills 是更高层级的“行为模式”,它告诉 AI:什么时候该用工具、用什么工具、按什么顺序组合、如何验证结果。一个强大的 AI 智能体 = 大模型 + MCP 工具 + Skills 操作流程——三者缺一不可。

🚀 如何创建一个自己的 Skill?

创建一个 Skill 只需要三个步骤

  1. 创建文件夹:命名为技能名称(如 my-first-skill),放在 AI 智能体的 skills 目录下。
  2. 编写 SKILL.md:顶部 YAML 声明 name 和 description,正文用 Markdown 写清楚工作流程和注意事项。
  3. 添加附加文件(可选) :在 scripts/ 放 Python/Shell 脚本,在 references/ 放补充文档。

写好之后,支持 Skills 的 AI 工具(如 Claude Code、Cursor、OpenClaw)会自动识别并加载。当你的任务描述与技能的 description 匹配时,AI 就会激活它,按你写的流程执行。

💡 实践建议:初学者可以从一个简单的“文档格式化”Skill 开始练手——写清楚输入格式、输出要求、处理步骤,然后逐步扩展。

🌍 生态现状:正在爆发的“技能经济”

Agent Skills 的生态发展速度惊人。自 Anthropic 于 2025 年底发布开放标准以来:

  • 主流平台全面跟进:OpenAI Codex、GitHub Copilot、VS Code、Cursor、Claude Code 均已支持
  • 企业级应用落地:Microsoft、Atlassian、Figma、Canva 等已为自家平台开发了 Skills,用于自动化办公、设计辅助等场景
  • 开源社区活跃:OpenClaw(35 万+ GitHub Star)、ModelScope 的 MS-Agent、LangChain 的 deepagents-CLI 等开源项目都已实现 Skills 支持
  • 技能市场兴起:Skills Marketplace 已有超 7 万个社区贡献的技能,涵盖 PDF 处理、数据分析、代码审查、客户支持等各领域。浙大与合作伙伴推出的 SkillNet 更是拥有超 20 万个可复用技能,实测可提升奖励 40%、减少执行步骤 30%。

这场变革的核心意义在于:行业知识首次从“依附于人”变成了“可蒸馏、可复用的技能包” 。专家经验不再锁在个人脑中,而是被标准化、版本化,可以一键分发给整个团队的所有 AI 助手。

Agent Skills 让 AI 从“能回答问题”进化到“能稳定做事”。它用极简的文件夹约定,实现了专业知识的模块化封装与渐进式加载,既避免了上下文爆炸,又让能力的复用和分发变得前所未有的简单。

如果你正在探索如何让 AI 真正融入工作流,Agent Skills 是一个值得立刻上手的方向。毕竟,让 AI 学会按 SOP 办事,才是通往可靠生产力的最短路径。