Jun 19, 2026

HermesSkill多AgentAI协作OpenClaw自动化AI Agent

Skill技能系统与多Agent协作——让AI从单兵变团队

本文是 Hermes（小龙虾）实战系列的第三篇。前两篇我们解决了”装得上”和”跑得动”的问题，这一篇要解决最关键的一步：怎么让 AI 从一个会聊天的工具，变成一支能干活的数字团队。

开篇：为什么裸装的 Hermes，可能只发挥了 10% 的能力？

很多人装完 Hermes（OpenClaw）后的体验是这样的：问它问题，它回答得不错；让它写个文案，也能写。但用着用着就发现——它永远只是”一个”AI，一个什么都得你手把手交代、交代完还不一定对的”临时工”。

这其实是常态。裸装的 Hermes，就像一台刚出厂、什么软件都没装的电脑。硬件再强，没有应用也是白搭。它真正的门槛，早就不是”把主程序跑起来”，而是你能不能把它从一个会聊天的工具，变成一个能长期协作的助手。

这中间差的，主要是两样东西：

Skills（技能系统）：决定 AI 会干什么、能调用什么能力；
多 Agent 协作：决定 AI 是”一个人单干”，还是”一支团队协同作业”。

掌握这两样，你的 AI 才真正像一个能干活的”数字员工”。本文我们就把这两件事彻底讲透。

第一节：Skill 是什么？怎么选？

Skill 的本质：给 AI 装”专业插件”

你可以把 Skill 理解成 AI 的职业技能包。就像一个新员工入职，公司不会指望他什么都会——但他可以按需”培训”（装技能）。

Hermes/OpenClaw 的技能都托管在一个叫 ClawHub 的公开技能库里（https://clawhub.ai/skills），完全免费，类似手机的应用商店。截至现在，社区里已经有上百个技能，覆盖搜索、写作、浏览器自动化、知识图谱、邮件日历等等。

新手”三件套”推荐

技能不是装得越多越好——装太多，调用逻辑变复杂，自己也形不成稳定习惯。更聪明的做法是先按场景装，再慢慢扩。如果只能先装三个，强烈推荐下面这套”黄金三件套”，覆盖了任何场景都需要的基础能力：

技能	作用	为什么必装
self-improving-agent	自动复盘错误、总结经验，越用越聪明	让 AI 拥有”学习能力”，不再重蹈覆辙
Find Skills	帮你发现并推荐合适的技能	不知道该装什么时，让它自己推荐
Skill Vetter	安装技能前做安全审查	防止被恶意技能坑害

这三个技能保证你的 AI 能持续进步、发现好工具、又不被坑害，是任何场景的地基。

进阶用户还可以按需补充：

Summarize：把网页、PDF、音频、视频快速压缩成可读结论；
Agent Browser（Playwright）：让 AI 拥有浏览器自动化能力，能打开网页、点击、填表、截图；
ontology：用结构化知识图谱管理记忆，强化长期记忆；
Gog / Github：打通 Google 全家桶 / GitHub，做办公与开发协作。

安装方法：四步搞定

技能安装非常简单，用 ClawHub 命令行工具即可：

# 1. 全局安装 clawhub 命令行工具
npm i -g clawhub

# 2. 登录（从设置页面获取 token）
clawhub login --token 你的token

# 3. 安装技能（以自我进化技能为例）
clawhub install self-improving-agent

# 4. 查看已安装技能 / 更新全部技能
clawhub list
clawhub update --all

也可以更省事——直接把技能地址发给你的 AI 机器人，说一句”帮我安装技能：https://clawhub.ai/…/技能名”，它就会自动安装。

第二节：自动进化——Self-Improving 原理与效果

三件套里最值得单独说的是 self-improving-agent（自我进化技能）。它是 ClawHub 下载量排名第一的技能，也是让 AI 从”健忘”变”长记性”的关键。

它解决了一个什么痛点？

普通 AI 有个致命缺陷：同类错误反复犯，用户纠正了它也不长记性。今天你告诉它”我喜欢简洁的文风”，明天它又给你写一堆啰嗦的长句。每次对话都像从零开始。

self-improving-agent 做的事情，就是给 AI 装上一个自动复盘机制。具体来说：

捕获失败：当命令或操作意外失败时，自动记录下来；
捕获纠正：当你纠正 AI 的输出时，自动识别并记录；
沉淀经验：把错误和纠正转化为长期记忆（写入 MEMORY.md）；
下次调整：下次遇到类似情况，自动检索记忆、调整策略。

打个比方，这就像给临时工配了一个”错题本”。以前干完活就走，下次还犯同样的错；现在每犯一次错就记一笔，越干越熟练。

进化引擎：Evolver 与主动代理

社区里还有几个”进化系”技能可以搭配使用，形成更强的自我成长闭环：

Evolver（能力进化引擎）：分析运行历史，自动识别可改进的点，按协议约束进行进化；
Proactive Agent（主动代理）：把 AI 从”被动执行”升级成”主动推进”，支持工作缓冲区、自主定时任务和持续改进；
Agent Memory / Memory Manager：提供跨会话的持久记忆，支持自动快照和语义搜索。

把 self-improving + proactive + memory 这几个技能组合起来，你的 AI 就具备了自我反思、自我学习、主动推进的能力——这就是”会成长的 AI”的真正含义。

一个真实效果：装上 self-improving 之后，AI 在每次执行失败后会自动记录错误、分析原因、总结经验，并在下次遇到类似情况时自动调整策略。你不需要反复教它同一件事。

第三节：从单 Agent 到多 Agent——三种协作模式详解

技能解决了”单个 AI 会干什么”，但要完成复杂任务，往往需要多个角色配合。这就引出了多 Agent 协作。

你可以把多 Agent 想象成公司的组织架构：一个老板（调度中枢）带着几个专业员工（技术、文案、调研），各司其职，任务按分工流转。

OpenClaw/Hermes 根据机器人接入方式，提供了三种主流协作模式，覆盖 90% 以上的使用场景：

模式一：单 Bot 多 Agent（最常用，入门首选）

比喻：就像一个公司的总机号码，所有电话都打进来，由前台（主 Agent）判断转给哪个部门。

定义：只接入一个机器人，由 Main 主 Agent 对接，背后挂载多个子 Agent（产品、设计、开发、文案等）。
运行逻辑：用户发消息 → 主 Agent 接收 → 智能路由 → 派发给对应子 Agent → 结果返回主 Agent → 回复用户。
特点：共用工作区、记忆、技能；只需维护一个机器人；适合个人/小团队。
典型场景：一个机器人对接所有群，发开发任务自动派给开发 Agent，发文案自动派给文案 Agent。

模式二：多 Bot 多 Agent（独立隔离，专业分工）

比喻：就像每个部门都有自己的直线电话，你可以直接打到具体部门。

定义：每个 Agent 对应一个独立机器人，主 Agent、产品、设计、开发各有自己的机器人。
特点：工作区、记忆、技能独立；权限更清晰；适合多角色团队；无需主 Agent 转发。
典型场景：产品机器人只接需求，开发机器人只写代码，各自独立响应。

模式三：A2A 协作（Agent to Agent 流水线协同）

比喻：就像工厂流水线，任务按固定工序一道道往下传。

定义：基于单 Bot 的流程化协作，任务按固定流水线执行。
运行逻辑：发任务 → 主 Agent → 产品调研 → 设计输出 → 开发实现 → 汇总返回。
特点：强流程、强协作；配置复杂度最高；建议熟练前两种再使用。
典型场景：内容生产（采编 → 文案 → 设计 → 运营）、项目开发（需求 → 原型 → 代码 → 测试）。

还有一种高阶”组合模式”（单Bot+A2A、多Bot+A2A），属于顶配方案，新手不建议直接上手。

一键搭建：多智能体向导 Skill

对于新手，官方推出了多智能体向导 Skill，用大白话引导你完成搭建，全程选择题操作，无需手写配置：

启动多智能体向导

它会自动：检查环境 → 让你选模式 → 设置 Agent 信息 → 提醒机器人权限配置 → 自动生成 SOUL.md、AGENTS.md、USER.md 三个核心文件 → 提示重启生效。

第四节：8 脑区架构实战（角色职责与模型分配）

模式选好后，具体怎么分工？社区里有一套被广泛验证的**“8 脑区”架构**，把多 Agent 比作人脑的多个脑区协同工作——这是目前最成熟的多 Agent 设计范式之一。

为什么是”脑区”而不是”员工”？

这里有一个关键的认知转变：人脑不是工头带着一群打工的，而是多个脑区协同工作。前额叶管规划，海马体管记忆，每个区域有自己的职责，但共享同一个”自我”。

所以每个 Agent 不再是”被调用的函数”，而是”系统的一部分”。关键设计是：main 是唯一对外人格，用户只和 main 对话，main 向内调度其他脑区。用户感受到的是”一个统一的 AI”，但后面是分工协作。

8 个脑区的职责

脑区	类比	它做什么
main	调度中心	唯一用户入口。接收请求、判断任务、分派任务、收集结果。它不干活，它决定谁干活
planner	前额叶	把复杂任务拆成执行计划。只规划不执行
analyst	分析皮层	数据分析、研究、判断。核心纪律：先证据后结论
writer	语言区	把已有信息变成清楚、可读的文字。不为了流畅而编造事实
builder	运动皮层	写代码、搭自动化、做集成。有副作用的动作必须等批准
review	制动器	质量和风险把关，专门挑毛病。不确定时宁可拒绝也不放行
librarian	检索系统	找资料、整理材料、压缩信息。只做”输入净化”
learner	海马体	从反馈中提炼可复用认知。只产出提案，不直接改规则

为什么是这 8 个？因为它覆盖了完整的知识工作链：规划 → 分析 → 执行 → 表达 → 审查 → 检索 → 学习。每个环节的目标甚至是对立的——比如 writer 要把事说得好听，review 要挑刺；analyst 要快速判断，learner 要慢下来总结。把它们塞进同一个 prompt 里会打架，拆开就清晰了。

每个角色怎么配置？

每个 Agent 在自己的工作区（workspace）里，通过三个 Markdown 文件定义行为：

SOUL.md（性格）：定义它是谁——认知倾向、表达风格、行为边界、失控预防。
AGENTS.md（工作规则）：定义它怎么工作——任务流程、委派规则、硬边界。
MEMORY.md（记忆范围）：定义它记什么——每个角色只记它需要的东西。

一个值得注意的设计细节：review 的宜人性故意设为”低到中”。你不希望质检员是个”好好先生”，它的工作就是挑毛病。同理，writer 的 SOUL.md 里会写”不要为了流畅而补事实”——这是 LLM 写作最常见的失败模式。

下面是一个典型的 main（调度中心）的 SOUL.md 示例：

# 核心身份
你不是前台或传声筒。你是一个统一的大脑，对外只呈现一个"我"。

# 大五人格
- 开放性: 中高 | 尽责性: 高 | 外向性: 低 | 宜人性: 中 | 情绪稳定性: 高

# 认知策略
- 先判断任务类型，再决定是否需要多阶段流程
- 复杂任务先给流程卡，不直接开跑
- 对高风险任务默认保守

# 失控风险提醒
- 不要为了显得聪明而越权调用过多脑区
- 不要为了提高效率而跳过审批或 review

流程卡制度：人在回路，但不微管理

main 在执行多步任务前，必须先给用户看一张”流程卡”：

流程卡
- 任务类型：分析报告
- 建议链路：librarian(找资料) → analyst(分析) → writer(成稿) → review(审查)
- 为什么这么走：涉及数据引用，需要审查事实准确性
- 预期输出：2000字分析报告
- 是否包含 review：是
请回复：批准执行 / 修改计划 / 取消

用户看到链路可以调整——“这个不需要 review，直接出稿”或”加一步 learner 总结经验”。人始终在回路里，但不需要微管理每一步。

模型分配策略：钱花在刀刃上

多 Agent 架构最大的成本优势是：可以按角色分配模型，而不是按对话分配。原则就一句话——“让便宜模型撑住高频日常，让强模型守住关键节点”。

┌────────────────────────────────────────────┐
│  成本低 ◄─────────────────► 成本高          │
└────────────────────────────────────────────┘

调用频率高（日常高频）
  main / writer / analyst / builder
  → 用便宜快的模型（如 GLM-5、MiniMax、Qwen-Turbo）

调用频率低（关键节点）
  planner / review / learner
  → 用强推理模型（如 Claude Opus、GPT-5.4）

长上下文场景
  librarian
  → 用长上下文模型（如 Kimi K2.5）

传统用法是”这次对话用 GPT-4，那次用便宜模型”；多 Agent 架构下，是”review 永远用强模型，librarian 永远用便宜模型”。同一个任务里，不同步骤用不同模型，把成本压到最低。

第五节：多 Agent 权限与安全（deny 优先、沙箱隔离）

多 Agent 协作一旦跑起来，安全就是头等大事。想象一下：如果让一个”新闻助理”拥有了执行 Shell 脚本的权限，后果可能很严重。OpenClaw 提供了一套细粒度的安全方案。

原则一：deny 优先

在 OpenClaw 中，deny（拒绝）的优先级永远高于 allow（允许）。也就是说，一旦某个工具被列入 deny 名单，无论 allow 里写了什么，它都不能用。这是最关键的安全铁律。

{
  "id": "news-agent",
  "name": "新闻资讯助理",
  "tools": {
    "allow": ["sessions_list", "sessions_send", "read"],
    "deny": ["write", "edit", "exec", "apply_patch", "bash"]
  }
}

上面这个配置里，新闻助理只能查看和发消息，明确禁用了写文件、编辑、执行脚本等高危操作。

原则二：会话隔离（Session Isolation）

每个 Agent 默认处于绝对的上下文隔离中，只关注自己的目标，互相看不到对方的对话历史。这从根本上了杜绝了信息串扰。

agentId 唯一标识：每个 Agent 都有小写 ID（如 code-agent、news-agent），系统据此精准路由；
会话可见度：可以控制 Agent 是否能”偷听”全局对话（visibility 可设为 self、tree、agent、all）。

"tools": {
  "agentToAgent": {
    "enabled": true,
    "allow": ["code-agent", "news-agent", "main"]
  },
  "sessions": {
    "visibility": "self"
  }
}

原则三：Body 与 Brain 解耦

OpenClaw 把 Agent 的物理运行环境和灵魂认知记忆做了彻底解耦：

agentDir（Body 物理层）：~/.openclaw/agents/<agentId>/agent/，存放 API Keys、模型配置等敏感凭证。
Workspace（Brain 认知层）：~/.openclaw/workspace-<name>/，存放 SOUL.md、MEMORY.md 等行为与记忆。

千万不要在不同的 Agent 之间复用同一个 agentDir，否则 Auth 和 Session 会严重冲突。

原则四：三级操作审批

团队版（如 Clawith）进一步提供了三级自主权限控制，让你敢放开手脚用：

级别	行为	适用场景
L1 全自动执行	直接干，无需确认	低风险日常操作
L2 执行后通知	先干活再汇报	中等风险操作
L3 执行前审批	必须人工确认才执行	高风险操作（如删除、对外发送）

配合用量配额管理（限制每个 Agent 的消息数和 Token 上限）和审计日志（每一步操作可追溯），多 Agent 系统就既强大又可控了。

第六节：实战案例：搭建一个内容生产团队

理论讲完了，我们用一个真实场景把整条链路串起来。假设你要搭一个自媒体内容生产团队，从选题到交付全自动流转。

团队编制（参考 8 脑区精简版）

角色	对应脑区	职责	推荐模型
main	调度中心	接需求、拆任务、汇总交付	便宜模型（Qwen-Turbo）
newsAgent	librarian/检索	抓取全网爆款、清洗降噪	长上下文模型（Kimi）
analyst	分析皮层	拆解爆款结构、提炼选题	强模型（Claude）
writer	语言区	根据选题写文案	便宜模型（GLM-5）
review	制动器	事实核查、质量把关	强模型（Claude Opus）

第一步：配通权限与通信

先在 openclaw.json 里开通点对点通讯白名单，让 Agent 之间能对话：

"tools": {
  "agentToAgent": {
    "enabled": true,
    "allow": ["main", "news-agent", "analyst", "writer", "review"]
  },
  "sessions": {
    "visibility": "tree"
  }
}

第二步：给每个角色注入灵魂

以 newsAgent（情报助理）为例，写一份清晰的 SOUL.md：

# SOUL.md - news-agent
你是团队的信息触角。
性格：敏锐、客观、信息处理速度极快。
职责：只负责全网爆款内容的抓取、清洗与聚合。
你要过滤噪音，把冗长网页转化为结构化简报返回给调度者。
不要参与任何系统级别的代码修改。

第三步：配置记忆触发，避免重复劳动

在 AGENTS.md 里加入记忆检索规则，让 Agent 主动查历史沉淀：

规则名称：内容记忆检索
触发关键词：选题、爆款、复盘、知识库、之前
触发格式：[[关键词]]
执行动作：
  - 检索 Obsidian 仓库
  - 匹配最近 3 条相关内容
  - 融入当前回答，不重复、不编造

第四步：一条指令跑通全流程

一切就绪后，你只需要对 main 说一句话：

“帮我分析最近小红书’AI 工具’赛道的 3 个爆款，生成 2 个可复用选题，写成 800 字短文案。”

接下来，A2A 流水线自动启动：

1. main 接收需求，判断走"内容生产"链路，给出流程卡
2. 你批准后 →
3. newsAgent 抓取 3 个爆款原文，清洗降噪，返回结构化简报
4. analyst 拆解爆款结构（标题套路/结构/金句/数据点），提炼选题
5. writer 根据选题写成 800 字文案
6. review 核查事实、把关质量，标注置信度
7. main 汇总结果交付给你，同时 learner 沉淀"这次什么选题跑得好"

整个过程，你只在开头批准了一次流程卡，在结尾收了交付物。你不再是 AI 的监工，而是它的项目经理。

第五步：让它自己长大

装上 self-improving 技能，配合 Obsidian 记忆库，这个团队会越用越强：每次爆款拆解的经验都会沉淀下来，下次选题时自动参考；每次文案被 review 打回的原因也会记录，writer 下次会主动避开。

这就是从”单兵”到”团队”的质变：不是你一个个地指挥 AI 干活，而是你搭好一个会自我进化的协作系统。

结语

回到开篇的问题：为什么裸装的 Hermes 只用了 10% 的能力？因为它缺了”技能”和”团队”这两条腿。

Skill 技能系统，让单个 AI 从”什么都不会”变成”样样精通”，还能自我进化、越用越聪明；
多 Agent 协作，让 AI 从”一个人单干”变成”一支各司其职、协同作业的数字团队”。

记住这三个递进的层次：工具 → 外包团队 → 脑区协同 → 可生长的系统。每上一层，你需要的亲自操劳就更少一分，而 AI 能帮你承担的就更多一分。

下一篇，我们会讲这个系统的”另一半”——知识管理与记忆系统。毕竟，一个会干活但不长记性的团队，终究只是高级临时工。让 AI 拥有”过目不忘的大脑”，才是它真正不可替代的开始。