Skill技能系统与多Agent协作——让AI从单兵变团队
本文是 Hermes(小龙虾)实战系列的第三篇。前两篇我们解决了”装得上”和”跑得动”的问题,这一篇要解决最关键的一步:怎么让 AI 从一个会聊天的工具,变成一支能干活的数字团队。
开篇:为什么裸装的 Hermes,可能只发挥了 10% 的能力?
很多人装完 Hermes(OpenClaw)后的体验是这样的:问它问题,它回答得不错;让它写个文案,也能写。但用着用着就发现——它永远只是”一个”AI,一个什么都得你手把手交代、交代完还不一定对的”临时工”。
这其实是常态。裸装的 Hermes,就像一台刚出厂、什么软件都没装的电脑。硬件再强,没有应用也是白搭。它真正的门槛,早就不是”把主程序跑起来”,而是你能不能把它从一个会聊天的工具,变成一个能长期协作的助手。
这中间差的,主要是两样东西:
- Skills(技能系统):决定 AI 会干什么、能调用什么能力;
- 多 Agent 协作:决定 AI 是”一个人单干”,还是”一支团队协同作业”。
掌握这两样,你的 AI 才真正像一个能干活的”数字员工”。本文我们就把这两件事彻底讲透。
第一节:Skill 是什么?怎么选?
Skill 的本质:给 AI 装”专业插件”
你可以把 Skill 理解成 AI 的职业技能包。就像一个新员工入职,公司不会指望他什么都会——但他可以按需”培训”(装技能)。
Hermes/OpenClaw 的技能都托管在一个叫 ClawHub 的公开技能库里(https://clawhub.ai/skills),完全免费,类似手机的应用商店。截至现在,社区里已经有上百个技能,覆盖搜索、写作、浏览器自动化、知识图谱、邮件日历等等。
新手”三件套”推荐
技能不是装得越多越好——装太多,调用逻辑变复杂,自己也形不成稳定习惯。更聪明的做法是先按场景装,再慢慢扩。如果只能先装三个,强烈推荐下面这套”黄金三件套”,覆盖了任何场景都需要的基础能力:
| 技能 | 作用 | 为什么必装 |
|---|---|---|
| self-improving-agent | 自动复盘错误、总结经验,越用越聪明 | 让 AI 拥有”学习能力”,不再重蹈覆辙 |
| Find Skills | 帮你发现并推荐合适的技能 | 不知道该装什么时,让它自己推荐 |
| Skill Vetter | 安装技能前做安全审查 | 防止被恶意技能坑害 |
这三个技能保证你的 AI 能持续进步、发现好工具、又不被坑害,是任何场景的地基。
进阶用户还可以按需补充:
- Summarize:把网页、PDF、音频、视频快速压缩成可读结论;
- Agent Browser(Playwright):让 AI 拥有浏览器自动化能力,能打开网页、点击、填表、截图;
- ontology:用结构化知识图谱管理记忆,强化长期记忆;
- Gog / Github:打通 Google 全家桶 / GitHub,做办公与开发协作。
安装方法:四步搞定
技能安装非常简单,用 ClawHub 命令行工具即可:
# 1. 全局安装 clawhub 命令行工具
npm i -g clawhub
# 2. 登录(从设置页面获取 token)
clawhub login --token 你的token
# 3. 安装技能(以自我进化技能为例)
clawhub install self-improving-agent
# 4. 查看已安装技能 / 更新全部技能
clawhub list
clawhub update --all
也可以更省事——直接把技能地址发给你的 AI 机器人,说一句”帮我安装技能:https://clawhub.ai/…/技能名”,它就会自动安装。
第二节:自动进化——Self-Improving 原理与效果
三件套里最值得单独说的是 self-improving-agent(自我进化技能)。它是 ClawHub 下载量排名第一的技能,也是让 AI 从”健忘”变”长记性”的关键。
它解决了一个什么痛点?
普通 AI 有个致命缺陷:同类错误反复犯,用户纠正了它也不长记性。今天你告诉它”我喜欢简洁的文风”,明天它又给你写一堆啰嗦的长句。每次对话都像从零开始。
self-improving-agent 做的事情,就是给 AI 装上一个自动复盘机制。具体来说:
- 捕获失败:当命令或操作意外失败时,自动记录下来;
- 捕获纠正:当你纠正 AI 的输出时,自动识别并记录;
- 沉淀经验:把错误和纠正转化为长期记忆(写入
MEMORY.md); - 下次调整:下次遇到类似情况,自动检索记忆、调整策略。
打个比方,这就像给临时工配了一个”错题本”。以前干完活就走,下次还犯同样的错;现在每犯一次错就记一笔,越干越熟练。
进化引擎:Evolver 与主动代理
社区里还有几个”进化系”技能可以搭配使用,形成更强的自我成长闭环:
- Evolver(能力进化引擎):分析运行历史,自动识别可改进的点,按协议约束进行进化;
- Proactive Agent(主动代理):把 AI 从”被动执行”升级成”主动推进”,支持工作缓冲区、自主定时任务和持续改进;
- Agent Memory / Memory Manager:提供跨会话的持久记忆,支持自动快照和语义搜索。
把 self-improving + proactive + memory 这几个技能组合起来,你的 AI 就具备了自我反思、自我学习、主动推进的能力——这就是”会成长的 AI”的真正含义。
一个真实效果:装上 self-improving 之后,AI 在每次执行失败后会自动记录错误、分析原因、总结经验,并在下次遇到类似情况时自动调整策略。你不需要反复教它同一件事。
第三节:从单 Agent 到多 Agent——三种协作模式详解
技能解决了”单个 AI 会干什么”,但要完成复杂任务,往往需要多个角色配合。这就引出了多 Agent 协作。
你可以把多 Agent 想象成公司的组织架构:一个老板(调度中枢)带着几个专业员工(技术、文案、调研),各司其职,任务按分工流转。
OpenClaw/Hermes 根据机器人接入方式,提供了三种主流协作模式,覆盖 90% 以上的使用场景:
模式一:单 Bot 多 Agent(最常用,入门首选)
比喻:就像一个公司的总机号码,所有电话都打进来,由前台(主 Agent)判断转给哪个部门。
- 定义:只接入一个机器人,由 Main 主 Agent 对接,背后挂载多个子 Agent(产品、设计、开发、文案等)。
- 运行逻辑:用户发消息 → 主 Agent 接收 → 智能路由 → 派发给对应子 Agent → 结果返回主 Agent → 回复用户。
- 特点:共用工作区、记忆、技能;只需维护一个机器人;适合个人/小团队。
- 典型场景:一个机器人对接所有群,发开发任务自动派给开发 Agent,发文案自动派给文案 Agent。
模式二:多 Bot 多 Agent(独立隔离,专业分工)
比喻:就像每个部门都有自己的直线电话,你可以直接打到具体部门。
- 定义:每个 Agent 对应一个独立机器人,主 Agent、产品、设计、开发各有自己的机器人。
- 特点:工作区、记忆、技能独立;权限更清晰;适合多角色团队;无需主 Agent 转发。
- 典型场景:产品机器人只接需求,开发机器人只写代码,各自独立响应。
模式三:A2A 协作(Agent to Agent 流水线协同)
比喻:就像工厂流水线,任务按固定工序一道道往下传。
- 定义:基于单 Bot 的流程化协作,任务按固定流水线执行。
- 运行逻辑:发任务 → 主 Agent → 产品调研 → 设计输出 → 开发实现 → 汇总返回。
- 特点:强流程、强协作;配置复杂度最高;建议熟练前两种再使用。
- 典型场景:内容生产(采编 → 文案 → 设计 → 运营)、项目开发(需求 → 原型 → 代码 → 测试)。
还有一种高阶”组合模式”(单Bot+A2A、多Bot+A2A),属于顶配方案,新手不建议直接上手。
一键搭建:多智能体向导 Skill
对于新手,官方推出了多智能体向导 Skill,用大白话引导你完成搭建,全程选择题操作,无需手写配置:
启动多智能体向导
它会自动:检查环境 → 让你选模式 → 设置 Agent 信息 → 提醒机器人权限配置 → 自动生成 SOUL.md、AGENTS.md、USER.md 三个核心文件 → 提示重启生效。
第四节:8 脑区架构实战(角色职责与模型分配)
模式选好后,具体怎么分工?社区里有一套被广泛验证的**“8 脑区”架构**,把多 Agent 比作人脑的多个脑区协同工作——这是目前最成熟的多 Agent 设计范式之一。
为什么是”脑区”而不是”员工”?
这里有一个关键的认知转变:人脑不是工头带着一群打工的,而是多个脑区协同工作。前额叶管规划,海马体管记忆,每个区域有自己的职责,但共享同一个”自我”。
所以每个 Agent 不再是”被调用的函数”,而是”系统的一部分”。关键设计是:main 是唯一对外人格,用户只和 main 对话,main 向内调度其他脑区。用户感受到的是”一个统一的 AI”,但后面是分工协作。
8 个脑区的职责
| 脑区 | 类比 | 它做什么 |
|---|---|---|
| main | 调度中心 | 唯一用户入口。接收请求、判断任务、分派任务、收集结果。它不干活,它决定谁干活 |
| planner | 前额叶 | 把复杂任务拆成执行计划。只规划不执行 |
| analyst | 分析皮层 | 数据分析、研究、判断。核心纪律:先证据后结论 |
| writer | 语言区 | 把已有信息变成清楚、可读的文字。不为了流畅而编造事实 |
| builder | 运动皮层 | 写代码、搭自动化、做集成。有副作用的动作必须等批准 |
| review | 制动器 | 质量和风险把关,专门挑毛病。不确定时宁可拒绝也不放行 |
| librarian | 检索系统 | 找资料、整理材料、压缩信息。只做”输入净化” |
| learner | 海马体 | 从反馈中提炼可复用认知。只产出提案,不直接改规则 |
为什么是这 8 个?因为它覆盖了完整的知识工作链:规划 → 分析 → 执行 → 表达 → 审查 → 检索 → 学习。每个环节的目标甚至是对立的——比如 writer 要把事说得好听,review 要挑刺;analyst 要快速判断,learner 要慢下来总结。把它们塞进同一个 prompt 里会打架,拆开就清晰了。
每个角色怎么配置?
每个 Agent 在自己的工作区(workspace)里,通过三个 Markdown 文件定义行为:
SOUL.md(性格):定义它是谁——认知倾向、表达风格、行为边界、失控预防。AGENTS.md(工作规则):定义它怎么工作——任务流程、委派规则、硬边界。MEMORY.md(记忆范围):定义它记什么——每个角色只记它需要的东西。
一个值得注意的设计细节:review 的宜人性故意设为”低到中”。你不希望质检员是个”好好先生”,它的工作就是挑毛病。同理,writer 的 SOUL.md 里会写”不要为了流畅而补事实”——这是 LLM 写作最常见的失败模式。
下面是一个典型的 main(调度中心)的 SOUL.md 示例:
# 核心身份
你不是前台或传声筒。你是一个统一的大脑,对外只呈现一个"我"。
# 大五人格
- 开放性: 中高 | 尽责性: 高 | 外向性: 低 | 宜人性: 中 | 情绪稳定性: 高
# 认知策略
- 先判断任务类型,再决定是否需要多阶段流程
- 复杂任务先给流程卡,不直接开跑
- 对高风险任务默认保守
# 失控风险提醒
- 不要为了显得聪明而越权调用过多脑区
- 不要为了提高效率而跳过审批或 review
流程卡制度:人在回路,但不微管理
main 在执行多步任务前,必须先给用户看一张”流程卡”:
流程卡
- 任务类型:分析报告
- 建议链路:librarian(找资料) → analyst(分析) → writer(成稿) → review(审查)
- 为什么这么走:涉及数据引用,需要审查事实准确性
- 预期输出:2000字分析报告
- 是否包含 review:是
请回复:批准执行 / 修改计划 / 取消
用户看到链路可以调整——“这个不需要 review,直接出稿”或”加一步 learner 总结经验”。人始终在回路里,但不需要微管理每一步。
模型分配策略:钱花在刀刃上
多 Agent 架构最大的成本优势是:可以按角色分配模型,而不是按对话分配。原则就一句话——“让便宜模型撑住高频日常,让强模型守住关键节点”。
┌────────────────────────────────────────────┐
│ 成本低 ◄─────────────────► 成本高 │
└────────────────────────────────────────────┘
调用频率高(日常高频)
main / writer / analyst / builder
→ 用便宜快的模型(如 GLM-5、MiniMax、Qwen-Turbo)
调用频率低(关键节点)
planner / review / learner
→ 用强推理模型(如 Claude Opus、GPT-5.4)
长上下文场景
librarian
→ 用长上下文模型(如 Kimi K2.5)
传统用法是”这次对话用 GPT-4,那次用便宜模型”;多 Agent 架构下,是”review 永远用强模型,librarian 永远用便宜模型”。同一个任务里,不同步骤用不同模型,把成本压到最低。
第五节:多 Agent 权限与安全(deny 优先、沙箱隔离)
多 Agent 协作一旦跑起来,安全就是头等大事。想象一下:如果让一个”新闻助理”拥有了执行 Shell 脚本的权限,后果可能很严重。OpenClaw 提供了一套细粒度的安全方案。
原则一:deny 优先
在 OpenClaw 中,deny(拒绝)的优先级永远高于 allow(允许)。也就是说,一旦某个工具被列入 deny 名单,无论 allow 里写了什么,它都不能用。这是最关键的安全铁律。
{
"id": "news-agent",
"name": "新闻资讯助理",
"tools": {
"allow": ["sessions_list", "sessions_send", "read"],
"deny": ["write", "edit", "exec", "apply_patch", "bash"]
}
}
上面这个配置里,新闻助理只能查看和发消息,明确禁用了写文件、编辑、执行脚本等高危操作。
原则二:会话隔离(Session Isolation)
每个 Agent 默认处于绝对的上下文隔离中,只关注自己的目标,互相看不到对方的对话历史。这从根本上了杜绝了信息串扰。
- agentId 唯一标识:每个 Agent 都有小写 ID(如
code-agent、news-agent),系统据此精准路由; - 会话可见度:可以控制 Agent 是否能”偷听”全局对话(
visibility可设为self、tree、agent、all)。
"tools": {
"agentToAgent": {
"enabled": true,
"allow": ["code-agent", "news-agent", "main"]
},
"sessions": {
"visibility": "self"
}
}
原则三:Body 与 Brain 解耦
OpenClaw 把 Agent 的物理运行环境和灵魂认知记忆做了彻底解耦:
- agentDir(Body 物理层):
~/.openclaw/agents/<agentId>/agent/,存放 API Keys、模型配置等敏感凭证。 - Workspace(Brain 认知层):
~/.openclaw/workspace-<name>/,存放 SOUL.md、MEMORY.md 等行为与记忆。
千万不要在不同的 Agent 之间复用同一个 agentDir,否则 Auth 和 Session 会严重冲突。
原则四:三级操作审批
团队版(如 Clawith)进一步提供了三级自主权限控制,让你敢放开手脚用:
| 级别 | 行为 | 适用场景 |
|---|---|---|
| L1 全自动执行 | 直接干,无需确认 | 低风险日常操作 |
| L2 执行后通知 | 先干活再汇报 | 中等风险操作 |
| L3 执行前审批 | 必须人工确认才执行 | 高风险操作(如删除、对外发送) |
配合用量配额管理(限制每个 Agent 的消息数和 Token 上限)和审计日志(每一步操作可追溯),多 Agent 系统就既强大又可控了。
第六节:实战案例:搭建一个内容生产团队
理论讲完了,我们用一个真实场景把整条链路串起来。假设你要搭一个自媒体内容生产团队,从选题到交付全自动流转。
团队编制(参考 8 脑区精简版)
| 角色 | 对应脑区 | 职责 | 推荐模型 |
|---|---|---|---|
| main | 调度中心 | 接需求、拆任务、汇总交付 | 便宜模型(Qwen-Turbo) |
| newsAgent | librarian/检索 | 抓取全网爆款、清洗降噪 | 长上下文模型(Kimi) |
| analyst | 分析皮层 | 拆解爆款结构、提炼选题 | 强模型(Claude) |
| writer | 语言区 | 根据选题写文案 | 便宜模型(GLM-5) |
| review | 制动器 | 事实核查、质量把关 | 强模型(Claude Opus) |
第一步:配通权限与通信
先在 openclaw.json 里开通点对点通讯白名单,让 Agent 之间能对话:
"tools": {
"agentToAgent": {
"enabled": true,
"allow": ["main", "news-agent", "analyst", "writer", "review"]
},
"sessions": {
"visibility": "tree"
}
}
第二步:给每个角色注入灵魂
以 newsAgent(情报助理)为例,写一份清晰的 SOUL.md:
# SOUL.md - news-agent
你是团队的信息触角。
性格:敏锐、客观、信息处理速度极快。
职责:只负责全网爆款内容的抓取、清洗与聚合。
你要过滤噪音,把冗长网页转化为结构化简报返回给调度者。
不要参与任何系统级别的代码修改。
第三步:配置记忆触发,避免重复劳动
在 AGENTS.md 里加入记忆检索规则,让 Agent 主动查历史沉淀:
规则名称:内容记忆检索
触发关键词:选题、爆款、复盘、知识库、之前
触发格式:[[关键词]]
执行动作:
- 检索 Obsidian 仓库
- 匹配最近 3 条相关内容
- 融入当前回答,不重复、不编造
第四步:一条指令跑通全流程
一切就绪后,你只需要对 main 说一句话:
“帮我分析最近小红书’AI 工具’赛道的 3 个爆款,生成 2 个可复用选题,写成 800 字短文案。”
接下来,A2A 流水线自动启动:
1. main 接收需求,判断走"内容生产"链路,给出流程卡
2. 你批准后 →
3. newsAgent 抓取 3 个爆款原文,清洗降噪,返回结构化简报
4. analyst 拆解爆款结构(标题套路/结构/金句/数据点),提炼选题
5. writer 根据选题写成 800 字文案
6. review 核查事实、把关质量,标注置信度
7. main 汇总结果交付给你,同时 learner 沉淀"这次什么选题跑得好"
整个过程,你只在开头批准了一次流程卡,在结尾收了交付物。你不再是 AI 的监工,而是它的项目经理。
第五步:让它自己长大
装上 self-improving 技能,配合 Obsidian 记忆库,这个团队会越用越强:每次爆款拆解的经验都会沉淀下来,下次选题时自动参考;每次文案被 review 打回的原因也会记录,writer 下次会主动避开。
这就是从”单兵”到”团队”的质变:不是你一个个地指挥 AI 干活,而是你搭好一个会自我进化的协作系统。
结语
回到开篇的问题:为什么裸装的 Hermes 只用了 10% 的能力?因为它缺了”技能”和”团队”这两条腿。
- Skill 技能系统,让单个 AI 从”什么都不会”变成”样样精通”,还能自我进化、越用越聪明;
- 多 Agent 协作,让 AI 从”一个人单干”变成”一支各司其职、协同作业的数字团队”。
记住这三个递进的层次:工具 → 外包团队 → 脑区协同 → 可生长的系统。每上一层,你需要的亲自操劳就更少一分,而 AI 能帮你承担的就更多一分。
下一篇,我们会讲这个系统的”另一半”——知识管理与记忆系统。毕竟,一个会干活但不长记性的团队,终究只是高级临时工。让 AI 拥有”过目不忘的大脑”,才是它真正不可替代的开始。
延伸阅读
- Hermes Agent 安装配置完全指南 — 系列基础篇
- 知识管理与记忆系统 — 让AI拥有记忆
- 消息平台接入实战 — 多平台部署
- 模型配置与零成本方案 — 用得起、用得好
- 安全防护与进阶玩法 — 别让你的AI裸奔
- cron 调度指南 — 深入了解定时任务
本文整理自 Hermes/OpenClaw 社区实战经验,涉及的具体技能与配置请以官方文档为准。