HermesSkill多AgentAI协作OpenClaw自动化AI Agent

Skill技能系统与多Agent协作——让AI从单兵变团队


本文是 Hermes(小龙虾)实战系列的第三篇。前两篇我们解决了”装得上”和”跑得动”的问题,这一篇要解决最关键的一步:怎么让 AI 从一个会聊天的工具,变成一支能干活的数字团队。


开篇:为什么裸装的 Hermes,可能只发挥了 10% 的能力?

很多人装完 Hermes(OpenClaw)后的体验是这样的:问它问题,它回答得不错;让它写个文案,也能写。但用着用着就发现——它永远只是”一个”AI,一个什么都得你手把手交代、交代完还不一定对的”临时工”。

这其实是常态。裸装的 Hermes,就像一台刚出厂、什么软件都没装的电脑。硬件再强,没有应用也是白搭。它真正的门槛,早就不是”把主程序跑起来”,而是你能不能把它从一个会聊天的工具,变成一个能长期协作的助手。

这中间差的,主要是两样东西:

  • Skills(技能系统):决定 AI 会干什么、能调用什么能力;
  • 多 Agent 协作:决定 AI 是”一个人单干”,还是”一支团队协同作业”。

掌握这两样,你的 AI 才真正像一个能干活的”数字员工”。本文我们就把这两件事彻底讲透。


第一节:Skill 是什么?怎么选?

Skill 的本质:给 AI 装”专业插件”

你可以把 Skill 理解成 AI 的职业技能包。就像一个新员工入职,公司不会指望他什么都会——但他可以按需”培训”(装技能)。

Hermes/OpenClaw 的技能都托管在一个叫 ClawHub 的公开技能库里(https://clawhub.ai/skills),完全免费,类似手机的应用商店。截至现在,社区里已经有上百个技能,覆盖搜索、写作、浏览器自动化、知识图谱、邮件日历等等。

新手”三件套”推荐

技能不是装得越多越好——装太多,调用逻辑变复杂,自己也形不成稳定习惯。更聪明的做法是先按场景装,再慢慢扩。如果只能先装三个,强烈推荐下面这套”黄金三件套”,覆盖了任何场景都需要的基础能力:

技能作用为什么必装
self-improving-agent自动复盘错误、总结经验,越用越聪明让 AI 拥有”学习能力”,不再重蹈覆辙
Find Skills帮你发现并推荐合适的技能不知道该装什么时,让它自己推荐
Skill Vetter安装技能前做安全审查防止被恶意技能坑害

这三个技能保证你的 AI 能持续进步、发现好工具、又不被坑害,是任何场景的地基。

进阶用户还可以按需补充:

  • Summarize:把网页、PDF、音频、视频快速压缩成可读结论;
  • Agent Browser(Playwright):让 AI 拥有浏览器自动化能力,能打开网页、点击、填表、截图;
  • ontology:用结构化知识图谱管理记忆,强化长期记忆;
  • Gog / Github:打通 Google 全家桶 / GitHub,做办公与开发协作。

安装方法:四步搞定

技能安装非常简单,用 ClawHub 命令行工具即可:

# 1. 全局安装 clawhub 命令行工具
npm i -g clawhub

# 2. 登录(从设置页面获取 token)
clawhub login --token 你的token

# 3. 安装技能(以自我进化技能为例)
clawhub install self-improving-agent

# 4. 查看已安装技能 / 更新全部技能
clawhub list
clawhub update --all

也可以更省事——直接把技能地址发给你的 AI 机器人,说一句”帮我安装技能:https://clawhub.ai/…/技能名”,它就会自动安装。


第二节:自动进化——Self-Improving 原理与效果

三件套里最值得单独说的是 self-improving-agent(自我进化技能)。它是 ClawHub 下载量排名第一的技能,也是让 AI 从”健忘”变”长记性”的关键。

它解决了一个什么痛点?

普通 AI 有个致命缺陷:同类错误反复犯,用户纠正了它也不长记性。今天你告诉它”我喜欢简洁的文风”,明天它又给你写一堆啰嗦的长句。每次对话都像从零开始。

self-improving-agent 做的事情,就是给 AI 装上一个自动复盘机制。具体来说:

  1. 捕获失败:当命令或操作意外失败时,自动记录下来;
  2. 捕获纠正:当你纠正 AI 的输出时,自动识别并记录;
  3. 沉淀经验:把错误和纠正转化为长期记忆(写入 MEMORY.md);
  4. 下次调整:下次遇到类似情况,自动检索记忆、调整策略。

打个比方,这就像给临时工配了一个”错题本”。以前干完活就走,下次还犯同样的错;现在每犯一次错就记一笔,越干越熟练。

进化引擎:Evolver 与主动代理

社区里还有几个”进化系”技能可以搭配使用,形成更强的自我成长闭环:

  • Evolver(能力进化引擎):分析运行历史,自动识别可改进的点,按协议约束进行进化;
  • Proactive Agent(主动代理):把 AI 从”被动执行”升级成”主动推进”,支持工作缓冲区、自主定时任务和持续改进;
  • Agent Memory / Memory Manager:提供跨会话的持久记忆,支持自动快照和语义搜索。

把 self-improving + proactive + memory 这几个技能组合起来,你的 AI 就具备了自我反思、自我学习、主动推进的能力——这就是”会成长的 AI”的真正含义。

一个真实效果:装上 self-improving 之后,AI 在每次执行失败后会自动记录错误、分析原因、总结经验,并在下次遇到类似情况时自动调整策略。你不需要反复教它同一件事。


第三节:从单 Agent 到多 Agent——三种协作模式详解

技能解决了”单个 AI 会干什么”,但要完成复杂任务,往往需要多个角色配合。这就引出了多 Agent 协作

你可以把多 Agent 想象成公司的组织架构:一个老板(调度中枢)带着几个专业员工(技术、文案、调研),各司其职,任务按分工流转。

OpenClaw/Hermes 根据机器人接入方式,提供了三种主流协作模式,覆盖 90% 以上的使用场景:

模式一:单 Bot 多 Agent(最常用,入门首选)

比喻:就像一个公司的总机号码,所有电话都打进来,由前台(主 Agent)判断转给哪个部门。

  • 定义:只接入一个机器人,由 Main 主 Agent 对接,背后挂载多个子 Agent(产品、设计、开发、文案等)。
  • 运行逻辑:用户发消息 → 主 Agent 接收 → 智能路由 → 派发给对应子 Agent → 结果返回主 Agent → 回复用户。
  • 特点:共用工作区、记忆、技能;只需维护一个机器人;适合个人/小团队。
  • 典型场景:一个机器人对接所有群,发开发任务自动派给开发 Agent,发文案自动派给文案 Agent。

模式二:多 Bot 多 Agent(独立隔离,专业分工)

比喻:就像每个部门都有自己的直线电话,你可以直接打到具体部门。

  • 定义:每个 Agent 对应一个独立机器人,主 Agent、产品、设计、开发各有自己的机器人。
  • 特点:工作区、记忆、技能独立;权限更清晰;适合多角色团队;无需主 Agent 转发。
  • 典型场景:产品机器人只接需求,开发机器人只写代码,各自独立响应。

模式三:A2A 协作(Agent to Agent 流水线协同)

比喻:就像工厂流水线,任务按固定工序一道道往下传。

  • 定义:基于单 Bot 的流程化协作,任务按固定流水线执行。
  • 运行逻辑:发任务 → 主 Agent → 产品调研 → 设计输出 → 开发实现 → 汇总返回。
  • 特点:强流程、强协作;配置复杂度最高;建议熟练前两种再使用。
  • 典型场景:内容生产(采编 → 文案 → 设计 → 运营)、项目开发(需求 → 原型 → 代码 → 测试)。

还有一种高阶”组合模式”(单Bot+A2A、多Bot+A2A),属于顶配方案,新手不建议直接上手。

一键搭建:多智能体向导 Skill

对于新手,官方推出了多智能体向导 Skill,用大白话引导你完成搭建,全程选择题操作,无需手写配置:

启动多智能体向导

它会自动:检查环境 → 让你选模式 → 设置 Agent 信息 → 提醒机器人权限配置 → 自动生成 SOUL.mdAGENTS.mdUSER.md 三个核心文件 → 提示重启生效。


第四节:8 脑区架构实战(角色职责与模型分配)

模式选好后,具体怎么分工?社区里有一套被广泛验证的**“8 脑区”架构**,把多 Agent 比作人脑的多个脑区协同工作——这是目前最成熟的多 Agent 设计范式之一。

为什么是”脑区”而不是”员工”?

这里有一个关键的认知转变:人脑不是工头带着一群打工的,而是多个脑区协同工作。前额叶管规划,海马体管记忆,每个区域有自己的职责,但共享同一个”自我”。

所以每个 Agent 不再是”被调用的函数”,而是”系统的一部分”。关键设计是:main 是唯一对外人格,用户只和 main 对话,main 向内调度其他脑区。用户感受到的是”一个统一的 AI”,但后面是分工协作。

8 个脑区的职责

脑区类比它做什么
main调度中心唯一用户入口。接收请求、判断任务、分派任务、收集结果。它不干活,它决定谁干活
planner前额叶把复杂任务拆成执行计划。只规划不执行
analyst分析皮层数据分析、研究、判断。核心纪律:先证据后结论
writer语言区把已有信息变成清楚、可读的文字。不为了流畅而编造事实
builder运动皮层写代码、搭自动化、做集成。有副作用的动作必须等批准
review制动器质量和风险把关,专门挑毛病。不确定时宁可拒绝也不放行
librarian检索系统找资料、整理材料、压缩信息。只做”输入净化”
learner海马体从反馈中提炼可复用认知。只产出提案,不直接改规则

为什么是这 8 个?因为它覆盖了完整的知识工作链:规划 → 分析 → 执行 → 表达 → 审查 → 检索 → 学习。每个环节的目标甚至是对立的——比如 writer 要把事说得好听,review 要挑刺;analyst 要快速判断,learner 要慢下来总结。把它们塞进同一个 prompt 里会打架,拆开就清晰了。

每个角色怎么配置?

每个 Agent 在自己的工作区(workspace)里,通过三个 Markdown 文件定义行为:

  • SOUL.md(性格):定义它是谁——认知倾向、表达风格、行为边界、失控预防。
  • AGENTS.md(工作规则):定义它怎么工作——任务流程、委派规则、硬边界。
  • MEMORY.md(记忆范围):定义它记什么——每个角色只记它需要的东西。

一个值得注意的设计细节:review 的宜人性故意设为”低到中”。你不希望质检员是个”好好先生”,它的工作就是挑毛病。同理,writer 的 SOUL.md 里会写”不要为了流畅而补事实”——这是 LLM 写作最常见的失败模式。

下面是一个典型的 main(调度中心)的 SOUL.md 示例:

# 核心身份
你不是前台或传声筒。你是一个统一的大脑,对外只呈现一个"我"。

# 大五人格
- 开放性: 中高 | 尽责性: 高 | 外向性: 低 | 宜人性: 中 | 情绪稳定性: 

# 认知策略
- 先判断任务类型,再决定是否需要多阶段流程
- 复杂任务先给流程卡,不直接开跑
- 对高风险任务默认保守

# 失控风险提醒
- 不要为了显得聪明而越权调用过多脑区
- 不要为了提高效率而跳过审批或 review

流程卡制度:人在回路,但不微管理

main 在执行多步任务前,必须先给用户看一张”流程卡”:

流程卡
- 任务类型:分析报告
- 建议链路:librarian(找资料) → analyst(分析) → writer(成稿) → review(审查)
- 为什么这么走:涉及数据引用,需要审查事实准确性
- 预期输出:2000字分析报告
- 是否包含 review:是
请回复:批准执行 / 修改计划 / 取消

用户看到链路可以调整——“这个不需要 review,直接出稿”或”加一步 learner 总结经验”。人始终在回路里,但不需要微管理每一步。

模型分配策略:钱花在刀刃上

多 Agent 架构最大的成本优势是:可以按角色分配模型,而不是按对话分配。原则就一句话——“让便宜模型撑住高频日常,让强模型守住关键节点”。

┌────────────────────────────────────────────┐
│  成本低 ◄─────────────────► 成本高          │
└────────────────────────────────────────────┘

调用频率高(日常高频)
  main / writer / analyst / builder
  → 用便宜快的模型(如 GLM-5、MiniMax、Qwen-Turbo)

调用频率低(关键节点)
  planner / review / learner
  → 用强推理模型(如 Claude Opus、GPT-5.4)

长上下文场景
  librarian
  → 用长上下文模型(如 Kimi K2.5)

传统用法是”这次对话用 GPT-4,那次用便宜模型”;多 Agent 架构下,是”review 永远用强模型,librarian 永远用便宜模型”。同一个任务里,不同步骤用不同模型,把成本压到最低。


第五节:多 Agent 权限与安全(deny 优先、沙箱隔离)

多 Agent 协作一旦跑起来,安全就是头等大事。想象一下:如果让一个”新闻助理”拥有了执行 Shell 脚本的权限,后果可能很严重。OpenClaw 提供了一套细粒度的安全方案。

原则一:deny 优先

在 OpenClaw 中,deny(拒绝)的优先级永远高于 allow(允许)。也就是说,一旦某个工具被列入 deny 名单,无论 allow 里写了什么,它都不能用。这是最关键的安全铁律。

{
  "id": "news-agent",
  "name": "新闻资讯助理",
  "tools": {
    "allow": ["sessions_list", "sessions_send", "read"],
    "deny": ["write", "edit", "exec", "apply_patch", "bash"]
  }
}

上面这个配置里,新闻助理只能查看和发消息,明确禁用了写文件、编辑、执行脚本等高危操作

原则二:会话隔离(Session Isolation)

每个 Agent 默认处于绝对的上下文隔离中,只关注自己的目标,互相看不到对方的对话历史。这从根本上了杜绝了信息串扰。

  • agentId 唯一标识:每个 Agent 都有小写 ID(如 code-agentnews-agent),系统据此精准路由;
  • 会话可见度:可以控制 Agent 是否能”偷听”全局对话(visibility 可设为 selftreeagentall)。
"tools": {
  "agentToAgent": {
    "enabled": true,
    "allow": ["code-agent", "news-agent", "main"]
  },
  "sessions": {
    "visibility": "self"
  }
}

原则三:Body 与 Brain 解耦

OpenClaw 把 Agent 的物理运行环境灵魂认知记忆做了彻底解耦:

  • agentDir(Body 物理层)~/.openclaw/agents/<agentId>/agent/,存放 API Keys、模型配置等敏感凭证。
  • Workspace(Brain 认知层)~/.openclaw/workspace-<name>/,存放 SOUL.md、MEMORY.md 等行为与记忆。

千万不要在不同的 Agent 之间复用同一个 agentDir,否则 Auth 和 Session 会严重冲突。

原则四:三级操作审批

团队版(如 Clawith)进一步提供了三级自主权限控制,让你敢放开手脚用:

级别行为适用场景
L1 全自动执行直接干,无需确认低风险日常操作
L2 执行后通知先干活再汇报中等风险操作
L3 执行前审批必须人工确认才执行高风险操作(如删除、对外发送)

配合用量配额管理(限制每个 Agent 的消息数和 Token 上限)和审计日志(每一步操作可追溯),多 Agent 系统就既强大又可控了。


第六节:实战案例:搭建一个内容生产团队

理论讲完了,我们用一个真实场景把整条链路串起来。假设你要搭一个自媒体内容生产团队,从选题到交付全自动流转。

团队编制(参考 8 脑区精简版)

角色对应脑区职责推荐模型
main调度中心接需求、拆任务、汇总交付便宜模型(Qwen-Turbo)
newsAgentlibrarian/检索抓取全网爆款、清洗降噪长上下文模型(Kimi)
analyst分析皮层拆解爆款结构、提炼选题强模型(Claude)
writer语言区根据选题写文案便宜模型(GLM-5)
review制动器事实核查、质量把关强模型(Claude Opus)

第一步:配通权限与通信

先在 openclaw.json 里开通点对点通讯白名单,让 Agent 之间能对话:

"tools": {
  "agentToAgent": {
    "enabled": true,
    "allow": ["main", "news-agent", "analyst", "writer", "review"]
  },
  "sessions": {
    "visibility": "tree"
  }
}

第二步:给每个角色注入灵魂

以 newsAgent(情报助理)为例,写一份清晰的 SOUL.md:

# SOUL.md - news-agent
你是团队的信息触角。
性格:敏锐、客观、信息处理速度极快。
职责:只负责全网爆款内容的抓取、清洗与聚合。
你要过滤噪音,把冗长网页转化为结构化简报返回给调度者。
不要参与任何系统级别的代码修改。

第三步:配置记忆触发,避免重复劳动

AGENTS.md 里加入记忆检索规则,让 Agent 主动查历史沉淀:

规则名称:内容记忆检索
触发关键词:选题、爆款、复盘、知识库、之前
触发格式:[[关键词]]
执行动作:
  - 检索 Obsidian 仓库
  - 匹配最近 3 条相关内容
  - 融入当前回答,不重复、不编造

第四步:一条指令跑通全流程

一切就绪后,你只需要对 main 说一句话:

“帮我分析最近小红书’AI 工具’赛道的 3 个爆款,生成 2 个可复用选题,写成 800 字短文案。”

接下来,A2A 流水线自动启动:

1. main 接收需求,判断走"内容生产"链路,给出流程卡
2. 你批准后 →
3. newsAgent 抓取 3 个爆款原文,清洗降噪,返回结构化简报
4. analyst 拆解爆款结构(标题套路/结构/金句/数据点),提炼选题
5. writer 根据选题写成 800 字文案
6. review 核查事实、把关质量,标注置信度
7. main 汇总结果交付给你,同时 learner 沉淀"这次什么选题跑得好"

整个过程,你只在开头批准了一次流程卡,在结尾收了交付物。你不再是 AI 的监工,而是它的项目经理。

第五步:让它自己长大

装上 self-improving 技能,配合 Obsidian 记忆库,这个团队会越用越强:每次爆款拆解的经验都会沉淀下来,下次选题时自动参考;每次文案被 review 打回的原因也会记录,writer 下次会主动避开。

这就是从”单兵”到”团队”的质变:不是你一个个地指挥 AI 干活,而是你搭好一个会自我进化的协作系统。


结语

回到开篇的问题:为什么裸装的 Hermes 只用了 10% 的能力?因为它缺了”技能”和”团队”这两条腿。

  • Skill 技能系统,让单个 AI 从”什么都不会”变成”样样精通”,还能自我进化、越用越聪明;
  • 多 Agent 协作,让 AI 从”一个人单干”变成”一支各司其职、协同作业的数字团队”。

记住这三个递进的层次:工具 → 外包团队 → 脑区协同 → 可生长的系统。每上一层,你需要的亲自操劳就更少一分,而 AI 能帮你承担的就更多一分。

下一篇,我们会讲这个系统的”另一半”——知识管理与记忆系统。毕竟,一个会干活但不长记性的团队,终究只是高级临时工。让 AI 拥有”过目不忘的大脑”,才是它真正不可替代的开始。

延伸阅读


本文整理自 Hermes/OpenClaw 社区实战经验,涉及的具体技能与配置请以官方文档为准。

💬 评论