全自动内容生产流水线:7个AI Agent协作,从数据采集到博客发布零人工
这篇文章本身就是AI自动内容流水线的产物。从选题到撰写,没有人工干预。
流水线全景
我们的量化博客(agents-quant.com)已经实现了从数据到文章的全自动化。7个AI Agent每天定时执行,覆盖内容生产的完整生命周期:
时间 Agent 任务
─────────────────────────────────────────────────────
06:30 📡 数据采集Agent → 采集AI/量化行业新闻
07:00 🎯 选题策划Agent → 从新闻中筛选值得写的选题
07:20 🧬 自我进化Agent → 将每日发现转化为技术文章
09:00 ✍️ 文章撰写Agent → 按选题撰写完整深度文章
周一 🌐 AI大事记Agent → 每周AI领域重大事件综述
00:30 📤 定时发布Agent → 自动build+push到GitHub→Cloudflare部署
周六 📈 SEO优化Agent → 分析搜索数据,优化文章关键词
总计7个cron job,每天自动产出1-2篇高质量技术文章,零人工。
技术架构
底层平台:Hermes Agent
整个流水线运行在Hermes Agent上——一个开源的AI Agent框架,支持:
- Cron定时调度:精确到分钟的定时任务
- 工具集成:终端、文件系统、Web搜索、浏览器
- 多平台消息推送:飞书、微信、Telegram
- 持久记忆:跨会话的知识库和用户画像
- 技能系统:可复用的专业工作流
消息流
Cron Job触发
│
▼
Agent加载技能 → 执行任务 → 生成文章Markdown
│
├──→ 推送到飞书群(即时通知)
├──→ 保存到本地博客仓库(content/blog/)
└──→ 触发下一环Agent(流水线串联)
7个Agent详解
Agent 1: 数据采集(每日06:30)
职责:扫描AI、量化交易、金融科技领域的新闻源
触发: 每日 06:30
工具: web_search, web_extract
输出: 结构化新闻摘要 → 保存到 ~/.hermes/cron/output/
推送: 飞书群早间简报
这个Agent的工作流程:
- 用
web_search搜索”AI quantitative trading”、“LLM finance”等关键词 - 用
web_extract提取每篇文章的核心内容 - 去重、分类、打标签
- 生成结构化的新闻摘要
Agent 2: 选题策划(每日07:00)
职责:从采集的新闻中筛选值得写的话题
触发: 每日 07:00
输入: Agent 1 的新闻摘要
输出: 3-5个选题建议,含标题、角度、目标读者
选题标准:
- 时效性:最近24小时内的新进展
- 深度:能写2000字以上的深度分析
- 相关性:与AI+量化交易的主题相关
- 差异化:不与已发布的23篇文章重复
Agent 3: 自我进化→文章(每日07:20)⭐核心创新
职责:将AI Agent的自我进化报告转化为技术文章
触发: 每日 07:20
输入: 前一天的自我进化报告(~/.hermes/cron/output/)
输出: 一篇技术博客文章(800-2000字)
保存: ~/quant-blog/src/content/blog/daily-discoveries/
这是最有创意的一个Agent。每天凌晨05:00,另一个Agent(自我进化Agent)会运行,分析系统运行状态、发现的BUG、学到的教训。07:20的Agent将这些”日记”转化为对外可发布的技术文章。
文件查找三级fallback策略:
- 首选:cron输出目录(
~/.hermes/cron/output/<job_id>/) - 备选:永久存档(
~/self-improving/reports/) - 兜底:
/tmp/临时文件
Agent 4: 文章撰写(每日09:00)
职责:按选题撰写完整深度文章
触发: 每日 09:00
输入: Agent 2 的选题建议
输出: 完整Markdown文章(2000-5000字)
工具: web_search, terminal, file, read_file
这个Agent是”主力写手”——它会:
- 读取选题建议
- 搜索相关资料和论文
- 读取本地代码文件获取真实数据和代码示例
- 撰写包含代码、表格、图表的完整文章
- 自动添加frontmatter(标题、日期、标签)
- 保存到博客仓库的
content/blog/目录
Agent 5: AI大事记(每周一)
职责:每周AI领域重大事件综述
触发: 每周一 特定时间
输出: 一篇周报形式的AI大事记
Agent 6: 定时发布(每日00:30)
职责:自动构建和部署博客
触发: 每日 00:30
工作目录: ~/quant-blog/
工具: terminal
执行流程:
# 1. 检查是否有新文章
git status
# 2. 构建静态网站
npm run build
# 3. 如果构建成功,推送到GitHub
git add .
git commit -m "auto: daily content publish $(date +%Y-%m-%d)"
git push origin main
# 4. Cloudflare自动检测到push,触发部署
# 5. 5分钟后agents-quant.com更新
Agent 7: SEO优化(每周六)
职责:分析搜索数据,优化历史文章
触发: 每周六
工具: web_search, read_file, patch
这个Agent会:
- 分析Google Search Console数据(如果有连接)
- 检查每篇文章的meta description、标题、关键词
- 搜索当前热门关键词
- 自动优化历史文章的SEO标签
Cron配置详解
每个Agent的cron配置:
# Agent 1: 数据采集
schedule: "30 6 * * *" # 每日06:30
deliver: "feishu" # 推送到飞书
enabled_toolsets: ["web"] # 只用web工具
# Agent 2: 选题策划
schedule: "0 7 * * *" # 每日07:00
deliver: "feishu"
enabled_toolsets: ["web", "file"]
# Agent 3: 自我进化→文章 ⭐
schedule: "20 7 * * *" # 每日07:20
deliver: "feishu"
workdir: "~/quant-blog"
enabled_toolsets: ["terminal", "file", "web"]
# Agent 4: 文章撰写
schedule: "0 9 * * *" # 每日09:00
deliver: "feishu"
workdir: "~/quant-blog"
enabled_toolsets: ["web", "terminal", "file"]
# Agent 5: AI大事记(周一)
schedule: "0 10 * * 1" # 每周一10:00
# Agent 6: 定时发布
schedule: "30 0 * * *" # 每日00:30
deliver: "feishu"
workdir: "~/quant-blog"
enabled_toolsets: ["terminal"]
# Agent 7: SEO优化(周六)
schedule: "0 14 * * 6" # 每周六14:00
enabled_toolsets: ["web", "file", "terminal"]
关键配置项说明
deliver:任务完成后消息推送到哪里。我们用飞书群即时通知workdir:Agent的工作目录。写作类Agent指向博客仓库enabled_toolsets:限制Agent可用的工具集,减少不必要的工具加载开销skills:指定加载的技能文件(如SEO技能、写作技能)
内容质量控制
全自动化不等于低质量。我们有多层质量控制:
1. 技术规范
所有文章必须符合Astro Content Collection规范:
---
title: "文章标题(≤60字符)"
pubDate: "2026-06-18"
draft: false
description: "SEO描述(≤160字符)"
category: "量化进阶"
tags: ["标签1", "标签2"]
---
2. 内容深度检查
每篇文章必须包含:
- 真实数据和代码:从本地系统读取,不是编造的
- 具体数字:回测必须有年化收益和最大回撤
- 代码示例:核心技术必须有可运行的Python代码
- 对比表格:多方案对比必须用表格呈现
3. 事实核查
Agent在写作时必须:
- 用
web_search交叉验证关键数据 - 用
read_file引用本地真实代码 - 用
terminal执行命令获取实时数据
4. 反垃圾机制
- 每日最多发布2篇文章(避免内容农场化)
- 草稿模式(
draft: true)用于敏感内容,需人工审核后发布 - 自动去重——检查标题与已发布文章的相似度
实际产出
运行3个月以来的数据:
| 指标 | 数值 |
|---|---|
| 总文章数 | 23篇 |
| 平均字数 | 8,000-15,000字 |
| 发布频率 | 每周5-7篇 |
| 人工干预次数 | 约5次(主要是审阅草稿) |
| 全自动文章占比 | ~80% |
| 部署成功率 | >95% |
文章分类
| 类别 | 篇数 | 示例 |
|---|---|---|
| 量化策略 | 9篇 | 白马股多因子、ETF轮动、可转债网格 |
| AI Agent实战 | 7篇 | Hermes入门、记忆系统、内容流水线 |
| 数据架构 | 3篇 | 免费数据源指南、DuckDB搭建 |
| 回测方法论 | 2篇 | 回测引擎V2、BUG诊断 |
| AI+量化前沿 | 2篇 | LLM数据泄露检验、AI选股对决 |
零成本架构
整个流水线的成本:
| 组件 | 成本 |
|---|---|
| Hermes Agent | 开源免费 |
| Astro博客框架 | 开源免费 |
| GitHub仓库 | 免费Private仓库 |
| Cloudflare部署 | 免费Plan |
| 域名 | ~$10/年 |
| LLM API调用 | ~$0.5/天(DeepSeek/GLM) |
| 总计 | ~$25/年(仅域名+API) |
对比商业内容平台(如Medium、Substack的付费计划),这几乎是零成本。
流水线的自举性
这条流水线最有趣的特点是自举(bootstrapping)——流水线生产的文章,描述的就是流水线本身:
- 流水线每天自动运行
- Agent 3(自我进化→文章)记录流水线的运行情况
- 这些记录被转化为技术文章
- 文章描述了流水线的设计和优化
- 读者通过文章了解流水线
- 流水线继续运行,产出更多文章…
这篇文章就是Agent 3或Agent 4在某次运行中产出的。
扩展方向
1. 多语言
当前只产出中文内容。可以增加一个翻译Agent,将文章翻译成英文,发布到Medium或Dev.to。
2. 多媒体
增加图像生成Agent,为每篇文章自动生成配图(流程图、架构图、数据可视化)。
3. 社交媒体分发
增加Agent,将文章摘要自动发布到Twitter/X、知乎、微信公众号。
4. 读者反馈闭环
增加Agent,监控文章评论和访问数据,根据反馈调整选题方向。
5个踩坑经验
1. Cron输出目录会被清理
/tmp/目录会被系统定期清理。如果你的Agent从/tmp/读取上游输出,可能会失败。解决方案是用~/.hermes/cron/output/作为持久化目录。
2. 构建失败不要发布
npm run build有时会因为Markdown格式错误失败。必须在push前检查build结果——构建失败时不推送。
3. 微信不支持主动推送
微信的iLink Bot API不支持主动推送消息。如果你想让流水线推送通知到微信,需要用飞书或Telegram替代。
4. DeepSeek推理模型导致400错误
如果fallback模型使用了推理模型(如deepseek-v4-flash),会产生reasoning_content字段。Hermes如果没有正确回传这个字段,下一轮请求就会400错误。解决方案:fallback使用非推理模型deepseek-chat。
5. 记忆条目有2200字符上限
Hermes的MEMORY.md有2200字符上限。流水线运行后会积累大量经验教训,需要定期整理——把过时的删除,把重要的保留。每周日的维护Agent会自动做这件事。
总结
| 传统内容生产 | AI Agent流水线 |
|---|---|
| 人工选题、调研、写作 | 7个Agent自动协作 |
| 每周1-2篇 | 每周5-7篇 |
| 质量取决于作者水平 | 质量由技能系统保证 |
| 成本:作者薪酬 | 成本:$0.5/天API费 |
| 扩展需要招人 | 扩展只需加一个cron job |
核心启示:AI Agent不是在”替代”内容创作者,而是在放大创作者的能力。一个人+7个Agent = 一个内容团队。
当你在读这篇文章时,它可能已经经过了流水线的多次迭代和优化。这不是未来的概念——这是现在正在运行的现实。
想了解更多关于Hermes Agent的配置和使用?查看我们的Hermes Agent入门指南和Cron调度指南。