Hermes-Agent白皮书-养马从入门到精通-鲲鹏Talk.pdf

文档页数：980

文档大小：5.61MB

文档格式：pdf

文档分类：计算机与AI

上传会员：匿名用户

上传日期：2026-05-16

最后更新：2026-05-16

Hermes Agent 白皮书 —— 养马从入门到精通

◦ 作者：鲲鹏Talk

▪ 2026年4月 · 第一版

◦ 完整目录

◦ 关于作者

◦ 版本说明

▪ 当前版本

▪ 更新日志

▪ 许可协议

◦ 这本书是写给谁的

▪ 第一类：AI Agent 小白入门者

▪ 第二类：开发者与技术爱好者

▪ 第三类：创业者与独立开发者

▪ 第四类：投研人员与行业分析师

▪ 第五类：企业用户与技术决策者

◦ 如何阅读本书

▪ 路线一：快速入门路线（预计 3-4 小时）

▪ 路线二：深度技术路线（预计 15-20 小时）

▪ 路线三：变现赚钱路线（预计 8-10 小时）

▪ 路线四：从 OpenClaw 迁移路线（预计 6-8 小时）

◦ 完整目录

◦ 导读：为什么要读这本书

2◦ 致谢

第一册：前言与概述

◦ 1. 为什么写这本白皮书

▪ 1.1 AI Agent 时代已来，但大多数人还在门外观望

▪ 1.2 市面上的教程碎片化严重，缺乏系统性

▪ 1.3 从”养虾”到”养马”的转变，需要一本完整指南

▪ 1.4 本书的定位：不是技术论文，是你的 AI 伙伴养成手册

▪ 1.5 这本书的独特之处

◦ 2. Hermes Agent 是什么——一句话说清楚

▪ 2.1 用最通俗的语言解释 Hermes Agent

▪ 2.2 它和 ChatGPT、Claude 等产品的区别

▪ 2.3 它和 AutoGPT、MetaGPT 等框架的区别

▪ 2.4 核心概念：会自我学习、自我进化的本地 AI 助手

◦ 3. 为什么选择 Hermes 而不是其他框架

▪ 3.1 2026 年 AI Agent 市场格局概览

▪ 3.2 Hermes 的五大核心优势

▪ 优势一：记忆自动归档

▪ 优势二：自主创建 Skill

▪ 优势三：技能自我进化

▪ 优势四：按需检索

▪ 优势五：用户建模

▪ 3.3 和 OpenClaw 的定位差异

▪ 3.4 适合什么样的人

◦ 4. 本书内容架构与阅读建议

▪ 4.1 全书 16 册概览

▪ 4.2 不同读者推荐的阅读路线

▪ 4.3 学习方法建议：边学边练、先跑通再深入

◦ 5. 开源社区与学习资源前瞻

▪ 5.1 官方资源快速导航

▪ 5.2 中文社区现状

▪ 5.3 如何参与贡献

◦ 6. 术语表与约定

▪ 6.1 本书常用术语解释

▪ 6.2 代码约定

▪ 6.3 符号约定

3◦ 本章小结

第二册：AI-Agent 行业全景

◦ 1. 什么是 AI Agent——从概念到落地

▪ 1.1 AI Agent 的学术定义与通俗理解

▪ 1.2 Agent 与传统 AI 工具的本质区别

▪ 1.3 感知-推理-行动-学习闭环模型

▪ 1.4 Agent 的分类：单体 Agent、多 Agent 系统、自主 Agent

◦ 2. AI Agent 发展简史（2022-2026）

▪ 2.1 2022：ChatGPT 引爆大模型革命

▪ 2.2 2023：AutoGPT 掀起 Agent 热潮

▪ 2.3 2024：工具调用成熟、RAG 架构普及、Multi-Agent 系统涌现

▪ 2.4 2025：OpenClaw 横空出世、MCP 协议标准化、个人 AI 助手元年

▪ 2.5 2026：Hermes Agent 崛起、自学习 Agent 时代开启

▪ 2.6 每个阶段的关键项目分析小结

◦ 3. 2025-2026 AI Agent 行业格局

▪ 3.1 主流 Agent 框架全景图

▪ 3.2 详细对比表格

▪ 3.3 开源 vs 闭源、本地 vs 云端的趋势分析

◦ 4. 大模型底座的选择与影响

▪ 4.1 主流 LLM 对比

▪ 4.2 模型能力与 Agent 表现的关系

▪ 4.3 成本分析

▪ 4.4 开源模型 vs 闭源模型对 Agent 生态的影响

◦ 5. MCP 协议：Agent 世界的 USB-C

▪ 5.1 MCP 诞生背景与设计理念

▪ 5.2 MCP 如何统一工具调用标准

▪ 5.3 6000+ 服务的生态爆发

▪ 5.4 MCP 对 Hermes 和 OpenClaw 的不同意义

◦ 6. AI Agent 商业化与变现趋势

▪ 6.1 个人超级个体：AI 赋能单人创业

▪ 6.2 企业内部效率工具

▪ 6.3 开发者生态与技能市场

▪ 6.4 投研自动化、内容自动化等垂直领域

◦ 7. 中国 AI Agent 生态特色

▪ 7.1 国产大模型的崛起

4▪ 7.2 中文社区的特殊需求与玩法

▪ 7.3 本土化部署与合规考量

▪ 7.4 飞书、微信等国内平台的集成优势

◦ 8. 本章小结与展望

▪ 8.1 本章核心内容回顾

▪ 8.2 对 2026-2027 年的展望

▪ 8.3 给读者的行动建议

第三册：Hermes 诞生与演进

◦ 本章你将学到

◦ 1. Nous Research：Hermes 背后的公司

▪ 1.1 一家不走寻常路的 AI 公司

▪ 1.2 6500 万美元融资背后的故事

▪ 1.3 核心团队与技术实力

▪ 1.4 开源理念与商业模式的平衡

▪ 1.5 Nous 的其他产品线

◦ 2. “缰绳工程”（Harness Engineering）理念

▪ 2.1 什么是缰绳工程——用通俗的比喻解释

▪ 2.2 传统 Prompt Engineering 的局限性

▪ 2.3 缰绳工程的核心哲学

▪ 2.4 缰绳工程如何影响了 Hermes 的设计

◦ 3. OpenClaw 的成功与局限

▪ 3.1 OpenClaw 的诞生故事

▪ 3.2 OpenClaw 为什么能拿到 309k Stars

▪ 3.3 OpenClaw 的核心优势

▪ 3.4 OpenClaw 的痛点

▪ 3.5 “养虾”文化的形成

◦ 4. 从 OpenClaw 到 Hermes：进化之路

▪ 4.1 Hermes 解决了 OpenClaw 的哪些痛点

▪ 4.2 核心区别对比

▪ 4.3 为什么说 Hermes 是 OpenClaw 的”进阶版本”

▪ 4.4 数据迁移支持：一键迁移

▪ 4.5 “养马”文化的兴起

◦ 5. 两个月 104,791 Stars 的爆发之路

▪ 5.1 发布时间线与里程碑事件

▪ 5.2 社区反响与技术媒体评价

5▪ 5.3 与其他项目增长速度对比

▪ 5.4 为什么 Hermes 能如此快速增长

◦ 6. “养马” vs “养虾”：社区文化解读

▪ 6.1 命名隐喻的来历

▪ 6.2 两个社区的文化差异

▪ 6.3 从竞争到互补的关系演变

▪ 6.4 社区用语指南

◦ 7. Hermes 的版本演进与路线图

▪ 7.1 当前版本特性概览

▪ 7.2 已知的未来规划

▪ 7.3 社区呼声最高的功能请求

▪ 7.4 生态发展预测

◦ 本章小结

第四册：核心架构深度解析

◦ 本章你将学到

◦ 1. 架构总览：五层设计哲学

▪ 1.1 为什么要了解架构

▪ 1.2 五层架构概览

▪ 1.3 每层一句话总结

▪ 1.4 与传统 Agent 架构的对比

◦ 2. Layer 1: 入口与编排层（HermesCLI + GatewayRunner）

▪ 2.1 CLI 入口的设计理念

▪ 2.2 GatewayRunner 的作用

▪ 2.3 命令解析流程

▪ 2.4 多入口共存的设计选择

◦ 3. Layer 2: Agent 核心层（对话循环与预算机制）

▪ 3.1 同步对话循环的工作原理

▪ 3.2 预算机制：防止 Agent 失控的安全阀

▪ 3.3 Token 计数与成本控制

▪ 3.4 上下文窗口管理策略

▪ 3.5 错误恢复与重试机制

◦ 4. Layer 3: 工具与注册层（ToolRegistry 与自注册）

▪ 4.1 ToolRegistry 单例模式详解

▪ 4.2 工具自注册机制

▪ 4.3 47 个内置工具的分类架构

6▪ 4.4 工具调用的安全审批流程

▪ 4.5 自定义工具的扩展接口

◦ 5. Layer 4: 状态与持久化层（SQLite + MEMORY.md + Cron）

▪ 5.1 SQLite 数据库设计与 FTS5 全文索引

▪ 5.2 MEMORY.md 的结构与管理

▪ 5.3 USER.md 用户画像存储

▪ 5.4 Cron 定时任务调度器

▪ 5.5 数据备份与恢复策略

◦ 6. Layer 5: 平台适配层（15+ 平台、6 种终端后端）

▪ 6.1 平台适配器的设计模式

▪ 6.2 6 种终端后端的选择与配置

▪ 6.3 消息格式转换与统一接口

▪ 6.4 平台特性的处理

Telegram 适配器 → 直接发送 Markdown
微信适配器 → 转换为纯文本（或图文消息）
飞书适配器 → 转换为富文本卡片

◦ 7. 自学习闭环：Hermes 的灵魂

▪ 7.1 完整闭环流程详解：执行 → 评估 → 创建 → 改进

▪ 7.2 触发条件详解

▪ 7.3 技能的四个信任等级

▪ 7.4 Skill 自动生成的算法逻辑

▪ 7.5 技能进化的版本管理

▪ 7.6 社区实测数据：重复任务成功率提升 30%+

▪ 7.7 与强化学习的类比

◦ 8. 记忆系统架构：四层温度模型

▪ 8.1 热记忆（即时）：当前会话上下文

▪ 8.2 温记忆（持久）：MEMORY.md + USER.md

▪ 8.3 冷记忆（检索）：SQLite + FTS5 + LLM 摘要

▪ 8.4 外部记忆（扩展）：Honcho、Mem0 等 8 种

▪ 8.5 记忆的生命周期管理

▪ 8.6 隐私保护：纯本地存储的安全优势

◦ 9. Honcho 用户建模模块

▪ 9.1 Honcho 是什么

▪ 9.2 行为模式推导机制

▪ 9.3 工作习惯分析

7▪ 9.4 自适应回复风格调整

▪ 9.5 配置与调优

◦ 10. 安全架构

▪ 10.1 命令审批机制

▪ 10.2 沙箱执行环境

▪ 10.3 API Key 安全存储

▪ 10.4 权限最小化原则

▪ 10.5 与 OpenClaw 分级沙箱的对比

◦ 11. 性能与可扩展性

▪ 11.1 Python 轻量架构的优势

▪ 11.2 资源占用基准

▪ 11.3 并发处理能力

▪ 11.4 大规模记忆数据的性能表现

▪ 11.5 扩展方向：插件机制、模块化拆分

◦ 12. 系统设计哲学总结

▪ 12.1 简单优于复杂

▪ 12.2 本地优先，隐私至上

▪ 12.3 自动化一切可自动化的事

▪ 12.4 越用越聪明，而不是越用越笨

▪ 12.5 对开发者友好的可扩展设计

◦ 本章小结

第五册：安装部署全攻略 —— 保姆级部署指南，让 Hermes 在你的机器上跑起来

◦ 1. 安装前的准备工作

▪ 1.1 系统要求总览

▪ 最低配置要求

▪ 推荐配置

▪ 类比理解

▪ 1.2 网络环境检查与代理配置

▪ 网络连通性自检

▪ 国内用户的代理配置指南

▪ npm/yarn 镜像源配置

▪ 1.3 必备前置软件清单

▪ 前置软件总览

▪ Python 3.11+ 的安装与验证

▪ Node.js v22+ 的安装与验证

8▪ Git 的安装与验证

▪ 1.4 安装前自检清单（Checklist）

▪ 硬件与环境检查

▪ 软件检查

▪ 权限检查

▪ 国内用户额外检查

▪ 信息准备

◦ 2. 方式一：本地常规部署（推荐小白起步）

▪ 2.1 macOS 安装全流程

▪ 第一步：安装或更新 Homebrew

▪ 第二步：安装 Python 3.11

▪ 进阶：使用 pyenv 管理 Python 版本（强烈推荐）

▪ 第三步：安装 Node.js v22

▪ 第四步：安装 Git

▪ 第五步：运行 Hermes 一键安装脚本

▪ 第六步：验证安装

▪ 2.2 Linux 安装全流程（Ubuntu 22.04 为例）

▪ 第一步：系统更新与依赖安装

▪ 第二步：安装 Python 3.11

▪ 第三步：安装 pyenv（推荐）

▪ 第四步：安装 Node.js v22

▪ 第五步：运行 Hermes 安装脚本

▪ 第六步：验证安装

▪ 2.3 Windows WSL2 安装全流程

▪ 第一步：安装 WSL2

▪ 第二步：配置 Ubuntu 22.04

▪ 第三步：在 WSL 中安装 Hermes

▪ 第四步：Windows 文件系统访问与权限处理

◦ 3. 方式二：Docker 容器化部署

▪ 3.1 Docker Desktop 安装

▪ macOS 安装 Docker Desktop

▪ Windows 安装 Docker Desktop

▪ Linux 安装 Docker Desktop

▪ 3.2 拉取 Hermes 官方镜像

9▪ 3.3 容器运行与数据持久化

▪ 基础运行命令

▪ 数据持久化详解

▪ 3.4 Docker Compose 方式（适合多服务编排）

▪ 3.5 容器管理常用命令

▪ 3.6 容器化的优缺点分析

▪ 优点

▪ 缺点

◦ 4. 方式三：VPS 云服务器部署

▪ 4.1 推荐 VPS 提供商

▪ 海外 VPS 推荐

▪ 国内云服务器推荐

▪ 4.2 服务器选型指南

▪ 4.3 SSH 连接与安全配置

▪ 首次连接服务器

▪ 基础安全配置

▪ 4.4 在 VPS 上安装 Hermes

▪ 4.5 后台运行配置

▪ 方式一：screen（最简单）

▪ 方式二：tmux（功能更强大）

▪ 4.6 域名绑定与反向代理（可选）

▪ 前提条件

▪ 安装和配置 Nginx

▪ 4.7 自动启动配置（systemd）

▪ 日志轮转配置（防止日志占满磁盘）

◦ 5. 方式四：无服务器部署（进阶）

▪ 5.1 Modal 部署方式

▪ 准备工作

▪ 部署 Hermes 到 Modal

▪ 5.2 Daytona 部署方式

▪ 准备工作

▪ 创建 Hermes 开发环境

▪ 5.3 适用场景与成本分析

▪ 各种部署方式的成本对比

▪ 选择建议

10◦ 6. ~/.hermes/ 目录结构详解

▪ 6.1 完整目录树

▪ 6.2 每个文件和文件夹的用途详解

▪ config.yaml —— 主配置文件

▪ SOUL.md —— Agent 人设定义

▪ MEMORY.md —— 全局记忆文件

▪ USER.md —— 用户信息文件

▪ skills/ 目录

▪ cron/ 目录

▪ database/ 目录

▪ logs/ 目录

▪ 6.3 目录结构总结表

◦ 7. 运行状态自检与排障

▪ 7.1 hermes version 版本检查

▪ 7.2 hermes doctor 系统诊断详解

▪ 每个检查项说明

▪ 7.3 常见错误与解决方案

▪ 问题 1：Python 版本冲突

▪ 问题 2：Node.js 版本不对

▪ 问题 3：网络连接失败 / GitHub 无法访问

▪ 问题 4：权限问题（Permission Denied）

▪ 问题 5：依赖安装失败

▪ 问题 6：API Key 配置错误（Provider error: invalid key）

▪ 问题 7：端口占用

▪ 问题 8：磁盘空间不足

▪ 问题 9：数据库损坏

▪ 问题 10：Hermes 命令找不到（Command not found）

▪ 问题 11：Windows 上提示 “bad interpreter”（未使用 WSL2）

▪ 问题 12：WSL2 中文件权限混乱

▪ 问题 12：Docker 容器无法访问主机文件

▪ 问题 13：定时任务不执行

▪ 问题 14：代理配置导致国内服务访问慢

▪ 问题 15：升级后配置不兼容

11◦ 8. 安装后的基本配置

▪ 8.1 初次运行 Quick Setup 向导详解

▪ 步骤 1：选择语言

▪ 步骤 2：选择 LLM 后端

▪ 步骤 3：输入 API Key

▪ 步骤 4：选择默认模型

▪ 步骤 5：配置分层模型（可选）

▪ 步骤 6：完成配置

▪ 8.2 配置完成后的额外优化

▪ 8.3 环境变量配置

▪ 常用环境变量

▪ 永久设置环境变量

▪ 8.3 代理/镜像源配置（国内用户必看）

▪ pip 国内镜像源

▪ npm 国内镜像源

▪ GitHub 加速

▪ LLM API 国内直连优化

▪ 8.4 性能调优与资源限制

▪ 数据库性能优化

▪ 内存使用控制

▪ 并发任务限制

◦ 9. 卸载与重装

▪ 9.1 完整卸载步骤

▪ 步骤 1：备份数据（强烈建议）

▪ 步骤 2：卸载 Hermes 包

▪ 步骤 3：删除数据目录

▪ 步骤 4：清理残留

▪ 9.2 数据备份与恢复

▪ 自动备份脚本

▪ 恢复备份

▪ 9.3 版本升级方法

▪ 通过 pip 升级

▪ 通过 Git 升级（如果从源码安装）

▪ 通过 Docker 升级

▪ 升级前检查

12◦ 本章小结

第六册：基础使用入门 —— 从零开始，掌握 Hermes 的日常操作

◦ 1. 首次运行：Quick Setup 向导

▪ 1.1 启动 hermes 命令

▪ 1.2 向导每一步的详细说明

▪ 步骤 1：欢迎界面

▪ 步骤 2：选择界面语言

▪ 步骤 3：选择 LLM 后端

▪ 模型选择策略详解

▪ 步骤 4：获取和输入 API Key

▪ 步骤 5：选择默认模型

▪ 步骤 6：配置完成

▪ 1.3 配置完成后的验证测试

◦ 2. 对话模式详解

▪ 2.1 基本对话入门

▪ 2.2 多轮对话的上下文管理

▪ 2.3 对话中使用工具

▪ 2.4 对话中的高效提问技巧

▪ 2.5 对话历史的存储与检索

▪ 2.5 退出与恢复对话

◦ 3. 常用命令速查大全

▪ 3.1 hermes（开启对话）

▪ 3.2 hermes chat 相关命令

▪ 3.3 hermes model（模型管理）

▪ 3.4 hermes tools（工具配置）

▪ 3.5 hermes gateway（消息网关）

▪ 3.6 hermes setup（重新配置）

▪ 3.7 hermes doctor（系统诊断）

▪ 3.8 hermes status（状态查看）

▪ 3.9 hermes migrate（数据迁移）

▪ 3.10 hermes skills（技能管理）

▪ 3.11 hermes cron（定时任务）

▪ 3.12 其他常用命令

◦ 4. 斜杠命令系统

▪ 4.1 /help 帮助

13▪ 4.2 /model 切换模型

▪ 4.3 /memory 查看记忆

▪ 4.4 /skills 管理技能

▪ 4.5 /compact 压缩上下文

▪ 4.6 /clear 清除上下文

▪ 4.7 /export 导出对话

▪ 4.8 其他斜杠命令

◦ 5. 模型接入与切换

▪ 5.1 支持的 LLM 提供者完整列表

▪ 5.2 各提供者的接入方法

▪ Nous Portal（官方统一订阅）

▪ OpenAI（GPT-5 / GPT-4o / o1）

▪ Anthropic（Claude 3.5 Sonnet / Opus）

▪ DeepSeek

▪ Kimi（Moonshot）

▪ OpenRouter（一 Key 多用）

▪ 本地模型（Ollama）

▪ 其他国产模型

▪ 5.3 hermes model 命令详解

▪ 5.4 模型切换的实际效果对比

▪ 5.5 模型选择建议（按任务类型推荐）

▪ 5.6 模型费用监控与预算管理

▪ 实时费用查看

▪ 设置月度预算预警

▪ 费用优化 checklist

◦ 6. 分层模型配置（省钱秘笈）

▪ 6.1 config.yaml 模型配置详解

▪ 6.2 核心逻辑用强模型、基础执行用便宜模型

▪ 6.3 Fallback 链机制详解

▪ 6.4 实测成本降低 50%-70% 的配置方案

▪ 6.5 不同预算的推荐配置

◦ 7. SOUL.md 人设配置

▪ 7.1 什么是 SOUL.md

▪ 7.2 编写有效的 SOUL.md（模板 + 示例）

14▪ 7.3 不同场景的人设配置

▪ 场景 1：投研分析师

▪ 场景 2：编程助手

▪ 场景 3：写作助手

▪ 场景 4：客服助手

▪ 7.4 让 Agent 自动更新 SOUL.md 的方法

▪ 7.5 常见人设配置错误与纠正

▪ 错误 1：写得太多太杂

▪ 错误 2：指令互相矛盾

▪ 错误 3：过度限制

▪ 错误 4：不写「身份」部分

▪ 7.6 SOUL.md 的调试与验证技巧

▪ 验证 SOUL.md 是否生效

▪ 常见问题和修复

▪ SOUL.md 迭代优化法

◦ 8. 第一个实战练习

▪ 练习 1：让 Hermes 帮你搜索和总结一篇新闻

▪ 练习 2：让 Hermes 帮你写一段代码

▪ 9.4 更多常见误区

▪ 误区 4：忽视 SOUL.md 的作用

▪ 误区 5：所有任务都用最强模型

▪ 误区 6：不及时清理对话历史

▪ 误区 7：在公共环境中暴露 API Key

▪ 误区 8：不信任工具执行的安全提示

▪ 9.5 最佳实践清单（10 条）

◦ 官方入门工作流示例

▪ 工作流 1：笔记本编程助手（审计仓库死代码）

▪ 工作流 2：$5 VPS 上的 Telegram 机器人

◦ 本章小结

第七册：三层记忆系统详解

◦ 1. 为什么记忆系统是 Hermes 的核心竞争力

▪ 1.1 Agent 没有记忆会怎样——上下文爆炸的痛苦

▪ 1.2 传统 Agent 的记忆方案及其局限

▪ 1.3 Hermes 记忆系统的设计哲学：让 AI 像人一样记忆

▪ 1.4 三层记忆 vs 传统方案的优势对比

15◦ 2. 总览：四层温度记忆模型

▪ 2.1 热记忆（即时）—— 当前会话上下文

▪ 2.2 温记忆（持久）—— MEMORY.md + USER.md

▪ 2.3 冷记忆（检索）—— SQLite + FTS5 + LLM 摘要

▪ 2.4 外部记忆（扩展）—— Honcho、Mem0 等

▪ 2.5 各层的容量、速度、成本对比表

▪ 2.6 类比：就像人的短期记忆、长期记忆、笔记本、图书馆

◦ 3. 第一层：会话记忆（热记忆）

▪ 3.1 会话上下文的工作原理

▪ 3.2 Token 窗口管理策略

▪ 3.3 /compact 命令：智能压缩上下文

▪ 3.4 上下文溢出时的处理机制

▪ 3.5 最佳实践：如何让单次会话效率最高

◦ 4. 第二层：持久记忆（温记忆）

▪ 4.1 MEMORY.md 文件详解

▪ 4.1.1 文件结构与格式

▪ 4.1.2 自动写入机制

▪ 4.1.3 手动编辑方法

▪ 4.1.4 容量限制（~2200字符）与管理策略

▪ 4.1.5 实际 MEMORY.md 示例

▪ 4.2 USER.md 文件详解

▪ 4.2.1 用户画像的自动建模

▪ 4.2.2 记录哪些信息

▪ 4.2.3 容量限制（~1375字符）

▪ 4.2.4 如何查看和编辑

▪ 4.2.5 实际 USER.md 示例

▪ 4.3 持久记忆的读取时机与优先级

◦ 5. 第三层：检索记忆（冷记忆）

▪ 5.1 SQLite 数据库架构详解

▪ 5.1.1 表结构设计

▪ 5.1.2 存储的数据类型

▪ 5.1.3 数据量增长估算

▪ 5.2 FTS5 全文索引

▪ 5.2.1 什么是 FTS5（通俗解释）

▪ 5.2.2 索引建立过程

16▪ 5.2.3 检索速度与效果

▪ 5.2.4 与传统全文搜索的对比

▪ 5.3 按需检索机制

▪ 5.3.1 新对话时不再全量加载

▪ 5.3.2 根据当前话题智能检索

▪ 5.3.3 只提取相关片段

▪ 5.3.4 API 调用成本大幅降低

▪ 5.4 LLM 摘要生成

▪ 5.4.1 自动生成会话摘要

▪ 5.4.2 摘要的存储与索引

▪ 5.4.3 摘要质量的影响因素

◦ 6. 外部记忆扩展

▪ 6.1 Honcho 模块详解

▪ 6.1.1 Honcho 的设计理念

▪ 6.1.2 行为模式推导机制

▪ 6.1.3 安装与配置方法

3. 重启 Hermes
4. 重启 Hermes

◦ 6.4 其他 5 种外部记忆方案

◦ 6.5 选择建议：什么场景用什么方案

◦ 7. 记忆管理实战

▪ 7.1 /memory 命令系列详解

▪ /memory show —— 查看当前记忆状态

▪ /memory add —— 手动添加记忆

▪ /memory remove —— 删除记忆

▪ /memory edit —— 编辑记忆

▪ /memory search —— 搜索记忆

▪ /memory export —— 导出记忆

▪ /memory import —— 导入记忆

▪ /memory compact —— 压缩记忆文件

▪ /memory clear —— 清空记忆

▪ 7.2 查看当前记忆状态

▪ 7.3 手动添加/删除/修改记忆

▪ 7.4 记忆搜索与检索

▪ 7.5 记忆导出与备份

17▪ 7.6 记忆清理与维护

▪ 7.7 定期维护建议

◦ 8. SOUL.md 深度配置

▪ 8.1 SOUL.md 与记忆系统的关系

▪ 8.2 高效 SOUL.md 模板大全

▪ 模板一：投研助手

▪ 模板二：编程助手

▪ 模板三：写作助手

▪ 模板四：客服助手

▪ 模板五：个人助理

▪ 8.3 让 Agent 自动优化 SOUL.md 的技巧

▪ 8.4 SOUL.md 的版本管理

◦ 9. 隐私与安全

▪ 9.1 纯本地存储的安全优势

▪ 9.2 数据加密选项

设置环境变量

◦ 9.3 敏感信息过滤机制

◦ 9.4 数据备份加密方案

◦ 9.5 与云端记忆方案的隐私对比

◦ 10. 高级配置与调优

▪ 10.1 记忆相关 config.yaml 参数详解

▪ 10.2 记忆保留策略调整

▪ 10.3 检索精度 vs 召回率的平衡

▪ 10.4 大数据量下的性能优化

▪ 10.5 hermes status 查看记忆统计

◦ 11. 常见问题与排障

▪ 11.1 记忆不生效？

▪ 11.2 记忆太多太杂？

▪ 11.3 检索结果不准确？

▪ 11.4 数据库损坏修复

▪ 11.5 迁移时记忆丢失？

◦ 本章小结

第八册：技能系统完全指南

◦ 1. 技能系统：让 Hermes 从”聊天机器”变成”全能助手”

▪ 1.1 什么是 Skill（技能）

18▪ 1.2 Skill 与传统 Prompt 模板的区别

▪ 1.3 技能系统是 Hermes 最实用的功能

▪ 1.4 技能系统的三大特点：自动创建、自我进化、跨平台复用

◦ 2. 技能的内部结构

▪ 2.1 Skill 文件格式详解（Markdown）

▪ 2.2 一个完整 Skill 文件的剖析

▪ Step 5: Save (Optional)

◦ Error Handling

◦ Notes

◦ Example Input

◦ Example Output

AI News Summary (2026-04-21)

◦ Overview

▪ 触发条件区（Trigger Conditions）

▪ 执行步骤区（Execution Steps）

▪ 注意事项区（Notes / Error Handling）

▪ 示例输入输出区（Example Input/Output）

▪ 2.3 技能文件存储位置：~/.hermes/skills/

▪ 2.4 技能的命名规范

◦ 3. 自动技能创建：Hermes 的独门绝技

▪ 3.1 触发条件详解

▪ 3.2 创建过程详解（从任务执行到 Skill 生成）

▪ 3.3 自动提炼的算法逻辑

▪ 3.4 实际案例演示（5 个完整案例）

▪ 案例 1：抓取新闻并总结

▪ 案例 2：代码重构工作流

▪ 案例 3：数据分析报告生成

▪ 案例 4：多语言翻译校对

▪ 案例 5：自动化部署脚本

◦ 4. 技能自我进化

▪ 4.1 进化触发机制

▪ 4.2 版本管理与变更记录

▪ 4.3 用户反馈驱动的改进

▪ 4.4 社区实测：1-2 周后重复任务成功率提升 30%+

▪ 4.5 如何加速技能进化

19◦ 5. 手动创建技能

▪ 5.1 为什么有时需要手动创建

▪ 5.2 手动创建的完整教程

▪ 5.3 Skill 文件模板大全

▪ 模板一：数据提取与转换

▪ 模板二：API 测试与验证

▪ 模板三：文档生成

▪ 模板四：安全扫描与审计

▪ 模板五：会议纪要与行动项提取

Meeting Notes: ()

◦ Attendees

◦ Key Discussion Points

◦ Decisions Made

◦ Action Items

◦ Open Questions / Blockers

▪ 5.4 编写高质量 Skill 的 10 个技巧

▪ 5.5 测试与验证技能

◦ 6. 技能管理命令大全

▪ 6.1 hermes skills list —— 查看所有技能

▪ 6.2 hermes skills show —— 查看技能详情

▪ 6.3 hermes skills edit —— 编辑技能

▪ 6.4 hermes skills delete —— 删除技能

▪ 6.5 hermes skills export —— 导出技能

▪ 6.6 hermes skills import —— 导入技能

▪ 6.7 其他实用命令

◦ 7. Skills Hub 与社区技能

▪ 7.1 官方 Skills Hub（agentskills.io 兼容）

▪ 7.2 四个信任等级体系

▪ 7.3 浏览与搜索社区技能

▪ 7.4 一键安装社区技能

▪ 7.5 技能质量评估方法

▪ 7.6 推荐的 Top 20 社区技能

▪ 7.7 推荐首装的 5 个技能

▪ 推荐 1：LLM Wiki（内置）

▪ 推荐 2：Gstack（可信）

20▪ 推荐 3：OpenAI Utils（可信）

▪ 推荐 4：Manim（官方）

▪ 推荐 5：Security Audit（官方）

▪ 7.8 如何贡献自己的技能

◦ 8. 跨平台技能复用

▪ 8.1 从 Claude Code 迁移技能

▪ 8.2 从 Cursor 迁移技能

▪ 8.3 从 OpenClaw 迁移技能

▪ 8.4 技能格式兼容性说明

▪ 8.5 迁移后的调整与优化

◦ 9. 出厂预装技能详解

▪ 9.1 74 个内置技能分类总览

▪ 9.2 44 个官方可选技能介绍

▪ 9.3 重点技能详解（15 个最实用的）

▪ 1. LLM Wiki（内置）

▪ 2. Code Review（内置）

▪ 3. Web Search（内置）

▪ 4. Git Workflow（内置）

▪ 5. File Organize（内置）

▪ 6. Debug Helper（内置）

▪ 7. Markdown Format（内置）

▪ 8. Summarize（内置）

▪ 9. API Doc Generator（官方可选）

▪ 10. Data Pipeline（官方可选）

▪ 11. Test Automation（官方可选）

▪ 12. Docker Deploy（官方可选）

▪ 13. Nginx Config（官方可选）

▪ 14. SQL Optimizer（官方可选）

▪ 15. Changelog Generator（社区）

▪ 9.4 技能组合推荐（按使用场景）

◦ 10. 高阶技能开发

▪ 10.1 复合技能（一个技能调用多个子技能）

▪ 10.2 条件分支技能

▪ 10.3 带参数的技能模板

▪ 10.4 技能的错误处理

21▪ 10.5 技能的性能优化

◦ 11. 技能系统最佳实践

▪ 11.1 技能命名规范

▪ 11.2 技能分类管理

▪ 11.3 定期审计与清理

▪ 11.4 团队共享技能库的建立

▪ 11.5 技能文档化建议

◦ 本章小结

第九册：47 个内置工具全解 —— Hermes Agent 的瑞士军刀使用手册

◦ 1. 工具系统总览：Agent 的「手脚」是如何长出来的

▪ 1.1 什么是 Hermes 工具（Tool）

▪ 1.2 工具与技能（Skill）的区别

▪ 1.3 ToolRegistry 单例模式与自注册机制

▪ 核心组件：ToolRegistry

▪ 自注册机制：装饰器魔法

▪ 1.4 工具调用的安全审批流程

▪ 危险等级分类

▪ 审批界面长什么样

▪ 配置审批策略

▪ 1.5 hermes tools 命令使用

▪ 本章小结

◦ 2. 第一类：文件系统工具 —— Agent 的「文件管家」

▪ 2.1 read_file —— 读取文件内容

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 常见场景

▪ 注意事项

▪ 2.2 write_file —— 写入/创建文件

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 常见场景

▪ 注意事项

22▪ 2.3 edit_file —— 编辑文件（差异替换）

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 常见场景

▪ 注意事项

▪ 2.4 list_directory —— 列出目录内容

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 常见场景

▪ 注意事项

▪ 2.5 search_files —— 搜索文件（grep 风格）

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 搜索语法速查表

▪ 注意事项

▪ 2.6 file_info —— 获取文件元信息

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 常见场景

▪ 注意事项

▪ 文件系统工具组合实战

▪ 本章小结

◦ 3. 第二类：代码执行工具 —— Agent 的「编译器」和「解释器」

▪ 3.1 execute_python —— 执行 Python 代码

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 常见场景

▪ 注意事项

▪ 3.2 execute_shell —— 执行 Shell 命令

▪ 功能说明

23▪ 参数详解

▪ 使用示例

▪ 安全机制详解

▪ 常见场景

▪ 3.3 execute_javascript —— 执行 JavaScript

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 注意事项

▪ 3.4 sandbox_run —— 沙箱环境执行

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 沙箱限制说明

▪ 本章小结

◦ 4. 第三类：Web 交互工具 —— Agent 的「浏览器」和「网络接口」

▪ 4.1 web_search —— 网络搜索

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 搜索语法速查表

▪ 注意事项

▪ 4.2 web_extract —— 提取网页内容

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 注意事项

▪ 4.3 web_browse —— 浏览器控制

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 操作类型详解

▪ 注意事项

▪ 4.4 web_screenshot —— 网页截图

▪ 功能说明

24▪ 参数详解

▪ 使用示例

▪ 4.5 http_request —— HTTP 请求

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 认证方式示例

▪ 注意事项

▪ 4.6 rss_fetch —— RSS 订阅获取

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 4.7 api_call —— 通用 API 调用

▪ 功能说明

▪ 内置适配器

▪ 参数详解

▪ 使用示例

▪ 4.8 web_monitor —— 网页变化监控

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 注意事项

▪ 本章小结

◦ 5. 第四类：终端命令工具 —— Agent 的「系统管理员」套装

▪ 5.1 run_command —— 运行系统命令

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 白名单配置

▪ 注意事项

▪ 5.2 background_task —— 后台任务管理

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 注意事项

25▪ 5.3 process_list —— 进程列表

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 5.4 kill_process —— 终止进程

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 信号说明

▪ 5.5 system_info —— 系统信息获取

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 注意事项

▪ 本章小结

◦ 6. 第五类：记忆管理工具 —— Agent 的「笔记本」和「档案馆」

▪ 6.1 memory_read —— 读取记忆

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 注意事项

▪ 6.2 memory_write —— 写入记忆

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 注意事项

▪ 6.3 memory_update —— 更新记忆

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 6.4 memory_delete —— 删除记忆

▪ 功能说明

▪ 参数详解

▪ 使用示例

26▪ 6.5 memory_search —— 搜索历史记忆

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ FTS5 全文索引查询语法

▪ 6.6 session_search —— 搜索历史会话

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 本章小结

◦ 7. 第六类：技能管理工具 —— Agent 的「技能学院」管理员

▪ 7.1 skill_create —— 创建技能

▪ 功能说明

▪ 参数详解

▪ 使用示例

◦ 示例

▪ 7.2 skill_read —— 查看技能

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 7.3 skill_update —— 更新技能

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 7.4 skill_delete —— 删除技能

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 7.5 skill_list —— 列出所有技能

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 7.6 skill_install —— 从 Hub 安装技能

▪ 功能说明

▪ 参数详解

27▪ 使用示例

▪ 信任等级说明

▪ 本章小结

◦ 8. 第七类：代理委托工具 —— 多 Agent 协作的「调度中心」

▪ 8.1 delegate_task —— 委托子任务

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 任务拆分原则

▪ 8.2 agent_spawn —— 创建子 Agent

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 8.3 agent_communicate —— Agent 间通信

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 8.4 agent_status —— 查看子 Agent 状态

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 8.5 agent_terminate —— 终止子 Agent

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 多 Agent 并发限制说明

▪ 本章小结

◦ 9. 其他辅助工具 —— Agent 的「百宝箱」

▪ 9.1 clipboard —— 剪贴板操作

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 常见场景

▪ 注意事项

28▪ 9.2 notification —— 发送通知

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 平台支持

▪ 9.3 schedule_task —— 定时任务创建

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ Cron 表达式速查

▪ 注意事项

▪ 9.4 image_analyze —— 图像分析

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 注意事项

▪ 9.5 audio_transcribe —— 音频转文字

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 模型选择指南

▪ 9.6 text_transform —— 文本转换

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 支持的操作类型

▪ 9.7 calculator —— 计算器

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 支持的运算符和函数

▪ 本章小结

◦ 10. 工具组合实战案例 —— 从「会用工具」到「善用工具」

▪ 案例 1：自动化投研报告（web_search + web_extract + write_file + delegate_task）

▪ 场景描述

29▪ 工具调用链

▪ 完整的子 Agent A 内部调用链

▪ 输出示例

▪ 案例 2：代码审计流水线（read_file + search_files + execute_python + skill_create）

▪ 场景描述

▪ 工具调用链

▪ 审计报告示例

▪ 案例 3：网站监控 + 通知（web_monitor + notification + schedule_task）

▪ 场景描述

▪ 工具调用链

▪ 监控告警示例

▪ 每日报告示例

▪ 案例 4：多 Agent 研究团队（agent_spawn + delegate_task + memory_write）

▪ 场景描述

▪ 工具调用链

▪ 输出说明

▪ 本章小结

◦ 11. 工具开发与扩展 —— 打造你的专属工具

▪ 11.1 自定义工具的开发方法

▪ 完整示例：开发一个「生成二维码」工具

▪ 工具类结构详解

▪ ToolResult 结构

▪ 11.2 工具注册机制详解

▪ 装饰器注册（推荐）

▪ 手动注册

▪ 配置文件注册

▪ 注册优先级

▪ 11.3 MCP 协议工具扩展

▪ 什么是 MCP

▪ 使用 MCP 扩展示例

▪ 11.4 社区工具贡献指南

▪ 贡献到 Skills Hub

▪ 工具贡献检查清单

▪ 审核标准

▪ 本章小结

30◦ 12. 工具使用最佳实践 —— 从新手到高手的进阶之路

▪ 12.1 安全第一：敏感命令必须审批

▪ 原则 1：默认不信任

▪ 原则 2：最小权限原则

▪ 原则 3：审计日志

▪ 12.2 组合优于单打：多工具配合

▪ 反模式：单打独斗

▪ 正模式：工具链配合

▪ 常用工具链组合

▪ 12.3 成本意识：减少不必要的 API 调用

▪ 成本优化技巧

▪ 成本监控

▪ 12.4 错误处理：工具调用失败的应对

▪ 错误类型和处理策略

▪ 在自定义工具中实现错误处理

▪ 12.5 常见工具使用误区（10 个）

▪ 误区 1：用 write_file 做所有文件修改

▪ 误区 2：忽视 offset 和 limit，读取超大文件

▪ 误区 3：在 execute_shell 中拼接用户输入

▪ 误区 4：重复安装相同的 Python 包

▪ 误区 5：用 web_search 查询本地知识

▪ 误区 6：创建太多监控任务不清理

▪ 误区 7：忽略工具的返回值

▪ 误区 8：过度使用 execute_shell 做简单的事情

▪ 误区 9：不备份就修改重要文件

▪ 误区 10：创建 Agent 后不终止，造成资源泄漏

▪ 12.6 调试工具问题的技巧

▪ 步骤 1：隔离测试

▪ 步骤 2：检查参数

▪ 步骤 3：查看日志

▪ 步骤 4：最小复现

▪ 步骤 5：检查环境

▪ 本章小结

◦ 结语：工具是手段，解决问题才是目的

31· 第十册：多平台接入实战

◦ 1. 为什么需要多平台接入

▪ 1.1 从”只在电脑前用”到”随时随地指挥”

▪ 1.2 消息网关的设计理念

▪ 1.3 15+ 平台一览与分类

◦ 2. Gateway 架构与基础配置

▪ 2.1 hermes gateway 命令详解

▪ 2.2 hermes gateway setup 交互式配置

▪ 2.3 Gateway 的工作原理

▪ 2.3.1 整体架构图

▪ 2.3.2 消息流转的完整流程

▪ 2.4 config.yaml 中的 gateway 配置项

▪ 2.5 多平台同时接入的配置方法

▪ 2.6 本章小结

◦ 3. Telegram 接入（最流行，详细教程）

▪ 3.1 创建 Telegram Bot（@BotFather 全流程）

▪ 3.2 获取 Bot Token

▪ 3.3 获取数字用户 ID（@userinfobot）

▪ 3.4 配置 Hermes

▪ 3.5 启动网关与测试

▪ 3.6 安全配置：允许列表（Allowlist）详解

▪ 为什么必须设置 Allowlist？

▪ Allowlist 配置详解

▪ 3.7 群组中使用 Bot

▪ 把 Bot 加到群组

▪ 群组权限配置

▪ 触发机制

▪ 3.8 富文本消息、文件传输、语音消息

▪ 富文本消息

▪ 文件传输

▪ 语音消息

▪ 3.9 常见问题排障（10个）

▪ 问题1：Bot 完全没有响应

▪ 问题2：可以收到消息但发不出去

▪ 问题3：群组里 Bot 不响应

32▪ 问题4：中文消息显示乱码

▪ 问题5：文件上传失败

▪ 问题6：Webhook 模式收不到消息

▪ 问题7：Polling 模式频繁断线

▪ 问题8：AI 回复很慢

▪ 问题9：Token 泄露了怎么办

▪ 问题10：如何查看 Bot 的 webhook 信息

◦ 4. 飞书接入（国内最方便）

▪ 4.1 飞书企业自建应用创建流程

▪ 4.2 App ID 和 App Secret 获取

▪ 4.3 hermes gateway setup 选飞书

▪ 4.4 事件订阅配置

▪ 4.5 权限设置（最小权限原则）

▪ 4.6 消息卡片与富文本

▪ 4.7 常见问题排障

▪ 问题1：事件订阅验证失败

▪ 问题2：消息能收到但发不出去

▪ 问题3：用户 ID 找不到

▪ 问题4：应用在群里收不到消息

▪ 问题5：企业管理员不审批怎么办

◦ 5. 微信接入

▪ 5.1 企业微信自建应用接入教程

▪ 5.2 微信公众号接入方式

▪ 5.3 个人微信接入方案（第三方桥接）

▪ 5.4 限制与注意事项

◦ 6. Discord 接入

▪ 6.1 Discord Bot 创建流程

▪ 6.2 Token 获取与权限配置

▪ 6.3 频道管理与权限

◦ 7. 其他平台接入

▪ 7.1 Slack 接入

▪ 7.2 WhatsApp 接入

▪ 7.3 Signal 接入

▪ 7.4 Email 接入

▪ 7.5 SMS 接入

33▪ 7.6 Matrix 接入

▪ 7.7 Mattermost 接入

▪ 7.8 Home Assistant 接入

◦ 8. 编辑器集成

▪ 8.1 VS Code 集成（ACP 协议）

▪ 安装扩展

▪ 配置连接

▪ 使用方式

▪ 8.2 Zed 编辑器集成

▪ 8.3 JetBrains IDE 集成

◦ 9. 语音交互

▪ 9.1 语音输入/输出配置

▪ 9.2 支持的语音后端

▪ 9.3 语音交互最佳实践

◦ 10. 多平台协同使用

▪ 10.1 同一 Hermes 实例多平台同时接入

▪ 10.2 上下文和记忆在平台间同步

▪ 10.3 实战案例：手机 Telegram → 电脑执行 → 飞书汇报

◦ 11. 安全与运维

▪ 11.1 Token/Key 安全管理

▪ 11.2 访问控制与白名单

▪ 11.3 网关进程管理

第十一册：MCP 协议与自动化

◦ 1. MCP 协议：Agent 世界的 USB-C

▪ 1.1 什么是 Model Context Protocol（MCP）

▪ 1.2 MCP 诞生背景（Anthropic 提出）

▪ 1.3 设计理念与核心概念

▪ 1.4 与传统 API 调用的区别

◦ 2. MCP 架构详解

▪ 2.1 客户端-服务器模型

▪ 2.2 stdio vs HTTP/SSE 两种连接方式

▪ stdio 模式（标准输入输出）

▪ HTTP/SSE 模式

▪ 2.3 消息格式与协议规范

▪ 请求（Request）

34▪ 响应（Response）

▪ 通知（Notification）

▪ 2.4 工具声明与调用流程

◦ 3. Hermes 中的 MCP 配置

▪ 3.1 config.yaml 中的 mcp_servers 配置

▪ 3.2 stdio 和 HTTP/SSE 模式示例

▪ stdio 模式完整示例

▪ HTTP/SSE 模式完整示例

▪ 3.3 allowed_tools 权限控制

▪ 3.4 多个 MCP Server 并存

◦ 4. 实战：接入 GitHub

▪ 4.1 完整配置

▪ 4.2 Token 获取

▪ 4.3 安全配置

▪ 4.4 使用示例

◦ 5. 实战：接入 Notion

▪ 5.1 Notion Integration 创建

▪ 5.2 API Key 配置

▪ 5.3 MCP 配置

▪ 5.4 使用场景

◦ 6. 实战：接入更多服务

▪ 6.1 Linear（项目管理）

▪ 6.2 Figma（设计协作）

▪ 6.3 Slack（团队沟通）

▪ 6.4 Google Calendar（日程管理）

▪ 6.5 Google Drive（文件存储）

▪ 6.6 PostgreSQL/MySQL（数据库）

◦ 7. 6000+ MCP 服务生态

▪ 7.1 按分类浏览

▪ 7.2 热门 Top 20

▪ 7.3 安全评估

◦ 8. Cron 定时任务系统

▪ 8.1 ~/.hermes/cron/tasks.yaml 配置详解

▪ 8.2 Cron 表达式语法（详细带示例）

35▪ 8.3 定时任务模板

▪ 模板1：每日新闻摘要

▪ 模板2：每日/周/月报告

▪ 模板3：系统监控告警

▪ 模板4：社交媒体内容发布

▪ 模板5：竞品监控

▪ 8.4 hermes cron 命令详解

▪ 8.5 调试技巧

◦ 9. 多 Agent 编排

▪ 9.1 delegate_task 机制

▪ 9.2 最多 3 子 Agent 并行

▪ 9.3 实战案例：投研/内容/代码审查流水线

▪ 案例1：AI 投研流水线

▪ 案例2：内容工厂流水线

▪ 案例3：代码审查流水线

◦ 10. 自动化流水线设计

▪ 10.1 MCP + Cron + 多 Agent 组合

▪ 10.2 全自动 AI 投研流水线示例

▪ 10.3 全自动内容工厂示例

▪ 10.4 错误处理与告警

◦ 11. 安全与合规

▪ 11.1 权限最小化

▪ 11.2 敏感数据处理

▪ 11.3 Rate Limit 与成本控制

▪ 11.4 审计日志

第十二册：高阶玩法与实战案例

◦ 1. 高阶玩法总览

▪ 1.1 从入门到高阶的进阶路线图

▪ 1.2 高阶玩家的典型工作流

▪ 1.3 本章实战案例的阅读方法

◦ 2. 沙箱配置与安全调优

▪ 2.1 执行环境的安全分级

▪ 2.2 沙箱（Sandbox）配置详解

▪ 2.3 命令审批机制的自定义

▪ 2.4 信任级别设置

36▪ 2.5 生产环境安全清单

▪ 2.6 案例：安全地运行未知代码

◦ 3. 语音交互高阶玩法

▪ 3.1 语音输入（STT）高级配置

▪ 3.2 语音输出（TTS）高级配置

▪ 3.3 多语言语音支持

▪ 3.4 语音触发工作流

▪ 3.5 车载/穿戴设备场景

▪ 3.6 案例：纯语音驱动的投研助手

◦ 4. 实战案例：AI 投研流水线

▪ 4.1 需求分析：每日自动追踪 AI/Web3 热点

▪ 4.2 整体架构设计（MCP + Cron + 多Agent）

▪ 4.3 数据源配置（Hacker News、GitHub Trending、Twitter/X、Reddit）

▪ 4.4 数据清洗与分析 Agent

▪ 4.5 报告生成与格式化

▪ 4.6 推送到 Telegram/飞书

▪ 4.7 完整配置代码

▪ 4.8 成本分析（每日运行约 $0.1-0.5）

▪ 4.9 优化建议

◦ 5. 实战案例：内容自动化工厂

▪ 5.1 需求分析：自动生成社交媒体内容

▪ 5.2 选题 Agent（热点追踪）

▪ 5.3 写作 Agent（内容生成）

▪ 5.4 审校 Agent（质量把控）

▪ 5.5 多平台分发（公众号、小红书、抖音文案）

▪ 5.6 定时调度配置

▪ 5.7 案例：日更 5 篇 AI 快讯的配置方案

◦ 6. 实战案例：代码质量守护者

▪ 6.1 需求分析：自动化代码审查与安全扫描

▪ 6.2 Git Hook 集成

▪ 6.3 PR 自动审查工作流

▪ 6.4 安全漏洞扫描

▪ 6.5 代码质量报告生成

▪ 6.6 CI/CD 集成方案

▪ 6.7 案例：开源项目的自动化质量门禁

37◦ 7. 实战案例：个人知识管理系统

▪ 7.1 需求分析：打造第二大脑

▪ 7.2 信息收集自动化（RSS、邮件、书签）

▪ 7.3 智能分类与标签

▪ 7.4 知识图谱构建

▪ 7.5 定期回顾与总结

▪ 7.6 与 Notion/Obsidian 集成

▪ 7.7 案例：研究人员的文献管理助手

◦ 8. 实战案例：客服机器人

▪ 8.1 需求分析：7x24 智能客服

▪ 8.2 知识库构建

▪ 8.3 多轮对话管理

▪ 8.4 人机转接机制

▪ 8.5 满意度收集

▪ 8.6 多渠道部署（网站、微信、Telegram）

▪ 8.7 案例：小型电商的客服解决方案

◦ 9. 实战案例：数据监控与告警

▪ 9.1 需求分析：实时监控关键指标

▪ 9.2 网站可用性监控

▪ 9.3 价格变动追踪

▪ 9.4 竞品动态追踪

▪ 9.5 异常检测与告警

▪ 9.6 案例：加密货币价格监控 + Telegram 告警

◦ 10. 企业级应用场景

▪ 10.1 企业内部知识库助手

▪ 10.2 数据库查询助手（接入公司 DB）

▪ 10.3 项目管理自动化（接入 Linear/Jira）

▪ 10.4 会议纪要自动生成

▪ 10.5 企业安全与合规考量

▪ 10.6 多用户共享实例配置

◦ 11. 高阶技巧合集

▪ 11.1 技巧1：模型热切换（不同任务用不同模型）

▪ 11.2 技巧2：记忆压缩与归档策略

▪ 11.3 技巧3：技能链式调用

▪ 11.4 技巧4：并行任务加速

38▪ 11.5 技巧5：自定义工具开发

▪ 11.6 技巧6：Webhook 集成

▪ 11.7 技巧7：日志分析与调试

▪ 11.8 技巧8：性能监控与优化

◦ 本章小结

第十三册：OpenClaw 对比与迁移

◦ 1. 为什么需要一章专门对比

▪ 1.1 “养虾”和”养马”的选择之困

▪ 1.2 两个项目的社区规模与增长数据

▪ 1.3 本章的客观立场声明

◦ 2. 项目背景对比

▪ 2.1 OpenClaw：独立开发者的杰作

▪ 2.2 Hermes：研究机构的专业之作

▪ 2.3 开源协议对比（MIT vs MIT）

▪ 2.4 商业模式对比

◦ 3. 12 维度深度对比表

▪ 3.1 维度一：主语言/技术栈

▪ 3.2 维度二：架构设计

▪ 3.3 维度三：学习能力

▪ 3.4 维度四：记忆系统

▪ 3.5 维度五：工具生态

▪ 3.6 维度六：平台支持

▪ 3.7 维度七：安全体系

▪ 3.8 维度八：移动应用

▪ 3.9 维度九：模型支持

▪ 3.10 维度十：部署方式

▪ 3.11 维度十一：成本

▪ 3.12 维度十二：社区规模

◦ 4. 核心差异深度分析

▪ 4.1 自学习 vs 手动配置：这是最根本的差异

▪ 4.2 有界记忆 vs 模块化记忆：设计哲学的不同

▪ 4.3 Python vs TypeScript：生态选择的影响

▪ 4.4 轻量 vs 全能：两种架构路线

▪ 4.5 Harness Engineering vs Unix Philosophy

39◦ 5. 社区对比

▪ 5.1 官方定位：四个工具，四种角色

▪ 5.2 社区文化差异

▪ 5.3 中文社区活跃度对比

▪ 5.4 社区贡献模式对比

▪ 5.5 大多数高级用户同时使用 Hermes + Claude Code（叠加而非竞争）

◦ 6. 选型决策指南

▪ 6.1 场景化推荐（详细的决策树）

▪ 6.2 不同预算下的选择

▪ 6.3 不同技术背景下的选择

◦ 7. 从 OpenClaw 迁移到 Hermes

▪ 7.1 迁移前评估清单

▪ 7.2 hermes migrate openclaw 命令详解

▪ 7.3 迁移过程详细步骤

▪ 7.4 自动迁移支持的内容（技能、配置、历史）

▪ 7.5 需要手动调整的部分

▪ 7.6 迁移后验证

▪ 7.7 常见迁移问题与解决方案（10个）

▪ 7.8 迁移后的优化建议

◦ 8. 从其他框架迁移

▪ 8.1 从 AutoGPT 迁移

▪ 8.2 从 MetaGPT 迁移

▪ 8.3 从 CrewAI 迁移

▪ 8.4 通用迁移思路

◦ 9. 两者共存方案

▪ 9.1 同时使用 Hermes + OpenClaw 的场景

▪ 9.2 数据互通方案

▪ 9.3 最佳实践

◦ 10. 本章小结

第十四章：Hermes Agent 九大变现路径

◦ 1. AI Agent 时代的个体变现机遇

▪ 1.1 为什么 AI Agent 是个体搞钱的最佳工具？

▪ 1.2 “超级个体”的概念与 Hermes 的关系

▪ 1.3 变现的底层逻辑：用 AI 放大你的时间价值

▪ 1.4 九条路径总览与难度/收入预估表

40◦ 2. 路径一：代安装与排障服务

▪ 2.1 市场分析：大量小白不会安装

▪ 2.2 接单渠道

▪ 闲鱼

▪ 小红书

▪ 淘宝

▪ 知识星球

▪ 2.3 服务流程标准化

▪ 2.4 定价策略

▪ 2.5 如何用 Hermes 自动生成排障指南

▪ 2.6 月收入预估：兼职 2000-5000 元

▪ 2.7 实操案例与客户反馈模板

◦ 3. 路径二：工作流定制开发

▪ 3.1 目标客户

▪ 3.2 常见需求类型

▪ 数据抓取类

▪ 报表自动化类

▪ 客服自动化类

▪ 监控告警类

▪ 3.3 定价策略

▪ 3.4 开发流程与交付标准

▪ 3.5 如何展示案例获取客户

▪ 3.6 月收入预估：5000-20000 元

▪ 3.7 实操案例：为电商团队搭建竞品监控

◦ 4. 路径三：技能包销售

▪ 4.1 什么是技能包

▪ 4.2 虚拟产品零成本、无限复制

▪ 4.3 热门技能包方向

▪ 投研分析类

▪ 写作辅助类

▪ 编程开发类

▪ 数据分析类

▪ 办公效率类

▪ 4.4 销售渠道

▪ 小红书

41▪ 闲鱼

▪ 独立站

▪ 知识星球/小册

▪ 4.5 定价策略

▪ 4.6 技能包的包装与营销

▪ 4.7 月收入预估：1000-10000 元

▪ 4.8 实操案例：投研技能包的制作与销售

◦ 5. 路径四：自动化内容账号

▪ 5.1 核心思路

▪ 5.2 适合的平台

▪ 5.3 内容方向选择

▪ 5.4 自动化流水线配置

▪ 5.5 流量变现方式

▪ 平台流量分成

▪ 广告合作

▪ 带货/分销

▪ 引流到私域

▪ 5.6 合规注意事项

▪ 5.7 月收入预估：2000-50000 元

▪ 5.8 实操案例：日更 AI 快讯公众号

◦ 6. 路径五：付费数据社群

▪ 6.1 核心卖点

▪ 6.2 适合的领域

▪ 6.3 数据源配置与监控方案

▪ 6.4 社群运营与管理

▪ 6.5 定价策略

▪ 6.6 用 Hermes 自动化社群内容推送

▪ 6.7 月收入预估：5000-100000 元

▪ 6.8 实操案例：AI/Web3 投研社群

◦ 7. 路径六：技能分发赚提成

▪ 7.1 Skills Hub 的分成机制

▪ 7.2 如何开发高质量技能

▪ 7.3 技能的推广策略

▪ 7.4 按调用次数分成的收入模型

▪ 7.5 月收入预估：500-5000 元

42▪ 7.6 实操案例

◦ 8. 路径七：自动化任务脚本

▪ 8.1 适合个人的自动化场景

▪ 打折监控

▪ 抢购助手

▪ 数据采集

▪ 生活服务

▪ 社交自动化

▪ 8.2 脚本开发与部署

▪ 8.3 定价与销售

▪ 8.4 月收入预估：1000-5000 元

◦ 9. 路径八：企业内部工具开发

▪ 9.1 企业需求分析

▪ 9.2 接入公司数据库/代码库的方案

▪ 9.3 安全与合规

▪ 9.4 定价策略

▪ 9.5 外包项目获取渠道

▪ 9.6 月收入预估：10000-50000 元

▪ 9.7 实操案例

◦ 10. 路径九：培训与社群陪跑

▪ 10.1 课程内容设计

▪ 10.2 教学形式

▪ 10.3 定价策略

▪ 10.4 长期答疑的价值

▪ 10.5 用 Hermes 辅助教学

▪ 10.6 月收入预估：5000-50000 元

▪ 10.7 实操案例

◦ 11. 变现路径组合策略

▪ 11.1 初级组合：安装服务 + 技能包

▪ 11.2 中级组合：工作流定制 + 培训

▪ 11.3 高级组合：数据社群 + 企业开发

▪ 11.4 时间分配建议

▪ 11.5 从副业到全职的过渡策略

◦ 12. 变现避坑指南

▪ 12.1 常见失败原因

43▪ 12.2 版权与合规问题

▪ 12.3 客户关系管理

▪ 12.4 持续学习的重要性

◦ 本章小结

第十五章：Hermes 社区生态与资源

◦ 1. Hermes 社区全景

▪ 1.1 社区规模与活跃度

▪ 1.2 核心贡献者与维护团队

▪ 1.3 社区文化与价值观

◦ 2. 官方资源大全

▪ 2.1 GitHub 仓库

▪ 2.2 官方英文文档

▪ 2.3 中文社区文档

▪ 2.4 官方技能商店

▪ 2.5 Hermes Atlas（生态地图）

▪ 2.6 Awesome 资源列表

▪ 2.7 橙皮书（花叔）

▪ 2.8 Release Notes 与 Changelog

◦ 3. 中文社区资源

▪ 3.1 中文文档站

▪ 3.2 微信群与飞书群

▪ 3.3 知乎专栏与文章

▪ 3.4 B站教程视频

▪ 3.5 小红书教程

▪ 3.6 公众号推荐

◦ 4. 学习路径推荐

▪ 4.1 路径一：零基础快速入门（1-3 天）

▪ 4.2 路径二：系统性学习（1-2 周）

▪ 4.3 路径三：深度技术研究（1 个月）

▪ 4.4 路径四：从 OpenClaw 迁移（1-3 天）

◦ 5. 社区参与指南

▪ 5.1 如何提 Issue

▪ 5.2 如何提交 PR

▪ 5.3 如何贡献技能

▪ 5.4 如何参与文档翻译

44▪ 5.5 社区行为准则

◦ 6. 生态项目推荐

▪ 6.1 记忆扩展类

▪ 6.2 工具增强类

▪ 6.3 平台集成类

▪ 6.4 开发工具类

▪ 6.5 监控运维类

◦ 7. 常见问题总汇（FAQ）

▪ 7.1 安装相关（5 问）

▪ 7.2 使用相关（5 问）

▪ 7.3 模型相关（5 问）

▪ 7.4 技能相关（5 问）

▪ 7.5 其他（5 问）

◦ 本章小结

第十六章：未来展望与总结

◦ 1. AI Agent 行业趋势展望

▪ 1.1 2026 下半年到 2027 年的发展预测

▪ 1.2 自学习 Agent 将成为主流

▪ 1.3 模型成本持续下降的影响

▪ 1.4 MCP 协议成为行业标准

▪ 1.5 多 Agent 协作系统的成熟

◦ 2. Hermes Agent 路线图

▪ 2.1 已知的官方规划

▪ 2.2 社区呼声最高的功能

▪ 2.3 可能的发展方向

▪ 更强的自学习能力

▪ 更多平台支持

▪ 企业级功能

▪ 移动端支持

▪ 本地模型优化

◦ 3. “养马”文化的未来

▪ 3.1 从个人助手到数字分身

▪ 3.2 Agent 与 Agent 的协作生态

▪ 3.3 社区驱动的创新

▪ 3.4 中国开发者的机遇

45◦ 4. 给不同读者的建议

▪ 4.1 给小白：现在就开始，不要等”完美时机”

▪ 4.2 给开发者：拥抱 Agent 开发范式

▪ 4.3 给创业者：寻找 Agent 原生的商业模式

▪ 4.4 给投研人员：把 Hermes 当作你的研究助手

▪ 4.5 给企业管理者：评估 Agent 的 ROI

◦ 5. 写在最后

▪ 5.1 回顾本书的核心要点

▪ 5.2 AI Agent 不是取代人，而是赋能人

▪ 5.3 “Stay lazy, stay early”

▪ 5.4 感谢读者

▪ 5.5 期待反馈

◦ 6. 附录

▪ 附录 A：完整命令参考表

▪ 附录 B：config.yaml 完整参数参考

▪ 附录 C：推荐阅读书单

▪ 附录 D：相关论文与研究

▪ 附录 E：本书更新日志

◦ 7. 完结语

▪ 鲲鹏Talk 的寄语

▪ 全平台联系方式

▪ 白皮书系列预告

▪ 最后的话

◦ 关于本书

◦ 适合谁读

◦ 四条推荐阅读路线

▪ 路线一：快速入门路线（3-4 小时）

▪ 路线二：深度技术路线（15-20 小时）

▪ 路线三：变现赚钱路线（8-10 小时）

▪ 路线四：从 OpenClaw 迁移路线（6-8 小时）

资源链接请先登录（扫码可直接登录、免注册）

①本文档内容版权归属内容提供方。如果您对本资料有版权申诉，请及时联系我方进行处理（联系方式详见页脚）。
②由于网络或浏览器兼容性等问题导致下载失败，请加客服微信处理（详见下载弹窗提示），感谢理解。
③本资料由其他用户上传，本站不保证质量、数量等令人满意，若存在资料虚假不完整，请及时联系客服投诉处理。
④本站仅收取资料上传人设置的下载费中的一部分分成，用以平摊存储及运营成本。本站仅为用户提供资料分享平台，且会员之间资料免费共享（平台无费用分成），不提供其他经营性业务。

投稿会员：匿名用户

Hermes-Agent白皮书-养马从入门到精通-鲲鹏Talk.pdf

推荐内容/By 规范库

手机扫码、免注册、直接登录