Hermes-Agent白皮书-养马从入门到精通-鲲鹏Talk.pdf

工程,开发者,开源,解释,路线,计算机与AI
文档页数:980
文档大小:5.61MB
文档格式:pdf
文档分类:计算机与AI
上传会员:
上传日期:
最后更新:

目录

  • Hermes Agent 白皮书 —— 养马从入门到精通

◦ 作者:鲲鹏Talk

▪ 2026年4月 · 第一版

◦ 完整目录

◦ 关于作者

◦ 版本说明

▪ 当前版本

▪ 更新日志

▪ 许可协议

◦ 这本书是写给谁的

▪ 第一类:AI Agent 小白入门者

▪ 第二类:开发者与技术爱好者

▪ 第三类:创业者与独立开发者

▪ 第四类:投研人员与行业分析师

▪ 第五类:企业用户与技术决策者

◦ 如何阅读本书

路线一:快速入门路线(预计 3-4 小时)

▪ 路线二:深度技术路线(预计 15-20 小时)

▪ 路线三:变现赚钱路线(预计 8-10 小时)

▪ 路线四:从 OpenClaw 迁移路线(预计 6-8 小时)

◦ 完整目录

◦ 导读:为什么要读这本书

2◦ 致谢

  • 第一册:前言与概述

◦ 1. 为什么写这本白皮书

▪ 1.1 AI Agent 时代已来,但大多数人还在门外观望

▪ 1.2 市面上的教程碎片化严重,缺乏系统性

▪ 1.3 从”养虾”到”养马”的转变,需要一本完整指南

▪ 1.4 本书的定位:不是技术论文,是你的 AI 伙伴养成手册

▪ 1.5 这本书的独特之处

◦ 2. Hermes Agent 是什么——一句话说清楚

▪ 2.1 用最通俗的语言解释 Hermes Agent

▪ 2.2 它和 ChatGPT、Claude 等产品的区别

▪ 2.3 它和 AutoGPT、MetaGPT 等框架的区别

▪ 2.4 核心概念:会自我学习、自我进化的本地 AI 助手

◦ 3. 为什么选择 Hermes 而不是其他框架

▪ 3.1 2026 年 AI Agent 市场格局概览

▪ 3.2 Hermes 的五大核心优势

▪ 优势一:记忆自动归档

▪ 优势二:自主创建 Skill

▪ 优势三:技能自我进化

▪ 优势四:按需检索

▪ 优势五:用户建模

▪ 3.3 和 OpenClaw 的定位差异

▪ 3.4 适合什么样的人

◦ 4. 本书内容架构与阅读建议

▪ 4.1 全书 16 册概览

▪ 4.2 不同读者推荐的阅读路线

▪ 4.3 学习方法建议:边学边练、先跑通再深入

◦ 5. 开源社区与学习资源前瞻

▪ 5.1 官方资源快速导航

▪ 5.2 中文社区现状

▪ 5.3 如何参与贡献

◦ 6. 术语表与约定

▪ 6.1 本书常用术语解释

▪ 6.2 代码约定

▪ 6.3 符号约定

3◦ 本章小结

  • 第二册:AI-Agent 行业全景

◦ 1. 什么是 AI Agent——从概念到落地

▪ 1.1 AI Agent 的学术定义与通俗理解

▪ 1.2 Agent 与传统 AI 工具的本质区别

▪ 1.3 感知-推理-行动-学习 闭环模型

▪ 1.4 Agent 的分类:单体 Agent、多 Agent 系统、自主 Agent

◦ 2. AI Agent 发展简史(2022-2026)

▪ 2.1 2022:ChatGPT 引爆大模型革命

▪ 2.2 2023:AutoGPT 掀起 Agent 热潮

▪ 2.3 2024:工具调用成熟、RAG 架构普及、Multi-Agent 系统涌现

▪ 2.4 2025:OpenClaw 横空出世、MCP 协议标准化、个人 AI 助手元年

▪ 2.5 2026:Hermes Agent 崛起、自学习 Agent 时代开启

▪ 2.6 每个阶段的关键项目分析小结

◦ 3. 2025-2026 AI Agent 行业格局

▪ 3.1 主流 Agent 框架全景图

▪ 3.2 详细对比表格

▪ 3.3 开源 vs 闭源、本地 vs 云端的趋势分析

◦ 4. 大模型底座的选择与影响

▪ 4.1 主流 LLM 对比

▪ 4.2 模型能力与 Agent 表现的关系

▪ 4.3 成本分析

▪ 4.4 开源模型 vs 闭源模型对 Agent 生态的影响

◦ 5. MCP 协议:Agent 世界的 USB-C

▪ 5.1 MCP 诞生背景与设计理念

▪ 5.2 MCP 如何统一工具调用标准

▪ 5.3 6000+ 服务的生态爆发

▪ 5.4 MCP 对 Hermes 和 OpenClaw 的不同意义

◦ 6. AI Agent 商业化与变现趋势

▪ 6.1 个人超级个体:AI 赋能单人创业

▪ 6.2 企业内部效率工具

▪ 6.3 开发者生态与技能市场

▪ 6.4 投研自动化、内容自动化等垂直领域

◦ 7. 中国 AI Agent 生态特色

▪ 7.1 国产大模型的崛起

4▪ 7.2 中文社区的特殊需求与玩法

▪ 7.3 本土化部署与合规考量

▪ 7.4 飞书、微信等国内平台的集成优势

◦ 8. 本章小结与展望

▪ 8.1 本章核心内容回顾

▪ 8.2 对 2026-2027 年的展望

▪ 8.3 给读者的行动建议

  • 第三册:Hermes 诞生与演进

◦ 本章你将学到

◦ 1. Nous Research:Hermes 背后的公司

▪ 1.1 一家不走寻常路的 AI 公司

▪ 1.2 6500 万美元融资背后的故事

▪ 1.3 核心团队与技术实力

▪ 1.4 开源理念与商业模式的平衡

▪ 1.5 Nous 的其他产品线

◦ 2. “缰绳工程”(Harness Engineering)理念

▪ 2.1 什么是缰绳工程——用通俗的比喻解释

▪ 2.2 传统 Prompt Engineering 的局限性

▪ 2.3 缰绳工程的核心哲学

▪ 2.4 缰绳工程如何影响了 Hermes 的设计

◦ 3. OpenClaw 的成功与局限

▪ 3.1 OpenClaw 的诞生故事

▪ 3.2 OpenClaw 为什么能拿到 309k Stars

▪ 3.3 OpenClaw 的核心优势

▪ 3.4 OpenClaw 的痛点

▪ 3.5 “养虾”文化的形成

◦ 4. 从 OpenClaw 到 Hermes:进化之路

▪ 4.1 Hermes 解决了 OpenClaw 的哪些痛点

▪ 4.2 核心区别对比

▪ 4.3 为什么说 Hermes 是 OpenClaw 的”进阶版本”

▪ 4.4 数据迁移支持:一键迁移

▪ 4.5 “养马”文化的兴起

◦ 5. 两个月 104,791 Stars 的爆发之路

▪ 5.1 发布时间线与里程碑事件

▪ 5.2 社区反响与技术媒体评价

5▪ 5.3 与其他项目增长速度对比

▪ 5.4 为什么 Hermes 能如此快速增长

◦ 6. “养马” vs “养虾”:社区文化解读

▪ 6.1 命名隐喻的来历

▪ 6.2 两个社区的文化差异

▪ 6.3 从竞争到互补的关系演变

▪ 6.4 社区用语指南

◦ 7. Hermes 的版本演进与路线图

▪ 7.1 当前版本特性概览

▪ 7.2 已知的未来规划

▪ 7.3 社区呼声最高的功能请求

▪ 7.4 生态发展预测

◦ 本章小结

  • 第四册:核心架构深度解析

◦ 本章你将学到

◦ 1. 架构总览:五层设计哲学

▪ 1.1 为什么要了解架构

▪ 1.2 五层架构概览

▪ 1.3 每层一句话总结

▪ 1.4 与传统 Agent 架构的对比

◦ 2. Layer 1: 入口与编排层(HermesCLI + GatewayRunner)

▪ 2.1 CLI 入口的设计理念

▪ 2.2 GatewayRunner 的作用

▪ 2.3 命令解析流程

▪ 2.4 多入口共存的设计选择

◦ 3. Layer 2: Agent 核心层(对话循环与预算机制)

▪ 3.1 同步对话循环的工作原理

▪ 3.2 预算机制:防止 Agent 失控的安全阀

▪ 3.3 Token 计数与成本控制

▪ 3.4 上下文窗口管理策略

▪ 3.5 错误恢复与重试机制

◦ 4. Layer 3: 工具与注册层(ToolRegistry 与自注册)

▪ 4.1 ToolRegistry 单例模式详解

▪ 4.2 工具自注册机制

▪ 4.3 47 个内置工具的分类架构

6▪ 4.4 工具调用的安全审批流程

▪ 4.5 自定义工具的扩展接口

◦ 5. Layer 4: 状态与持久化层(SQLite + MEMORY.md + Cron)

▪ 5.1 SQLite 数据库设计与 FTS5 全文索引

▪ 5.2 MEMORY.md 的结构与管理

▪ 5.3 USER.md 用户画像存储

▪ 5.4 Cron 定时任务调度器

▪ 5.5 数据备份与恢复策略

◦ 6. Layer 5: 平台适配层(15+ 平台、6 种终端后端)

▪ 6.1 平台适配器的设计模式

▪ 6.2 6 种终端后端的选择与配置

▪ 6.3 消息格式转换与统一接口

▪ 6.4 平台特性的处理

  • Telegram 适配器 → 直接发送 Markdown
  • 微信适配器 → 转换为纯文本(或图文消息)
  • 飞书适配器 → 转换为富文本卡片

◦ 7. 自学习闭环:Hermes 的灵魂

▪ 7.1 完整闭环流程详解:执行 → 评估 → 创建 → 改进

▪ 7.2 触发条件详解

▪ 7.3 技能的四个信任等级

▪ 7.4 Skill 自动生成的算法逻辑

▪ 7.5 技能进化的版本管理

▪ 7.6 社区实测数据:重复任务成功率提升 30%+

▪ 7.7 与强化学习的类比

◦ 8. 记忆系统架构:四层温度模型

▪ 8.1 热记忆(即时):当前会话上下文

▪ 8.2 温记忆(持久):MEMORY.md + USER.md

▪ 8.3 冷记忆(检索):SQLite + FTS5 + LLM 摘要

▪ 8.4 外部记忆(扩展):Honcho、Mem0 等 8 种

▪ 8.5 记忆的生命周期管理

▪ 8.6 隐私保护:纯本地存储的安全优势

◦ 9. Honcho 用户建模模块

▪ 9.1 Honcho 是什么

▪ 9.2 行为模式推导机制

▪ 9.3 工作习惯分析

7▪ 9.4 自适应回复风格调整

▪ 9.5 配置与调优

◦ 10. 安全架构

▪ 10.1 命令审批机制

▪ 10.2 沙箱执行环境

▪ 10.3 API Key 安全存储

▪ 10.4 权限最小化原则

▪ 10.5 与 OpenClaw 分级沙箱的对比

◦ 11. 性能与可扩展性

▪ 11.1 Python 轻量架构的优势

▪ 11.2 资源占用基准

▪ 11.3 并发处理能力

▪ 11.4 大规模记忆数据的性能表现

▪ 11.5 扩展方向:插件机制、模块化拆分

◦ 12. 系统设计哲学总结

▪ 12.1 简单优于复杂

▪ 12.2 本地优先,隐私至上

▪ 12.3 自动化一切可自动化的事

▪ 12.4 越用越聪明,而不是越用越笨

▪ 12.5 对开发者友好的可扩展设计

◦ 本章小结

  • 第五册:安装部署全攻略 —— 保姆级部署指南,让 Hermes 在你的机器上跑起来

◦ 1. 安装前的准备工作

▪ 1.1 系统要求总览

▪ 最低配置要求

▪ 推荐配置

▪ 类比理解

▪ 1.2 网络环境检查与代理配置

▪ 网络连通性自检

▪ 国内用户的代理配置指南

▪ npm/yarn 镜像源配置

▪ 1.3 必备前置软件清单

▪ 前置软件总览

▪ Python 3.11+ 的安装与验证

▪ Node.js v22+ 的安装与验证

8▪ Git 的安装与验证

▪ 1.4 安装前自检清单(Checklist)

▪ 硬件与环境检查

▪ 软件检查

▪ 权限检查

▪ 国内用户额外检查

▪ 信息准备

◦ 2. 方式一:本地常规部署(推荐小白起步)

▪ 2.1 macOS 安装全流程

▪ 第一步:安装或更新 Homebrew

▪ 第二步:安装 Python 3.11

▪ 进阶:使用 pyenv 管理 Python 版本(强烈推荐)

▪ 第三步:安装 Node.js v22

▪ 第四步:安装 Git

▪ 第五步:运行 Hermes 一键安装脚本

▪ 第六步:验证安装

▪ 2.2 Linux 安装全流程(Ubuntu 22.04 为例)

▪ 第一步:系统更新与依赖安装

▪ 第二步:安装 Python 3.11

▪ 第三步:安装 pyenv(推荐)

▪ 第四步:安装 Node.js v22

▪ 第五步:运行 Hermes 安装脚本

▪ 第六步:验证安装

▪ 2.3 Windows WSL2 安装全流程

▪ 第一步:安装 WSL2

▪ 第二步:配置 Ubuntu 22.04

▪ 第三步:在 WSL 中安装 Hermes

▪ 第四步:Windows 文件系统访问与权限处理

◦ 3. 方式二:Docker 容器化部署

▪ 3.1 Docker Desktop 安装

▪ macOS 安装 Docker Desktop

▪ Windows 安装 Docker Desktop

▪ Linux 安装 Docker Desktop

▪ 3.2 拉取 Hermes 官方镜像

9▪ 3.3 容器运行与数据持久化

▪ 基础运行命令

▪ 数据持久化详解

▪ 3.4 Docker Compose 方式(适合多服务编排)

▪ 3.5 容器管理常用命令

▪ 3.6 容器化的优缺点分析

▪ 优点

▪ 缺点

◦ 4. 方式三:VPS 云服务器部署

▪ 4.1 推荐 VPS 提供商

▪ 海外 VPS 推荐

▪ 国内云服务器推荐

▪ 4.2 服务器选型指南

▪ 4.3 SSH 连接与安全配置

▪ 首次连接服务器

▪ 基础安全配置

▪ 4.4 在 VPS 上安装 Hermes

▪ 4.5 后台运行配置

▪ 方式一:screen(最简单)

▪ 方式二:tmux(功能更强大)

▪ 4.6 域名绑定与反向代理(可选)

▪ 前提条件

▪ 安装和配置 Nginx

▪ 4.7 自动启动配置(systemd)

▪ 日志轮转配置(防止日志占满磁盘)

◦ 5. 方式四:无服务器部署(进阶)

▪ 5.1 Modal 部署方式

▪ 准备工作

▪ 部署 Hermes 到 Modal

▪ 5.2 Daytona 部署方式

▪ 准备工作

▪ 创建 Hermes 开发环境

▪ 5.3 适用场景与成本分析

▪ 各种部署方式的成本对比

▪ 选择建议

10◦ 6. ~/.hermes/ 目录结构详解

▪ 6.1 完整目录树

▪ 6.2 每个文件和文件夹的用途详解

▪ config.yaml —— 主配置文件

▪ SOUL.md —— Agent 人设定义

▪ MEMORY.md —— 全局记忆文件

▪ USER.md —— 用户信息文件

▪ skills/ 目录

▪ cron/ 目录

▪ database/ 目录

▪ logs/ 目录

▪ 6.3 目录结构总结表

◦ 7. 运行状态自检与排障

▪ 7.1 hermes version 版本检查

▪ 7.2 hermes doctor 系统诊断详解

▪ 每个检查项说明

▪ 7.3 常见错误与解决方案

▪ 问题 1:Python 版本冲突

▪ 问题 2:Node.js 版本不对

▪ 问题 3:网络连接失败 / GitHub 无法访问

▪ 问题 4:权限问题(Permission Denied)

▪ 问题 5:依赖安装失败

▪ 问题 6:API Key 配置错误(Provider error: invalid key)

▪ 问题 7:端口占用

▪ 问题 8:磁盘空间不足

▪ 问题 9:数据库损坏

▪ 问题 10:Hermes 命令找不到(Command not found)

▪ 问题 11:Windows 上提示 “bad interpreter”(未使用 WSL2)

▪ 问题 12:WSL2 中文件权限混乱

▪ 问题 12:Docker 容器无法访问主机文件

▪ 问题 13:定时任务不执行

▪ 问题 14:代理配置导致国内服务访问慢

▪ 问题 15:升级后配置不兼容

11◦ 8. 安装后的基本配置

▪ 8.1 初次运行 Quick Setup 向导详解

▪ 步骤 1:选择语言

▪ 步骤 2:选择 LLM 后端

▪ 步骤 3:输入 API Key

▪ 步骤 4:选择默认模型

▪ 步骤 5:配置分层模型(可选)

▪ 步骤 6:完成配置

▪ 8.2 配置完成后的额外优化

▪ 8.3 环境变量配置

▪ 常用环境变量

▪ 永久设置环境变量

▪ 8.3 代理/镜像源配置(国内用户必看)

▪ pip 国内镜像源

▪ npm 国内镜像源

▪ GitHub 加速

▪ LLM API 国内直连优化

▪ 8.4 性能调优与资源限制

▪ 数据库性能优化

▪ 内存使用控制

▪ 并发任务限制

◦ 9. 卸载与重装

▪ 9.1 完整卸载步骤

▪ 步骤 1:备份数据(强烈建议)

▪ 步骤 2:卸载 Hermes 包

▪ 步骤 3:删除数据目录

▪ 步骤 4:清理残留

▪ 9.2 数据备份与恢复

▪ 自动备份脚本

▪ 恢复备份

▪ 9.3 版本升级方法

▪ 通过 pip 升级

▪ 通过 Git 升级(如果从源码安装)

▪ 通过 Docker 升级

▪ 升级前检查

12◦ 本章小结

  • 第六册:基础使用入门 —— 从零开始,掌握 Hermes 的日常操作

◦ 1. 首次运行:Quick Setup 向导

▪ 1.1 启动 hermes 命令

▪ 1.2 向导每一步的详细说明

▪ 步骤 1:欢迎界面

▪ 步骤 2:选择界面语言

▪ 步骤 3:选择 LLM 后端

▪ 模型选择策略详解

▪ 步骤 4:获取和输入 API Key

▪ 步骤 5:选择默认模型

▪ 步骤 6:配置完成

▪ 1.3 配置完成后的验证测试

◦ 2. 对话模式详解

▪ 2.1 基本对话入门

▪ 2.2 多轮对话的上下文管理

▪ 2.3 对话中使用工具

▪ 2.4 对话中的高效提问技巧

▪ 2.5 对话历史的存储与检索

▪ 2.5 退出与恢复对话

◦ 3. 常用命令速查大全

▪ 3.1 hermes(开启对话)

▪ 3.2 hermes chat 相关命令

▪ 3.3 hermes model(模型管理)

▪ 3.4 hermes tools(工具配置)

▪ 3.5 hermes gateway(消息网关)

▪ 3.6 hermes setup(重新配置)

▪ 3.7 hermes doctor(系统诊断)

▪ 3.8 hermes status(状态查看)

▪ 3.9 hermes migrate(数据迁移)

▪ 3.10 hermes skills(技能管理)

▪ 3.11 hermes cron(定时任务)

▪ 3.12 其他常用命令

◦ 4. 斜杠命令系统

▪ 4.1 /help 帮助

13▪ 4.2 /model 切换模型

▪ 4.3 /memory 查看记忆

▪ 4.4 /skills 管理技能

▪ 4.5 /compact 压缩上下文

▪ 4.6 /clear 清除上下文

▪ 4.7 /export 导出对话

▪ 4.8 其他斜杠命令

◦ 5. 模型接入与切换

▪ 5.1 支持的 LLM 提供者完整列表

▪ 5.2 各提供者的接入方法

▪ Nous Portal(官方统一订阅)

▪ OpenAI(GPT-5 / GPT-4o / o1)

▪ Anthropic(Claude 3.5 Sonnet / Opus)

▪ DeepSeek

▪ Kimi(Moonshot)

▪ OpenRouter(一 Key 多用)

▪ 本地模型(Ollama)

▪ 其他国产模型

▪ 5.3 hermes model 命令详解

▪ 5.4 模型切换的实际效果对比

▪ 5.5 模型选择建议(按任务类型推荐)

▪ 5.6 模型费用监控与预算管理

▪ 实时费用查看

▪ 设置月度预算预警

▪ 费用优化 checklist

◦ 6. 分层模型配置(省钱秘笈)

▪ 6.1 config.yaml 模型配置详解

▪ 6.2 核心逻辑用强模型、基础执行用便宜模型

▪ 6.3 Fallback 链机制详解

▪ 6.4 实测成本降低 50%-70% 的配置方案

▪ 6.5 不同预算的推荐配置

◦ 7. SOUL.md 人设配置

▪ 7.1 什么是 SOUL.md

▪ 7.2 编写有效的 SOUL.md(模板 + 示例)

14▪ 7.3 不同场景的人设配置

▪ 场景 1:投研分析师

▪ 场景 2:编程助手

▪ 场景 3:写作助手

▪ 场景 4:客服助手

▪ 7.4 让 Agent 自动更新 SOUL.md 的方法

▪ 7.5 常见人设配置错误与纠正

▪ 错误 1:写得太多太杂

▪ 错误 2:指令互相矛盾

▪ 错误 3:过度限制

▪ 错误 4:不写「身份」部分

▪ 7.6 SOUL.md 的调试与验证技巧

▪ 验证 SOUL.md 是否生效

▪ 常见问题和修复

▪ SOUL.md 迭代优化法

◦ 8. 第一个实战练习

▪ 练习 1:让 Hermes 帮你搜索和总结一篇新闻

▪ 练习 2:让 Hermes 帮你写一段代码

▪ 9.4 更多常见误区

▪ 误区 4:忽视 SOUL.md 的作用

▪ 误区 5:所有任务都用最强模型

▪ 误区 6:不及时清理对话历史

▪ 误区 7:在公共环境中暴露 API Key

▪ 误区 8:不信任工具执行的安全提示

▪ 9.5 最佳实践清单(10 条)

◦ 官方入门工作流示例

▪ 工作流 1:笔记本编程助手(审计仓库死代码)

▪ 工作流 2:$5 VPS 上的 Telegram 机器人

◦ 本章小结

  • 第七册:三层记忆系统详解

◦ 1. 为什么记忆系统是 Hermes 的核心竞争力

▪ 1.1 Agent 没有记忆会怎样——上下文爆炸的痛苦

▪ 1.2 传统 Agent 的记忆方案及其局限

▪ 1.3 Hermes 记忆系统的设计哲学:让 AI 像人一样记忆

▪ 1.4 三层记忆 vs 传统方案的优势对比

15◦ 2. 总览:四层温度记忆模型

▪ 2.1 热记忆(即时)—— 当前会话上下文

▪ 2.2 温记忆(持久)—— MEMORY.md + USER.md

▪ 2.3 冷记忆(检索)—— SQLite + FTS5 + LLM 摘要

▪ 2.4 外部记忆(扩展)—— Honcho、Mem0 等

▪ 2.5 各层的容量、速度、成本对比表

▪ 2.6 类比:就像人的短期记忆、长期记忆、笔记本、图书馆

◦ 3. 第一层:会话记忆(热记忆)

▪ 3.1 会话上下文的工作原理

▪ 3.2 Token 窗口管理策略

▪ 3.3 /compact 命令:智能压缩上下文

▪ 3.4 上下文溢出时的处理机制

▪ 3.5 最佳实践:如何让单次会话效率最高

◦ 4. 第二层:持久记忆(温记忆)

▪ 4.1 MEMORY.md 文件详解

▪ 4.1.1 文件结构与格式

▪ 4.1.2 自动写入机制

▪ 4.1.3 手动编辑方法

▪ 4.1.4 容量限制(~2200字符)与管理策略

▪ 4.1.5 实际 MEMORY.md 示例

▪ 4.2 USER.md 文件详解

▪ 4.2.1 用户画像的自动建模

▪ 4.2.2 记录哪些信息

▪ 4.2.3 容量限制(~1375字符)

▪ 4.2.4 如何查看和编辑

▪ 4.2.5 实际 USER.md 示例

▪ 4.3 持久记忆的读取时机与优先级

◦ 5. 第三层:检索记忆(冷记忆)

▪ 5.1 SQLite 数据库架构详解

▪ 5.1.1 表结构设计

▪ 5.1.2 存储的数据类型

▪ 5.1.3 数据量增长估算

▪ 5.2 FTS5 全文索引

▪ 5.2.1 什么是 FTS5(通俗解释)

▪ 5.2.2 索引建立过程

16▪ 5.2.3 检索速度与效果

▪ 5.2.4 与传统全文搜索的对比

▪ 5.3 按需检索机制

▪ 5.3.1 新对话时不再全量加载

▪ 5.3.2 根据当前话题智能检索

▪ 5.3.3 只提取相关片段

▪ 5.3.4 API 调用成本大幅降低

▪ 5.4 LLM 摘要生成

▪ 5.4.1 自动生成会话摘要

▪ 5.4.2 摘要的存储与索引

▪ 5.4.3 摘要质量的影响因素

◦ 6. 外部记忆扩展

▪ 6.1 Honcho 模块详解

▪ 6.1.1 Honcho 的设计理念

▪ 6.1.2 行为模式推导机制

▪ 6.1.3 安装与配置方法

  • 3. 重启 Hermes
  • 4. 重启 Hermes

◦ 6.4 其他 5 种外部记忆方案

◦ 6.5 选择建议:什么场景用什么方案

◦ 7. 记忆管理实战

▪ 7.1 /memory 命令系列详解

▪ /memory show —— 查看当前记忆状态

▪ /memory add —— 手动添加记忆

▪ /memory remove —— 删除记忆

▪ /memory edit —— 编辑记忆

▪ /memory search —— 搜索记忆

▪ /memory export —— 导出记忆

▪ /memory import —— 导入记忆

▪ /memory compact —— 压缩记忆文件

▪ /memory clear —— 清空记忆

▪ 7.2 查看当前记忆状态

▪ 7.3 手动添加/删除/修改记忆

▪ 7.4 记忆搜索与检索

▪ 7.5 记忆导出与备份

17▪ 7.6 记忆清理与维护

▪ 7.7 定期维护建议

◦ 8. SOUL.md 深度配置

▪ 8.1 SOUL.md 与记忆系统的关系

▪ 8.2 高效 SOUL.md 模板大全

▪ 模板一:投研助手

▪ 模板二:编程助手

▪ 模板三:写作助手

▪ 模板四:客服助手

▪ 模板五:个人助理

▪ 8.3 让 Agent 自动优化 SOUL.md 的技巧

▪ 8.4 SOUL.md 的版本管理

◦ 9. 隐私与安全

▪ 9.1 纯本地存储的安全优势

▪ 9.2 数据加密选项

  • 设置环境变量

◦ 9.3 敏感信息过滤机制

◦ 9.4 数据备份加密方案

◦ 9.5 与云端记忆方案的隐私对比

◦ 10. 高级配置与调优

▪ 10.1 记忆相关 config.yaml 参数详解

▪ 10.2 记忆保留策略调整

▪ 10.3 检索精度 vs 召回率的平衡

▪ 10.4 大数据量下的性能优化

▪ 10.5 hermes status 查看记忆统计

◦ 11. 常见问题与排障

▪ 11.1 记忆不生效?

▪ 11.2 记忆太多太杂?

▪ 11.3 检索结果不准确?

▪ 11.4 数据库损坏修复

▪ 11.5 迁移时记忆丢失?

◦ 本章小结

  • 第八册:技能系统完全指南

◦ 1. 技能系统:让 Hermes 从”聊天机器”变成”全能助手”

▪ 1.1 什么是 Skill(技能)

18▪ 1.2 Skill 与传统 Prompt 模板的区别

▪ 1.3 技能系统是 Hermes 最实用的功能

▪ 1.4 技能系统的三大特点:自动创建、自我进化、跨平台复用

◦ 2. 技能的内部结构

▪ 2.1 Skill 文件格式详解(Markdown)

▪ 2.2 一个完整 Skill 文件的剖析

▪ Step 5: Save (Optional)

◦ Error Handling

◦ Notes

◦ Example Input

◦ Example Output

  • AI News Summary (2026-04-21)

◦ Overview

▪ 触发条件区(Trigger Conditions)

▪ 执行步骤区(Execution Steps)

▪ 注意事项区(Notes / Error Handling)

▪ 示例输入输出区(Example Input/Output)

▪ 2.3 技能文件存储位置:~/.hermes/skills/

▪ 2.4 技能的命名规范

◦ 3. 自动技能创建:Hermes 的独门绝技

▪ 3.1 触发条件详解

▪ 3.2 创建过程详解(从任务执行到 Skill 生成)

▪ 3.3 自动提炼的算法逻辑

▪ 3.4 实际案例演示(5 个完整案例)

▪ 案例 1:抓取新闻并总结

▪ 案例 2:代码重构工作流

▪ 案例 3:数据分析报告生成

▪ 案例 4:多语言翻译校对

▪ 案例 5:自动化部署脚本

◦ 4. 技能自我进化

▪ 4.1 进化触发机制

▪ 4.2 版本管理与变更记录

▪ 4.3 用户反馈驱动的改进

▪ 4.4 社区实测:1-2 周后重复任务成功率提升 30%+

▪ 4.5 如何加速技能进化

19◦ 5. 手动创建技能

▪ 5.1 为什么有时需要手动创建

▪ 5.2 手动创建的完整教程

▪ 5.3 Skill 文件模板大全

▪ 模板一:数据提取与转换

▪ 模板二:API 测试与验证

▪ 模板三:文档生成

▪ 模板四:安全扫描与审计

▪ 模板五:会议纪要与行动项提取

  • Meeting Notes: ()

◦ Attendees

◦ Key Discussion Points

◦ Decisions Made

◦ Action Items

◦ Open Questions / Blockers

▪ 5.4 编写高质量 Skill 的 10 个技巧

▪ 5.5 测试与验证技能

◦ 6. 技能管理命令大全

▪ 6.1 hermes skills list —— 查看所有技能

▪ 6.2 hermes skills show —— 查看技能详情

▪ 6.3 hermes skills edit —— 编辑技能

▪ 6.4 hermes skills delete —— 删除技能

▪ 6.5 hermes skills export —— 导出技能

▪ 6.6 hermes skills import —— 导入技能

▪ 6.7 其他实用命令

◦ 7. Skills Hub 与社区技能

▪ 7.1 官方 Skills Hub(agentskills.io 兼容)

▪ 7.2 四个信任等级体系

▪ 7.3 浏览与搜索社区技能

▪ 7.4 一键安装社区技能

▪ 7.5 技能质量评估方法

▪ 7.6 推荐的 Top 20 社区技能

▪ 7.7 推荐首装的 5 个技能

▪ 推荐 1:LLM Wiki(内置)

▪ 推荐 2:Gstack(可信)

20▪ 推荐 3:OpenAI Utils(可信)

▪ 推荐 4:Manim(官方)

▪ 推荐 5:Security Audit(官方)

▪ 7.8 如何贡献自己的技能

◦ 8. 跨平台技能复用

▪ 8.1 从 Claude Code 迁移技能

▪ 8.2 从 Cursor 迁移技能

▪ 8.3 从 OpenClaw 迁移技能

▪ 8.4 技能格式兼容性说明

▪ 8.5 迁移后的调整与优化

◦ 9. 出厂预装技能详解

▪ 9.1 74 个内置技能分类总览

▪ 9.2 44 个官方可选技能介绍

▪ 9.3 重点技能详解(15 个最实用的)

▪ 1. LLM Wiki(内置)

▪ 2. Code Review(内置)

▪ 3. Web Search(内置)

▪ 4. Git Workflow(内置)

▪ 5. File Organize(内置)

▪ 6. Debug Helper(内置)

▪ 7. Markdown Format(内置)

▪ 8. Summarize(内置)

▪ 9. API Doc Generator(官方可选)

▪ 10. Data Pipeline(官方可选)

▪ 11. Test Automation(官方可选)

▪ 12. Docker Deploy(官方可选)

▪ 13. Nginx Config(官方可选)

▪ 14. SQL Optimizer(官方可选)

▪ 15. Changelog Generator(社区)

▪ 9.4 技能组合推荐(按使用场景)

◦ 10. 高阶技能开发

▪ 10.1 复合技能(一个技能调用多个子技能)

▪ 10.2 条件分支技能

▪ 10.3 带参数的技能模板

▪ 10.4 技能的错误处理

21▪ 10.5 技能的性能优化

◦ 11. 技能系统最佳实践

▪ 11.1 技能命名规范

▪ 11.2 技能分类管理

▪ 11.3 定期审计与清理

▪ 11.4 团队共享技能库的建立

▪ 11.5 技能文档化建议

◦ 本章小结

  • 第九册:47 个内置工具全解 —— Hermes Agent 的瑞士军刀使用手册

◦ 1. 工具系统总览:Agent 的「手脚」是如何长出来的

▪ 1.1 什么是 Hermes 工具(Tool)

▪ 1.2 工具与技能(Skill)的区别

▪ 1.3 ToolRegistry 单例模式与自注册机制

▪ 核心组件:ToolRegistry

▪ 自注册机制:装饰器魔法

▪ 1.4 工具调用的安全审批流程

▪ 危险等级分类

▪ 审批界面长什么样

▪ 配置审批策略

▪ 1.5 hermes tools 命令使用

▪ 本章小结

◦ 2. 第一类:文件系统工具 —— Agent 的「文件管家」

▪ 2.1 read_file —— 读取文件内容

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 常见场景

▪ 注意事项

▪ 2.2 write_file —— 写入/创建文件

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 常见场景

▪ 注意事项

22▪ 2.3 edit_file —— 编辑文件(差异替换)

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 常见场景

▪ 注意事项

▪ 2.4 list_directory —— 列出目录内容

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 常见场景

▪ 注意事项

▪ 2.5 search_files —— 搜索文件(grep 风格)

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 搜索语法速查表

▪ 注意事项

▪ 2.6 file_info —— 获取文件元信息

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 常见场景

▪ 注意事项

▪ 文件系统工具组合实战

▪ 本章小结

◦ 3. 第二类:代码执行工具 —— Agent 的「编译器」和「解释器」

▪ 3.1 execute_python —— 执行 Python 代码

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 常见场景

▪ 注意事项

▪ 3.2 execute_shell —— 执行 Shell 命令

▪ 功能说明

23▪ 参数详解

▪ 使用示例

▪ 安全机制详解

▪ 常见场景

▪ 3.3 execute_javascript —— 执行 JavaScript

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 注意事项

▪ 3.4 sandbox_run —— 沙箱环境执行

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 沙箱限制说明

▪ 本章小结

◦ 4. 第三类:Web 交互工具 —— Agent 的「浏览器」和「网络接口」

▪ 4.1 web_search —— 网络搜索

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 搜索语法速查表

▪ 注意事项

▪ 4.2 web_extract —— 提取网页内容

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 注意事项

▪ 4.3 web_browse —— 浏览器控制

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 操作类型详解

▪ 注意事项

▪ 4.4 web_screenshot —— 网页截图

▪ 功能说明

24▪ 参数详解

▪ 使用示例

▪ 4.5 http_request —— HTTP 请求

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 认证方式示例

▪ 注意事项

▪ 4.6 rss_fetch —— RSS 订阅获取

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 4.7 api_call —— 通用 API 调用

▪ 功能说明

▪ 内置适配器

▪ 参数详解

▪ 使用示例

▪ 4.8 web_monitor —— 网页变化监控

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 注意事项

▪ 本章小结

◦ 5. 第四类:终端命令工具 —— Agent 的「系统管理员」套装

▪ 5.1 run_command —— 运行系统命令

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 白名单配置

▪ 注意事项

▪ 5.2 background_task —— 后台任务管理

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 注意事项

25▪ 5.3 process_list —— 进程列表

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 5.4 kill_process —— 终止进程

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 信号说明

▪ 5.5 system_info —— 系统信息获取

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 注意事项

▪ 本章小结

◦ 6. 第五类:记忆管理工具 —— Agent 的「笔记本」和「档案馆」

▪ 6.1 memory_read —— 读取记忆

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 注意事项

▪ 6.2 memory_write —— 写入记忆

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 注意事项

▪ 6.3 memory_update —— 更新记忆

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 6.4 memory_delete —— 删除记忆

▪ 功能说明

▪ 参数详解

▪ 使用示例

26▪ 6.5 memory_search —— 搜索历史记忆

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ FTS5 全文索引查询语法

▪ 6.6 session_search —— 搜索历史会话

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 本章小结

◦ 7. 第六类:技能管理工具 —— Agent 的「技能学院」管理员

▪ 7.1 skill_create —— 创建技能

▪ 功能说明

▪ 参数详解

▪ 使用示例

◦ 示例

▪ 7.2 skill_read —— 查看技能

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 7.3 skill_update —— 更新技能

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 7.4 skill_delete —— 删除技能

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 7.5 skill_list —— 列出所有技能

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 7.6 skill_install —— 从 Hub 安装技能

▪ 功能说明

▪ 参数详解

27▪ 使用示例

▪ 信任等级说明

▪ 本章小结

◦ 8. 第七类:代理委托工具 —— 多 Agent 协作的「调度中心」

▪ 8.1 delegate_task —— 委托子任务

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 任务拆分原则

▪ 8.2 agent_spawn —— 创建子 Agent

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 8.3 agent_communicate —— Agent 间通信

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 8.4 agent_status —— 查看子 Agent 状态

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 8.5 agent_terminate —— 终止子 Agent

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 多 Agent 并发限制说明

▪ 本章小结

◦ 9. 其他辅助工具 —— Agent 的「百宝箱」

▪ 9.1 clipboard —— 剪贴板操作

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 常见场景

▪ 注意事项

28▪ 9.2 notification —— 发送通知

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 平台支持

▪ 9.3 schedule_task —— 定时任务创建

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ Cron 表达式速查

▪ 注意事项

▪ 9.4 image_analyze —— 图像分析

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 注意事项

▪ 9.5 audio_transcribe —— 音频转文字

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 模型选择指南

▪ 9.6 text_transform —— 文本转换

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 支持的操作类型

▪ 9.7 calculator —— 计算器

▪ 功能说明

▪ 参数详解

▪ 使用示例

▪ 支持的运算符和函数

▪ 本章小结

◦ 10. 工具组合实战案例 —— 从「会用工具」到「善用工具」

▪ 案例 1:自动化投研报告(web_search + web_extract + write_file + delegate_task)

▪ 场景描述

29▪ 工具调用链

▪ 完整的子 Agent A 内部调用链

▪ 输出示例

▪ 案例 2:代码审计流水线(read_file + search_files + execute_python + skill_create)

▪ 场景描述

▪ 工具调用链

▪ 审计报告示例

▪ 案例 3:网站监控 + 通知(web_monitor + notification + schedule_task)

▪ 场景描述

▪ 工具调用链

▪ 监控告警示例

▪ 每日报告示例

▪ 案例 4:多 Agent 研究团队(agent_spawn + delegate_task + memory_write)

▪ 场景描述

▪ 工具调用链

▪ 输出说明

▪ 本章小结

◦ 11. 工具开发与扩展 —— 打造你的专属工具

▪ 11.1 自定义工具的开发方法

▪ 完整示例:开发一个「生成二维码」工具

▪ 工具类结构详解

▪ ToolResult 结构

▪ 11.2 工具注册机制详解

▪ 装饰器注册(推荐)

▪ 手动注册

▪ 配置文件注册

▪ 注册优先级

▪ 11.3 MCP 协议工具扩展

▪ 什么是 MCP

▪ 使用 MCP 扩展示例

▪ 11.4 社区工具贡献指南

▪ 贡献到 Skills Hub

▪ 工具贡献检查清单

▪ 审核标准

▪ 本章小结

30◦ 12. 工具使用最佳实践 —— 从新手到高手的进阶之路

▪ 12.1 安全第一:敏感命令必须审批

▪ 原则 1:默认不信任

▪ 原则 2:最小权限原则

▪ 原则 3:审计日志

▪ 12.2 组合优于单打:多工具配合

▪ 反模式:单打独斗

▪ 正模式:工具链配合

▪ 常用工具链组合

▪ 12.3 成本意识:减少不必要的 API 调用

▪ 成本优化技巧

▪ 成本监控

▪ 12.4 错误处理:工具调用失败的应对

▪ 错误类型和处理策略

▪ 在自定义工具中实现错误处理

▪ 12.5 常见工具使用误区(10 个)

▪ 误区 1:用 write_file 做所有文件修改

▪ 误区 2:忽视 offset 和 limit,读取超大文件

▪ 误区 3:在 execute_shell 中拼接用户输入

▪ 误区 4:重复安装相同的 Python 包

▪ 误区 5:用 web_search 查询本地知识

▪ 误区 6:创建太多监控任务不清理

▪ 误区 7:忽略工具的返回值

▪ 误区 8:过度使用 execute_shell 做简单的事情

▪ 误区 9:不备份就修改重要文件

▪ 误区 10:创建 Agent 后不终止,造成资源泄漏

▪ 12.6 调试工具问题的技巧

▪ 步骤 1:隔离测试

▪ 步骤 2:检查参数

▪ 步骤 3:查看日志

▪ 步骤 4:最小复现

▪ 步骤 5:检查环境

▪ 本章小结

◦ 结语:工具是手段,解决问题才是目的

31· 第十册:多平台接入实战

◦ 1. 为什么需要多平台接入

▪ 1.1 从”只在电脑前用”到”随时随地指挥”

▪ 1.2 消息网关的设计理念

▪ 1.3 15+ 平台一览与分类

◦ 2. Gateway 架构与基础配置

▪ 2.1 hermes gateway 命令详解

▪ 2.2 hermes gateway setup 交互式配置

▪ 2.3 Gateway 的工作原理

▪ 2.3.1 整体架构图

▪ 2.3.2 消息流转的完整流程

▪ 2.4 config.yaml 中的 gateway 配置项

▪ 2.5 多平台同时接入的配置方法

▪ 2.6 本章小结

◦ 3. Telegram 接入(最流行,详细教程)

▪ 3.1 创建 Telegram Bot(@BotFather 全流程)

▪ 3.2 获取 Bot Token

▪ 3.3 获取数字用户 ID(@userinfobot)

▪ 3.4 配置 Hermes

▪ 3.5 启动网关与测试

▪ 3.6 安全配置:允许列表(Allowlist)详解

▪ 为什么必须设置 Allowlist?

▪ Allowlist 配置详解

▪ 3.7 群组中使用 Bot

▪ 把 Bot 加到群组

▪ 群组权限配置

▪ 触发机制

▪ 3.8 富文本消息、文件传输、语音消息

▪ 富文本消息

▪ 文件传输

▪ 语音消息

▪ 3.9 常见问题排障(10个)

▪ 问题1:Bot 完全没有响应

▪ 问题2:可以收到消息但发不出去

▪ 问题3:群组里 Bot 不响应

32▪ 问题4:中文消息显示乱码

▪ 问题5:文件上传失败

▪ 问题6:Webhook 模式收不到消息

▪ 问题7:Polling 模式频繁断线

▪ 问题8:AI 回复很慢

▪ 问题9:Token 泄露了怎么办

▪ 问题10:如何查看 Bot 的 webhook 信息

◦ 4. 飞书接入(国内最方便)

▪ 4.1 飞书企业自建应用创建流程

▪ 4.2 App ID 和 App Secret 获取

▪ 4.3 hermes gateway setup 选飞书

▪ 4.4 事件订阅配置

▪ 4.5 权限设置(最小权限原则)

▪ 4.6 消息卡片与富文本

▪ 4.7 常见问题排障

▪ 问题1:事件订阅验证失败

▪ 问题2:消息能收到但发不出去

▪ 问题3:用户 ID 找不到

▪ 问题4:应用在群里收不到消息

▪ 问题5:企业管理员不审批怎么办

◦ 5. 微信接入

▪ 5.1 企业微信自建应用接入教程

▪ 5.2 微信公众号接入方式

▪ 5.3 个人微信接入方案(第三方桥接)

▪ 5.4 限制与注意事项

◦ 6. Discord 接入

▪ 6.1 Discord Bot 创建流程

▪ 6.2 Token 获取与权限配置

▪ 6.3 频道管理与权限

◦ 7. 其他平台接入

▪ 7.1 Slack 接入

▪ 7.2 WhatsApp 接入

▪ 7.3 Signal 接入

▪ 7.4 Email 接入

▪ 7.5 SMS 接入

33▪ 7.6 Matrix 接入

▪ 7.7 Mattermost 接入

▪ 7.8 Home Assistant 接入

◦ 8. 编辑器集成

▪ 8.1 VS Code 集成(ACP 协议)

▪ 安装扩展

▪ 配置连接

▪ 使用方式

▪ 8.2 Zed 编辑器集成

▪ 8.3 JetBrains IDE 集成

◦ 9. 语音交互

▪ 9.1 语音输入/输出配置

▪ 9.2 支持的语音后端

▪ 9.3 语音交互最佳实践

◦ 10. 多平台协同使用

▪ 10.1 同一 Hermes 实例多平台同时接入

▪ 10.2 上下文和记忆在平台间同步

▪ 10.3 实战案例:手机 Telegram → 电脑执行 → 飞书汇报

◦ 11. 安全与运维

▪ 11.1 Token/Key 安全管理

▪ 11.2 访问控制与白名单

▪ 11.3 网关进程管理

  • 第十一册:MCP 协议与自动化

◦ 1. MCP 协议:Agent 世界的 USB-C

▪ 1.1 什么是 Model Context Protocol(MCP)

▪ 1.2 MCP 诞生背景(Anthropic 提出)

▪ 1.3 设计理念与核心概念

▪ 1.4 与传统 API 调用的区别

◦ 2. MCP 架构详解

▪ 2.1 客户端-服务器模型

▪ 2.2 stdio vs HTTP/SSE 两种连接方式

▪ stdio 模式(标准输入输出)

▪ HTTP/SSE 模式

▪ 2.3 消息格式与协议规范

▪ 请求(Request)

34▪ 响应(Response)

▪ 通知(Notification)

▪ 2.4 工具声明与调用流程

◦ 3. Hermes 中的 MCP 配置

▪ 3.1 config.yaml 中的 mcp_servers 配置

▪ 3.2 stdio 和 HTTP/SSE 模式示例

▪ stdio 模式完整示例

▪ HTTP/SSE 模式完整示例

▪ 3.3 allowed_tools 权限控制

▪ 3.4 多个 MCP Server 并存

◦ 4. 实战:接入 GitHub

▪ 4.1 完整配置

▪ 4.2 Token 获取

▪ 4.3 安全配置

▪ 4.4 使用示例

◦ 5. 实战:接入 Notion

▪ 5.1 Notion Integration 创建

▪ 5.2 API Key 配置

▪ 5.3 MCP 配置

▪ 5.4 使用场景

◦ 6. 实战:接入更多服务

▪ 6.1 Linear(项目管理)

▪ 6.2 Figma(设计协作)

▪ 6.3 Slack(团队沟通)

▪ 6.4 Google Calendar(日程管理)

▪ 6.5 Google Drive(文件存储)

▪ 6.6 PostgreSQL/MySQL(数据库)

◦ 7. 6000+ MCP 服务生态

▪ 7.1 按分类浏览

▪ 7.2 热门 Top 20

▪ 7.3 安全评估

◦ 8. Cron 定时任务系统

▪ 8.1 ~/.hermes/cron/tasks.yaml 配置详解

▪ 8.2 Cron 表达式语法(详细带示例)

35▪ 8.3 定时任务模板

▪ 模板1:每日新闻摘要

▪ 模板2:每日/周/月报告

▪ 模板3:系统监控告警

▪ 模板4:社交媒体内容发布

▪ 模板5:竞品监控

▪ 8.4 hermes cron 命令详解

▪ 8.5 调试技巧

◦ 9. 多 Agent 编排

▪ 9.1 delegate_task 机制

▪ 9.2 最多 3 子 Agent 并行

▪ 9.3 实战案例:投研/内容/代码审查流水线

▪ 案例1:AI 投研流水线

▪ 案例2:内容工厂流水线

▪ 案例3:代码审查流水线

◦ 10. 自动化流水线设计

▪ 10.1 MCP + Cron + 多 Agent 组合

▪ 10.2 全自动 AI 投研流水线示例

▪ 10.3 全自动内容工厂示例

▪ 10.4 错误处理与告警

◦ 11. 安全与合规

▪ 11.1 权限最小化

▪ 11.2 敏感数据处理

▪ 11.3 Rate Limit 与成本控制

▪ 11.4 审计日志

  • 第十二册:高阶玩法与实战案例

◦ 1. 高阶玩法总览

▪ 1.1 从入门到高阶的进阶路线图

▪ 1.2 高阶玩家的典型工作流

▪ 1.3 本章实战案例的阅读方法

◦ 2. 沙箱配置与安全调优

▪ 2.1 执行环境的安全分级

▪ 2.2 沙箱(Sandbox)配置详解

▪ 2.3 命令审批机制的自定义

▪ 2.4 信任级别设置

36▪ 2.5 生产环境安全清单

▪ 2.6 案例:安全地运行未知代码

◦ 3. 语音交互高阶玩法

▪ 3.1 语音输入(STT)高级配置

▪ 3.2 语音输出(TTS)高级配置

▪ 3.3 多语言语音支持

▪ 3.4 语音触发工作流

▪ 3.5 车载/穿戴设备场景

▪ 3.6 案例:纯语音驱动的投研助手

◦ 4. 实战案例:AI 投研流水线

▪ 4.1 需求分析:每日自动追踪 AI/Web3 热点

▪ 4.2 整体架构设计(MCP + Cron + 多Agent)

▪ 4.3 数据源配置(Hacker News、GitHub Trending、Twitter/X、Reddit)

▪ 4.4 数据清洗与分析 Agent

▪ 4.5 报告生成与格式化

▪ 4.6 推送到 Telegram/飞书

▪ 4.7 完整配置代码

▪ 4.8 成本分析(每日运行约 $0.1-0.5)

▪ 4.9 优化建议

◦ 5. 实战案例:内容自动化工厂

▪ 5.1 需求分析:自动生成社交媒体内容

▪ 5.2 选题 Agent(热点追踪)

▪ 5.3 写作 Agent(内容生成)

▪ 5.4 审校 Agent(质量把控)

▪ 5.5 多平台分发(公众号、小红书、抖音文案)

▪ 5.6 定时调度配置

▪ 5.7 案例:日更 5 篇 AI 快讯的配置方案

◦ 6. 实战案例:代码质量守护者

▪ 6.1 需求分析:自动化代码审查与安全扫描

▪ 6.2 Git Hook 集成

▪ 6.3 PR 自动审查工作流

▪ 6.4 安全漏洞扫描

▪ 6.5 代码质量报告生成

▪ 6.6 CI/CD 集成方案

▪ 6.7 案例:开源项目的自动化质量门禁

37◦ 7. 实战案例:个人知识管理系统

▪ 7.1 需求分析:打造第二大脑

▪ 7.2 信息收集自动化(RSS、邮件、书签)

▪ 7.3 智能分类与标签

▪ 7.4 知识图谱构建

▪ 7.5 定期回顾与总结

▪ 7.6 与 Notion/Obsidian 集成

▪ 7.7 案例:研究人员的文献管理助手

◦ 8. 实战案例:客服机器人

▪ 8.1 需求分析:7x24 智能客服

▪ 8.2 知识库构建

▪ 8.3 多轮对话管理

▪ 8.4 人机转接机制

▪ 8.5 满意度收集

▪ 8.6 多渠道部署(网站、微信、Telegram)

▪ 8.7 案例:小型电商的客服解决方案

◦ 9. 实战案例:数据监控与告警

▪ 9.1 需求分析:实时监控关键指标

▪ 9.2 网站可用性监控

▪ 9.3 价格变动追踪

▪ 9.4 竞品动态追踪

▪ 9.5 异常检测与告警

▪ 9.6 案例:加密货币价格监控 + Telegram 告警

◦ 10. 企业级应用场景

▪ 10.1 企业内部知识库助手

▪ 10.2 数据库查询助手(接入公司 DB)

▪ 10.3 项目管理自动化(接入 Linear/Jira)

▪ 10.4 会议纪要自动生成

▪ 10.5 企业安全与合规考量

▪ 10.6 多用户共享实例配置

◦ 11. 高阶技巧合集

▪ 11.1 技巧1:模型热切换(不同任务用不同模型)

▪ 11.2 技巧2:记忆压缩与归档策略

▪ 11.3 技巧3:技能链式调用

▪ 11.4 技巧4:并行任务加速

38▪ 11.5 技巧5:自定义工具开发

▪ 11.6 技巧6:Webhook 集成

▪ 11.7 技巧7:日志分析与调试

▪ 11.8 技巧8:性能监控与优化

◦ 本章小结

  • 第十三册:OpenClaw 对比与迁移

◦ 1. 为什么需要一章专门对比

▪ 1.1 “养虾”和”养马”的选择之困

▪ 1.2 两个项目的社区规模与增长数据

▪ 1.3 本章的客观立场声明

◦ 2. 项目背景对比

▪ 2.1 OpenClaw:独立开发者的杰作

▪ 2.2 Hermes:研究机构的专业之作

▪ 2.3 开源协议对比(MIT vs MIT)

▪ 2.4 商业模式对比

◦ 3. 12 维度深度对比表

▪ 3.1 维度一:主语言/技术栈

▪ 3.2 维度二:架构设计

▪ 3.3 维度三:学习能力

▪ 3.4 维度四:记忆系统

▪ 3.5 维度五:工具生态

▪ 3.6 维度六:平台支持

▪ 3.7 维度七:安全体系

▪ 3.8 维度八:移动应用

▪ 3.9 维度九:模型支持

▪ 3.10 维度十:部署方式

▪ 3.11 维度十一:成本

▪ 3.12 维度十二:社区规模

◦ 4. 核心差异深度分析

▪ 4.1 自学习 vs 手动配置:这是最根本的差异

▪ 4.2 有界记忆 vs 模块化记忆:设计哲学的不同

▪ 4.3 Python vs TypeScript:生态选择的影响

▪ 4.4 轻量 vs 全能:两种架构路线

▪ 4.5 Harness Engineering vs Unix Philosophy

39◦ 5. 社区对比

▪ 5.1 官方定位:四个工具,四种角色

▪ 5.2 社区文化差异

▪ 5.3 中文社区活跃度对比

▪ 5.4 社区贡献模式对比

▪ 5.5 大多数高级用户同时使用 Hermes + Claude Code(叠加而非竞争)

◦ 6. 选型决策指南

▪ 6.1 场景化推荐(详细的决策树)

▪ 6.2 不同预算下的选择

▪ 6.3 不同技术背景下的选择

◦ 7. 从 OpenClaw 迁移到 Hermes

▪ 7.1 迁移前评估清单

▪ 7.2 hermes migrate openclaw 命令详解

▪ 7.3 迁移过程详细步骤

▪ 7.4 自动迁移支持的内容(技能、配置、历史)

▪ 7.5 需要手动调整的部分

▪ 7.6 迁移后验证

▪ 7.7 常见迁移问题与解决方案(10个)

▪ 7.8 迁移后的优化建议

◦ 8. 从其他框架迁移

▪ 8.1 从 AutoGPT 迁移

▪ 8.2 从 MetaGPT 迁移

▪ 8.3 从 CrewAI 迁移

▪ 8.4 通用迁移思路

◦ 9. 两者共存方案

▪ 9.1 同时使用 Hermes + OpenClaw 的场景

▪ 9.2 数据互通方案

▪ 9.3 最佳实践

◦ 10. 本章小结

  • 第十四章:Hermes Agent 九大变现路径

◦ 1. AI Agent 时代的个体变现机遇

▪ 1.1 为什么 AI Agent 是个体搞钱的最佳工具?

▪ 1.2 “超级个体”的概念与 Hermes 的关系

▪ 1.3 变现的底层逻辑:用 AI 放大你的时间价值

▪ 1.4 九条路径总览与难度/收入预估表

40◦ 2. 路径一:代安装与排障服务

▪ 2.1 市场分析:大量小白不会安装

▪ 2.2 接单渠道

▪ 闲鱼

▪ 小红书

▪ 淘宝

▪ 知识星球

▪ 2.3 服务流程标准化

▪ 2.4 定价策略

▪ 2.5 如何用 Hermes 自动生成排障指南

▪ 2.6 月收入预估:兼职 2000-5000 元

▪ 2.7 实操案例与客户反馈模板

◦ 3. 路径二:工作流定制开发

▪ 3.1 目标客户

▪ 3.2 常见需求类型

▪ 数据抓取类

▪ 报表自动化类

▪ 客服自动化类

▪ 监控告警类

▪ 3.3 定价策略

▪ 3.4 开发流程与交付标准

▪ 3.5 如何展示案例获取客户

▪ 3.6 月收入预估:5000-20000 元

▪ 3.7 实操案例:为电商团队搭建竞品监控

◦ 4. 路径三:技能包销售

▪ 4.1 什么是技能包

▪ 4.2 虚拟产品零成本、无限复制

▪ 4.3 热门技能包方向

▪ 投研分析类

▪ 写作辅助类

▪ 编程开发类

▪ 数据分析类

▪ 办公效率类

▪ 4.4 销售渠道

▪ 小红书

41▪ 闲鱼

▪ 独立站

▪ 知识星球/小册

▪ 4.5 定价策略

▪ 4.6 技能包的包装与营销

▪ 4.7 月收入预估:1000-10000 元

▪ 4.8 实操案例:投研技能包的制作与销售

◦ 5. 路径四:自动化内容账号

▪ 5.1 核心思路

▪ 5.2 适合的平台

▪ 5.3 内容方向选择

▪ 5.4 自动化流水线配置

▪ 5.5 流量变现方式

▪ 平台流量分成

▪ 广告合作

▪ 带货/分销

▪ 引流到私域

▪ 5.6 合规注意事项

▪ 5.7 月收入预估:2000-50000 元

▪ 5.8 实操案例:日更 AI 快讯公众号

◦ 6. 路径五:付费数据社群

▪ 6.1 核心卖点

▪ 6.2 适合的领域

▪ 6.3 数据源配置与监控方案

▪ 6.4 社群运营与管理

▪ 6.5 定价策略

▪ 6.6 用 Hermes 自动化社群内容推送

▪ 6.7 月收入预估:5000-100000 元

▪ 6.8 实操案例:AI/Web3 投研社群

◦ 7. 路径六:技能分发赚提成

▪ 7.1 Skills Hub 的分成机制

▪ 7.2 如何开发高质量技能

▪ 7.3 技能的推广策略

▪ 7.4 按调用次数分成的收入模型

▪ 7.5 月收入预估:500-5000 元

42▪ 7.6 实操案例

◦ 8. 路径七:自动化任务脚本

▪ 8.1 适合个人的自动化场景

▪ 打折监控

▪ 抢购助手

▪ 数据采集

▪ 生活服务

▪ 社交自动化

▪ 8.2 脚本开发与部署

▪ 8.3 定价与销售

▪ 8.4 月收入预估:1000-5000 元

◦ 9. 路径八:企业内部工具开发

▪ 9.1 企业需求分析

▪ 9.2 接入公司数据库/代码库的方案

▪ 9.3 安全与合规

▪ 9.4 定价策略

▪ 9.5 外包项目获取渠道

▪ 9.6 月收入预估:10000-50000 元

▪ 9.7 实操案例

◦ 10. 路径九:培训与社群陪跑

▪ 10.1 课程内容设计

▪ 10.2 教学形式

▪ 10.3 定价策略

▪ 10.4 长期答疑的价值

▪ 10.5 用 Hermes 辅助教学

▪ 10.6 月收入预估:5000-50000 元

▪ 10.7 实操案例

◦ 11. 变现路径组合策略

▪ 11.1 初级组合:安装服务 + 技能包

▪ 11.2 中级组合:工作流定制 + 培训

▪ 11.3 高级组合:数据社群 + 企业开发

▪ 11.4 时间分配建议

▪ 11.5 从副业到全职的过渡策略

◦ 12. 变现避坑指南

▪ 12.1 常见失败原因

43▪ 12.2 版权与合规问题

▪ 12.3 客户关系管理

▪ 12.4 持续学习的重要性

◦ 本章小结

  • 第十五章:Hermes 社区生态与资源

◦ 1. Hermes 社区全景

▪ 1.1 社区规模与活跃度

▪ 1.2 核心贡献者与维护团队

▪ 1.3 社区文化与价值观

◦ 2. 官方资源大全

▪ 2.1 GitHub 仓库

▪ 2.2 官方英文文档

▪ 2.3 中文社区文档

▪ 2.4 官方技能商店

▪ 2.5 Hermes Atlas(生态地图)

▪ 2.6 Awesome 资源列表

▪ 2.7 橙皮书(花叔)

▪ 2.8 Release Notes 与 Changelog

◦ 3. 中文社区资源

▪ 3.1 中文文档站

▪ 3.2 微信群与飞书群

▪ 3.3 知乎专栏与文章

▪ 3.4 B站教程视频

▪ 3.5 小红书教程

▪ 3.6 公众号推荐

◦ 4. 学习路径推荐

▪ 4.1 路径一:零基础快速入门(1-3 天)

▪ 4.2 路径二:系统性学习(1-2 周)

▪ 4.3 路径三:深度技术研究(1 个月)

▪ 4.4 路径四:从 OpenClaw 迁移(1-3 天)

◦ 5. 社区参与指南

▪ 5.1 如何提 Issue

▪ 5.2 如何提交 PR

▪ 5.3 如何贡献技能

▪ 5.4 如何参与文档翻译

44▪ 5.5 社区行为准则

◦ 6. 生态项目推荐

▪ 6.1 记忆扩展类

▪ 6.2 工具增强类

▪ 6.3 平台集成类

▪ 6.4 开发工具类

▪ 6.5 监控运维类

◦ 7. 常见问题总汇(FAQ)

▪ 7.1 安装相关(5 问)

▪ 7.2 使用相关(5 问)

▪ 7.3 模型相关(5 问)

▪ 7.4 技能相关(5 问)

▪ 7.5 其他(5 问)

◦ 本章小结

  • 第十六章:未来展望与总结

◦ 1. AI Agent 行业趋势展望

▪ 1.1 2026 下半年到 2027 年的发展预测

▪ 1.2 自学习 Agent 将成为主流

▪ 1.3 模型成本持续下降的影响

▪ 1.4 MCP 协议成为行业标准

▪ 1.5 多 Agent 协作系统的成熟

◦ 2. Hermes Agent 路线图

▪ 2.1 已知的官方规划

▪ 2.2 社区呼声最高的功能

▪ 2.3 可能的发展方向

▪ 更强的自学习能力

▪ 更多平台支持

▪ 企业级功能

▪ 移动端支持

▪ 本地模型优化

◦ 3. “养马”文化的未来

▪ 3.1 从个人助手到数字分身

▪ 3.2 Agent 与 Agent 的协作生态

▪ 3.3 社区驱动的创新

▪ 3.4 中国开发者的机遇

45◦ 4. 给不同读者的建议

▪ 4.1 给小白:现在就开始,不要等”完美时机”

▪ 4.2 给开发者:拥抱 Agent 开发范式

▪ 4.3 给创业者:寻找 Agent 原生的商业模式

▪ 4.4 给投研人员:把 Hermes 当作你的研究助手

▪ 4.5 给企业管理者:评估 Agent 的 ROI

◦ 5. 写在最后

▪ 5.1 回顾本书的核心要点

▪ 5.2 AI Agent 不是取代人,而是赋能人

▪ 5.3 “Stay lazy, stay early”

▪ 5.4 感谢读者

▪ 5.5 期待反馈

◦ 6. 附录

▪ 附录 A:完整命令参考表

▪ 附录 B:config.yaml 完整参数参考

▪ 附录 C:推荐阅读书单

▪ 附录 D:相关论文与研究

▪ 附录 E:本书更新日志

◦ 7. 完结语

▪ 鲲鹏Talk 的寄语

▪ 全平台联系方式

▪ 白皮书系列预告

▪ 最后的话

◦ 关于本书

◦ 适合谁读

◦ 四条推荐阅读路线

▪ 路线一:快速入门路线(3-4 小时)

▪ 路线二:深度技术路线(15-20 小时)

▪ 路线三:变现赚钱路线(8-10 小时)

▪ 路线四:从 OpenClaw 迁移路线(6-8 小时)

资源链接请先登录(扫码可直接登录、免注册)
①本文档内容版权归属内容提供方。如果您对本资料有版权申诉,请及时联系我方进行处理(联系方式详见页脚)。
②由于网络或浏览器兼容性等问题导致下载失败,请加客服微信处理(详见下载弹窗提示),感谢理解。
③本资料由其他用户上传,本站不保证质量、数量等令人满意,若存在资料虚假不完整,请及时联系客服投诉处理。
④本站仅收取资料上传人设置的下载费中的一部分分成,用以平摊存储及运营成本。本站仅为用户提供资料分享平台,且会员之间资料免费共享(平台无费用分成),不提供其他经营性业务。
投稿会员:匿名用户
我的头像

报歉!评论已关闭.

手机扫码、免注册、直接登录

 注意:QQ登录支持手机端浏览器一键登录及扫码登录
微信仅支持手机扫码一键登录

账号密码登录(仅适用于原老用户)