深度拆解:Hermes Agent 从入门到精通橙皮书
作者:花叔(公众号「花叔」· B站「AI进化论-花生」) 基于 Hermes Agent v0.7.0 编写
一句话定位
Hermes Agent 是 Nous Research 发布的开源自主AI智能体框架,核心特色是 「持久化记忆」与「自我进化」能力 ——它不是又一个OpenClaw,而是Harness Engineering概念的第一次产品化:从「你给AI造缰绳」变成「AI自己给自己造缰绳」。
全书结构:5大板块 · 17章
Part 1 概念(2章) → 为什么不是又一个Agent?它是什么?
Part 2 核心机制(4章) → 学习循环 / 三层记忆 / Skill系统 / 工具与MCP
Part 3 动手搭建(5章) → 安装配置 / 首次对话 / 多平台 / 自定义Skill / MCP集成
Part 4 实战场景(4章) → 知识助手 / 开发自动化 / 内容创作 / 多Agent编排
Part 5 深度思考(2章) → vs OpenClaw/Claude Code / 自改进边界
Part 1:概念
不是又一个Agent:从Harness到Hermes
核心论点:2026年初AI编程圈出现共识——瓶颈不是模型,是环境。LangChain团队实验证明,用同一个模型只调整「缰绳」配置,成绩从52.8%涨到66.5%,排名从Top 30跳到Top 5。Mitchell Hashimoto(Terraform创造者)将此命名为 Harness Engineering——每次AI犯错就加一条规则,让它永远不再犯同一个错。
Hermes做了什么:把Harness Engineering的五个组件全部内建,从手动实现变成自动运行:
| Harness五组件 | 手动实现方式 | Hermes内建系统 |
|---|---|---|
| 指令层 | 手写CLAUDE.md / AGENTS.md | Skill系统(markdown文件,自动创建+自改进) |
| 约束层 | 配置hooks / linter / CI | Tool permissions + sandbox + toolset按需启用 |
| 反馈层 | 人工审查 / 评估者Agent | 自改进学习循环(完成后自动复盘优化) |
| 记忆层 | 手动维护knowledge base | 三层记忆(会话/持久/Skill)+ Honcho用户建模 |
| 编排层 | 自己搭多Agent pipeline | 子Agent委派 + cron调度 |
与OpenClaw的本质区别:OpenClaw给你配置即行为的系统,记忆功能完善但主要靠人工编写和维护;Hermes把五个维度全部内建,让它们自动运转。
Hermes Agent全景:60秒看懂
- 发布方:Nous Research(开源AI研究实验室,以Hermes模型家族闻名)
- 核心Slogan:The Agent That Grows With You(和你一起成长的Agent)
- GitHub Stars:2个月飙到27000+
- 开源协议:MIT
- 模型自由:支持200+种模型(OpenAI、Anthropic、Gemini、OpenRouter等)
Part 2:核心机制
学习循环:Agent自己给自己造缰绳
这是Hermes最核心的机制——自改进学习循环:
接收任务 → 执行 → 复盘 → 改进Skill → 下次更快更准
- Agent完成任务后自动复盘
- 识别可优化的环节
- 自动修改或创建Skill文件
- 形成正向循环:用得越多越聪明
三层记忆:从金鱼到老友
| 记忆层级 | 作用 | 技术实现 |
|---|---|---|
| 会话记忆 (Session Memory) | 处理当前对话上下文 | 对话历史 |
| 持久记忆 (Persistent Memory) | 跨会话记住用户偏好、事实和历史交互 | SQLite + FTS5全文检索 |
| 技能记忆 (Skill Memory) | 从任务执行中萃取成功模式,下次直接调用 | Markdown Skill文件 |
关键区别:传统AI助手是「金鱼」(每次对话都失忆),Hermes是「老友」(越用越懂你)。
Skill系统:会自我进化的能力
- Skill以Markdown文件形式存在,可读、可审计、可回滚
- Agent可以自动创建新Skill
- Agent可以自动修改已有Skill(基于任务复盘)
- 不是黑箱权重,而是透明文本——改了什么,你能看到diff
40+工具与MCP:连接一切
- 内置工具:终端执行、文件操作、网页检索、浏览器自动化、视觉、语音生成等40+
- MCP协议:支持Model Context Protocol,可连接任意MCP兼容工具
- 工具权限:沙箱机制,工具集需显式配置,Agent不能随意获取新权限
Part 3:动手搭建
安装与配置:三种方式
- Docker部署(推荐)
- 本地Python安装
- 云端部署
第一次对话:让Hermes认识你
- 初始配置向导
- 用户偏好设定
- 记忆系统激活
多平台接入:在哪都能找到它
支持接入的平台:
- 通讯:Telegram、Discord、Slack、WhatsApp、Signal
- 邮件:IMAP/SMTP
- 智能家居:Home Assistant
- 关键特性:跨平台记忆和技能同步共享
自定义Skill:教Hermes新技能
- 手动编写Skill文件
- Skill文件格式与结构
- 从任务日志自动生成Skill
MCP集成:连接你的工具栈
- MCP服务器配置
- 常用MCP工具集成示例
- 自定义MCP工具开发
Part 4:实战场景
个人知识助手:跨会话记忆的威力
- 利用持久记忆实现知识积累
- 跨会话上下文衔接
- Honcho用户建模实现个性化
开发自动化:代码审查到部署
- 代码审查自动化
- CI/CD流程集成
- 利用Skill记忆固定开发模式
内容创作:从调研到成稿
- 调研→大纲→成稿的完整工作流
- Skill记忆写作风格和偏好
- 跨会话持续迭代内容
多Agent编排:让三匹马同时跑
- 子Agent委派机制
- cron定时任务调度
- 多Agent协作模式
Part 5:深度思考
Hermes vs OpenClaw vs Claude Code:不是选择题
| 维度 | Hermes Agent | OpenClaw | Claude Code |
|---|---|---|---|
| 核心理念 | 自改进Agent | 配置即行为 | 商业级编程助手 |
| 记忆系统 | 三层自动记忆 | Daily Logs + MEMORY.md + 语义搜索 | 项目上下文理解 |
| Skill/能力 | 自动创建+自改进 | 人工编写维护Skill生态 | 内建编程能力 |
| 开源 | MIT开源 | 开源 | 闭源 |
| 适用场景 | 重复性结构性工作 | 一次性复杂任务/代码助手 | 专业编程场景 |
| 投资回报 | 随时间递增 | 即时回报 | 订阅制 |
核心洞察:Hermes适合有大量重复性工作、希望AI越用越懂你的用户;OpenClaw适合即插即用的一次性任务。
自改进Agent的边界:它能走多远
技术层面受控:
- Skill文件是可读markdown,不是黑箱
- 记忆数据在本地(SQLite),可查看删除
- 工具权限有沙箱,需显式配置
实际层面的问题:
- 审计悖论:自主Agent的价值在于不用盯着,但安全需要你盯着——你会真的每天去看Agent改了哪些Skill吗?
- 反馈信号天花板:自改进依赖「判断自己的改进是好是坏」,但「更好」是谁定义的?
- 方向vs效率:自改进让Agent在已知方向上越跑越快,但方向本身还是得人来定
开源vs闭源信任问题:
- 开源(Hermes):信任自己的审计能力,MIT许可但后果自负
- 闭源(Claude Code):信任商业动机,有商业压力保证行为可预测
花叔的核心判断:
自改进Agent是这个领域最让人兴奋的方向,但它的天花板由人的参与程度决定。完全放手不管的自改进Agent,会在效率上赢、在方向上输。最好的状态可能是:让Agent在「怎么做」上自改进,你只管「做什么」和「别做什么」。
核心洞察提炼
1. Harness Engineering的第一次产品化
Hermes不是「又一个Agent工具」,它代表了一个范式转变:从手动给AI造缰绳 → AI自己给自己造缰绳。Harness Engineering五组件(指令层/约束层/反馈层/记忆层/编排层)全部内建并自动化。
2. Skill系统的双重意义
- 技术意义:Markdown格式,可读、可审计、可回滚,不是黑箱
- 哲学意义:Skill记忆是「程序化记忆」——不是记住信息,而是记住「怎么做」。这是从「知识积累」到「能力进化」的质变。
3. 自改进的信任困境
技术上受控 ≠ 实际上受控。「你能看到代码」和「你看了代码」是两回事。自改进Agent的真正挑战不在技术,而在反馈信号的质量——Agent不知道自己不知道什么。
4. 人与Agent的最佳关系
人管:做什么 + 别做什么(方向与边界)
Agent管:怎么做(执行与优化)
这是on the loop而不是in the loop——不是审查每一行代码,而是理解整个系统在做什么、为什么这么做。