阅读时间 12 分钟

OpenClaw 与 Hermes Agent 全面对比:执行者还是学习者

OpenClaw 与 Hermes Agent 是 2026 年最受关注的两个开源自托管 AI Agent 框架。两者都支持多平台消息接入、工具调用和持久化记忆,但在核心哲学、架构设计和演进路线上存在根本差异。本文基于两者截至 2026 年 5 月的最新版本进行全面对比。

OpenClaw 最新版本为 2026.5.3(2026 年 5 月 4 日发布),GitHub 仓库 368k Stars,1,976 位贡献者,41,105 次提交。Hermes Agent 最新版本为 v0.12.0 "The Curator"(2026 年 4 月 30 日发布),GitHub 仓库 132k+ Stars,822 位贡献者,7,150 次提交。

核心哲学:执行者还是学习者

两者的根本分野在于对"Agent 应该是什么"这一问题的回答。

OpenClaw 的定位是执行者(Doer)。它是一套你配置好就能运行的工具,按照预设的技能和流程执行任务。它的性能在你配置完成的那一刻基本确定,除非你手动修改配置或技能文件,否则不会随使用时间发生显著变化。用社区中的说法来形容:"OpenClaw 用的时候什么样,以后还什么样。"

Hermes Agent 的定位是学习者(Learner)。它的核心设计围绕一个可重复的"做、学习、改进"循环展开。每次完成复杂任务后,Hermes 会提取可复用的模式,自动撰写技能文档,并在后续类似任务中调用和优化这些技能。根据 Nous Research 公开的信息,这种程序性记忆机制使得 Hermes 在重复任务家族上的执行效率在数周内可提升约 40%。

这种哲学差异直接影响了用户与 Agent 的关系:OpenClaw 更像一台你设定好程序的机器,Hermes 更像一位与你共事的队友,相处越久配合越默契。

架构设计:网关中心化还是循环中心化

OpenClaw 的网关中心化架构

OpenClaw 采用单一 Node.js 进程作为核心,会话管理、路由、工具执行和状态存储全部集中在这个进程内。其架构可以概括为:

Gateway(单一进程)
    ├── 会话管理
    ├── 消息路由
    ├── 工具执行
    ├── 状态存储
    └── 多平台适配

这种设计的优势在于部署和调试极为简单。用户只需启动一个进程,所有日志集中在一处,不存在服务发现和跨容器网络的问题。对于个人用户和小团队来说,这种"一体化"体验降低了运维负担。

代价是水平扩展受限。当并发任务量增加时,无法独立扩展某个子系统,只能整体扩容。此外,所有组件共享同一地址空间,一旦某个模块出现安全漏洞,影响范围可能波及整个系统。

Hermes Agent 的循环中心化架构

Hermes Agent 将所有组件围绕 AIAgent 循环设计。根据 Nous Research 官方架构文档,其核心文件 run_agent.py 约 13,700 行,包含三个子系统:

  • Prompt Builder:负责系统提示词组装,内置上下文压缩和缓存机制
  • Provider Resolution:支持三种 API 模式(chat_completionscodex_responsesanthropic_messages
  • Tool Dispatch:工具注册表管理 61 个工具和 52 个工具集

下游系统包括 SQLite + FTS5 会话存储、6 种终端后端(本地、Docker、SSH、Daytona、Singularity、Modal)、以及 19 个消息平台适配器。

这种架构下,学习循环是头等架构关切,而非事后补充。每个组件的存在都是为了服务于"观察、行动、反思、改进"这一核心流程。代价是系统复杂度更高,对用户的运维能力有一定要求。

技能系统:静态文档还是自改进程序

技能(Skill)是 Agent 框架的核心竞争力,两者的设计理念截然不同。

OpenClaw:社区驱动的静态技能

OpenClaw 的技能以自然语言 Markdown 文件(SKILL.md)形式存在,存储在 ClawHub 市场上。截至 2026 年初,ClawHub 拥有超过 5,700 个社区贡献技能,覆盖内容创作、销售自动化、数据分析、客户服务等多个领域。

这种设计的好处是门槛极低。即使不具备编程背景的用户,也能通过撰写自然语言文档来定义 Agent 的行为。技能格式直观,类似于写一份操作手册。

但静态技能有两个明显局限:一是性能不会随使用自动提升,每次执行相同任务都需要重复相同的推理过程;二是社区技能的质量参差不齐。Snyk 在 2026 年初的审计中发现 ClawHub 上存在 1,467 个恶意技能,其中 91% 结合了提示注入和传统恶意软件技术。OpenClaw 在 2026.3.22 版本中被迫引入强制性的 SkillFortify 验证机制,直接通过 GitHub URL 安装技能的功能被移除。

Hermes Agent:自改进的程序性记忆

Hermes Agent 的技能系统是其最具辨识度的特性。技能采用 agentskills.io 开放标准格式,但关键差异在于创建和改进方式:

阶段 行为
经验积累 完成复杂多步骤任务
模式提取 识别可复用的工作流模式
技能创建 自动撰写 Markdown 技能文件
技能优化 在后续使用中根据结果自我改进
定期复盘 每完成 15 个任务评估整体表现

这种机制使得 Hermes 的技能库随时间自然增长和优化。一个三月份需要多轮交互才能完成的客户服务流程,到六月份可能变成一步到位的自动化操作。程序性记忆存储的是"怎么做"而非"说了什么",这是与简单对话历史记录的本质区别。

v0.12.0 版本进一步引入了"Curator"机制,能够自动评级和修剪技能库,防止低质量技能累积。

记忆机制:对话存档还是分层认知

OpenClaw 的记忆设计

OpenClaw 使用纯 Markdown 文件管理记忆,包括 SOUL.md(Agent 人格定义)、MEMORY.md(长期记忆)和 USER.md(用户画像)。搜索依赖 SQLite 向量数据库和关键词匹配。

这种设计的优点是简单透明,用户可以直接打开 Markdown 文件查看和编辑 Agent 的记忆内容。缺点是记忆之间缺乏结构化关联,跨会话的知识持久化需要手动配置,且没有自动的知识压缩或摘要机制。

Hermes Agent 的分层记忆架构

Hermes Agent 采用五层记忆架构:

层级 功能 存储方式
持久笔记 Agent 筛选的跨会话知识 SQLite + 文件
会话历史 可搜索的对话记录 FTS5 全文搜索
用户建模 对用户偏好的深度理解 Honcho 辩证法建模
程序记忆 可复用的技能方法 Markdown 文件
归档存储 旧会话的冷存储 SQLite

这种分层设计的核心优势在于冷热分离。高频访问的记忆(如近期技能和用户偏好)保持在活跃上下文中,低频历史记录被压缩归档,从而在不显著增加 Token 消耗的前提下实现长期记忆。v0.7.0 版本起,记忆后端还支持插拔式替换,可接入 Honcho、向量数据库或自定义存储。

安全态势:默认开放还是默认保守

2026 年 2 月的 CVE-2026-25253 是 OpenClaw 安全形象的转折点。这个 CVSS 评分 8.8 的未授权远程代码执行漏洞,导致数万个未修补的 OpenClaw 实例在补丁发布前被入侵。漏洞的根源在于 OpenClaw 的单进程架构和宽泛的默认权限:一个 HTTP 监听端点的缺陷就足以导致整个系统沦陷。

此后 OpenClaw 采取了一系列补救措施:

  • 2026.3.22 起强制 ClawHub 插件验证,禁止直接 GitHub URL 安装
  • 引入 AgentWard 运行时监控(eBPF 探针)
  • 修补 CVE-2026-2847(WebSocket 劫持)等后续漏洞
  • 2026.5.3 版本进一步强化插件安装扫描器,修复了官方捆绑插件包被误拦截的问题

但这些改进大多是事后补救。OpenClaw 的默认安全姿态仍偏向"信任单机环境",沙箱功能默认关闭。

Hermes Agent 的设计从一开始就采用安全默认原则:

  • 容器加固(只读根文件系统、降权运行)
  • 五种沙箱后端可选,默认启用隔离
  • 内置提示注入扫描
  • 敏感数据上下文过滤
  • 凭证文件隔离

截至 2026 年 5 月,Hermes Agent 没有公开记录的 CVE。需要指出的是,任何复杂软件都难以完全避免漏洞,Hermes 的架构优势在于隔离设计能够将单点漏洞的影响范围限制在特定模块内,而非阻止所有漏洞的发生。

功能特性逐项对比

维度 OpenClaw 2026.5.3 Hermes Agent v0.12.0
消息平台 25+ 19(含 Teams、Yuanbao、QQBot、Home Assistant)
终端后端 2(本地、Docker) 6(本地、Docker、SSH、Daytona、Singularity、Modal)
内置工具 依赖技能/插件 40+
子代理 支持 隔离子代理(独立会话、终端、Python RPC)
MCP 支持 客户端 客户端 + Server 模式
定时任务 Heartbeat cron 内置 Cron 调度器
模型提供商 OpenAI、Anthropic、Google、OpenRouter Nous Portal(400+)、OpenRouter(200+)、OpenAI、Anthropic、Gemini、Bedrock、小米 MiMo 等
RL/研究支持 Atropos 集成、批量轨迹生成
语音/TTS ElevenLabs、Edge TTS、macOS 系统 TTS 支持
浏览器自动化 Playwright Camofox(10 个浏览器工具)
本地 LLM Ollama、llama.cpp、vLLM Ollama、llama.cpp、vLLM
安装方式 npm install -g openclaw brew installpip install
资源需求 8GB RAM 最低 8GB RAM 最低
实时语音 支持(macOS/iOS 唤醒词 + Android 连续语音) 支持
可视化 Canvas Live Canvas(Agent 驱动可视化工作区)
文件传输 文件传输插件(16MB 每轮上限,默认拒绝符号链接遍历) 内置文件工具

安装与上手体验

OpenClaw 的安装体验更接近消费级应用。运行 openclaw onboard --install-daemon 后,交互式向导会自动创建工作区、生成人格文件、配置 API 密钥并引导消息平台接入。从冷启动到可操作的 Agent 通常只需 3 到 5 分钟。

Hermes Agent 的安装对技术背景有一定要求。虽然 hermes init 提供了交互式配置,但用户仍需理解 Docker 网络、服务拓扑等概念。对于日常部署容器化系统的 DevOps 工程师来说,这种透明度和可控性是优势;对于从未配置过 .env 文件的用户,则可能构成门槛。

选型建议

使用场景 推荐选择
追求最快部署、最大集成列表和最广社区 OpenClaw
希望 Agent 随使用时间增长而变得更高效 Hermes Agent
从 OpenClaw 迁移(尤其受安全事件影响) Hermes Agent(内置 hermes claw migrate
完全离线运行本地模型 两者皆可
非技术背景,追求开箱即用 OpenClaw
企业级部署,需要安全隔离和可扩展性 Hermes Agent
研究人员,需要 RL 训练和轨迹数据 Hermes Agent
偏好手写 SKILL.md 的提示工程师 OpenClaw
需要实时语音唤醒和可视化 Canvas OpenClaw

参考来源

本文信息来源于以下公开渠道:

  1. OpenClaw 官方 GitHub 仓库 — openclaw/openclaw,368k Stars,1,976 贡献者,41,105 次提交,MIT 许可
  2. OpenClaw 官方 Releases 页面 — 最新版本 2026.5.3(2026 年 5 月 4 日)
  3. OpenClaw 官方文档 — docs.openclaw.ai
  4. Hermes Agent 官方 GitHub 仓库 — NousResearch/hermes-agent,132k+ Stars,822 贡献者,7,150 次提交,MIT 许可
  5. Hermes Agent 官方架构文档 — Nous Research,2026 年
  6. Lushbinary: Hermes vs OpenClaw 关键差异 — 2026 年 4 月 7 日
  7. Lushbinary: Hermes Agent 开发者指南 — 2026 年 4 月 7 日
  8. DeployAgents: OpenClaw vs Hermes 深度对比 — 2026 年 4 月 9 日
  9. Amir Teymoori: Hermes Agent vs OpenClaw 对比 — 2026 年
  10. NVD: CVE-2026-25253 — 美国国家漏洞数据库

局限性与免责声明

本文基于截至 2026 年 5 月的公开信息整理。部分性能数据(如 Hermes 的 40% 效率提升)来源于项目方公开声明,未经独立第三方基准测试验证。

OpenClaw 和 Hermes Agent 都处于快速迭代期,部分特性可能在读者看到本文时已发生变化。建议在做最终决策前查阅各自的官方文档和最新发布说明。

两者均未提供企业级的零信任沙箱。对于金融、医疗等受监管行业,建议在使用前进行额外的安全评估和合规审查。

本文基于公开可获取的社区讨论和官方文档整理,不构成专业采购或安全建议。