Hermes Agent v0.16.0(代号“The Autonomy Release”)已于 2026年6月5日 正式发布。这是 Hermes Agent 向真正“自主智能体”迈进的关键版本,核心在于通过多智能体编排(Kanban Swarm)和视觉交互(Vision-Action),让 Agent 能够独立完成复杂任务并像人类一样操作电脑。
核心自主性:多智能体编排与视觉交互
1. Kanban Swarm:多智能体编排系统
这是 v0.16.0 最核心的功能,旨在解决单个 Agent 处理复杂任务时的局限性:
- 自动拆解任务:通过
/triage命令,系统会自动将一个复杂任务拆解为树状的子任务(Decomposition)。 - 智能体拓扑:支持一键创建包含根节点、并行工作节点、验证节点等的 Swarm 图结构(
hermes kanban swarm),实现任务的并行处理和结果验证。 - 精细化控制:允许为不同任务分配不同的模型(Model Overrides)、工作目录、计划开始时间以及重试策略,大幅提升任务完成率。
2. Vision-Action 循环:像人类一样操作电脑
结合 v0.14.0 引入的视觉能力,v0.16.0 进一步完善了“看-动”闭环:
- 屏幕阅读与操作:集成了
screen_reader(屏幕阅读器)和gui_control(GUI 控制)工具,Agent 能够 OCR 识别屏幕内容,并像人类一样点击、输入、滚动。 - 原生视觉模型支持:深度集成了 GPT-4o 和 Claude 3.5 Sonnet,确保视觉理解和决策的准确性。
- 自动化闭环:实现了“看懂屏幕(Vision) -> 决策(Reasoning) -> 操作(Action)”的完整闭环,让 Agent 能够独立操作电脑上的任何应用程序。
安全与凭证管理:告别明文 Key
1. Bitwarden Secrets Manager 集成
- 安全存储:不再需要在
.env文件中明文存储 API Key。现在支持直接对接 Bitwarden,使用一个引导令牌(Bootstrap Token)即可在启动时拉取所有凭证。 - 自动轮换:支持凭证的自动轮换,大幅提升了敏感信息的安全性。
2. Promptware 攻击防御
- 三重关卡:引入了针对 Brainworm-class 攻击的防御体系,在内存加载时、工具结果返回时增加扫描和标记,防止恶意提示词通过工具输出或记忆召回劫持 Agent。
性能与架构:极速启动与毫秒级搜索
1. 冷启动性能突破
- 代码重构:核心文件
run_agent.py的代码行数从 16,083 行锐减至 3,821 行(减少了 76%),代码被重构为 14 个内聚模块。 - 启动时间优化:通过延迟导入(Lazy Import)和热点路径优化,CLI 冷启动时间大幅缩短。
hermes --version的执行时间减少了 63%,Termux(安卓终端)冷启动时间从 2.9秒 降至 0.8秒。
2. 会话搜索 (session_search) 重写
- 速度提升 4500倍:新版本移除了辅助 LLM,改用原生搜索逻辑,搜索时间从约 30秒缩短至 20毫秒,且结果更准确,不再出现幻觉。
生态扩展:xAI 深度集成与 MCP 成熟
1. xAI (Grok) 深度集成套件
- 模型与搜索:新增对 xAI Web Search 插件的支持,以及 Grok 模型的 OAuth 代理。
- 生命周期管理:自动检测已弃用的模型(如 Grok-4),并提供一键迁移配置命令。
2. MCP (模型上下文协议) 生态成熟
- 官方 MCP 仓库:推出了经过 Nous 认证的 MCP 服务器目录,并带有交互式选择器。
- TLS 支持:MCP 客户端现在支持 mTLS(双向 TLS),增强了企业级安全性。
部署现代化:Docker 与容器化
- s6-overlay 监督:引入了 s6-overlay 作为容器内的服务监督工具,实现了更可靠的进程管理和容器重启协调。
- 镜像瘦身:移除了不必要的构建依赖(如
build-essential),优化了镜像大小。
Hermes Agent v0.16.0 核心更新速览
| 类别 | 关键更新 | 说明 |
|---|---|---|
| 核心能力 | Kanban Swarm | 支持自动拆解任务、多智能体并行处理和结果验证。 |
| 交互方式 | Vision-Action | 像人类一样看懂屏幕并操作 GUI,支持 GPT-Driving。 |
| 安全 | Bitwarden 集成 | 告别明文 Key,支持凭证自动轮换。 |
| 性能 | 毫秒级搜索 | session_search速度提升 4500倍,且零成本。 |
| 架构 | 代码重构 | 核心代码减少 76%,冷启动时间大幅缩短。 |
| 生态 | xAI 深度集成 | 支持 Grok 模型、Web Search 及 OAuth 代理。 |
Hermes Agent v0.16.0 是一个集大成的版本。它不仅继承了 v0.14.0 的视觉能力和 v0.15.0 的架构优化,还通过 Kanban Swarm 和 Bitwarden 集成,将 Hermes Agent 的能力推向了一个新的高度。无论是从安全性、性能还是自主性来看,这都是一个非常值得升级的版本。