最新消息: 找到一个合适的灵魂(SOUL)和相处方式(AGENTS)是开启AI私人助理的第一步。

Hermes Agent v0.16.0(v2026.6.5)的发布说明

12 浏览 0 条评论 Hermes 更新

Hermes Agent v0.16.0(代号“The Autonomy Release”)已于 2026年6月5日 正式发布。这是 Hermes Agent 向真正“自主智能体”迈进的关键版本,核心在于通过​多智能体编排(Kanban Swarm)视觉交互(Vision-Action)​,让 Agent 能够独立完成复杂任务并像人类一样操作电脑。

核心自主性:多智能体编排与视觉交互

1. Kanban Swarm:多智能体编排系统

这是 v0.16.0 最核心的功能,旨在解决单个 Agent 处理复杂任务时的局限性:

  • 自动拆解任务​:通过 /triage 命令,系统会自动将一个复杂任务拆解为树状的子任务(Decomposition)。
  • 智能体拓扑​:支持一键创建包含根节点、并行工作节点、验证节点等的 Swarm 图结构(hermes kanban swarm),实现任务的并行处理和结果验证。
  • 精细化控制​:允许为不同任务分配不同的模型(Model Overrides)、工作目录、计划开始时间以及重试策略,大幅提升任务完成率。

2. Vision-Action 循环:像人类一样操作电脑

结合 v0.14.0 引入的视觉能力,v0.16.0 进一步完善了“看-动”闭环:

  • 屏幕阅读与操作​:集成了 screen_reader(屏幕阅读器)和 gui_control(GUI 控制)工具,Agent 能够 OCR 识别屏幕内容,并像人类一样点击、输入、滚动。
  • 原生视觉模型支持​:深度集成了 GPT-4o 和 ​Claude 3.5 Sonnet​,确保视觉理解和决策的准确性。
  • 自动化闭环​:实现了“看懂屏幕(Vision) -> 决策(Reasoning) -> 操作(Action)”的完整闭环,让 Agent 能够独立操作电脑上的任何应用程序。

安全与凭证管理:告别明文 Key

1. Bitwarden Secrets Manager 集成

  • 安全存储​:不再需要在 .env 文件中明文存储 API Key。现在支持直接对接 Bitwarden,使用一个引导令牌(Bootstrap Token)即可在启动时拉取所有凭证。
  • 自动轮换​:支持凭证的自动轮换,大幅提升了敏感信息的安全性。

2. Promptware 攻击防御

  • 三重关卡​:引入了针对 Brainworm-class 攻击的防御体系,在内存加载时、工具结果返回时增加扫描和标记,防止恶意提示词通过工具输出或记忆召回劫持 Agent。

性能与架构:极速启动与毫秒级搜索

1. 冷启动性能突破

  • 代码重构​:核心文件 run_agent.py 的代码行数从 16,083 行锐减至 3,821 行(减少了 76%),代码被重构为 14 个内聚模块。
  • 启动时间优化​:通过延迟导入(Lazy Import)和热点路径优化,CLI 冷启动时间大幅缩短。hermes --version 的执行时间减少了 63%,Termux(安卓终端)冷启动时间从 2.9秒 降至 0.8秒。

2. 会话搜索 (session_search) 重写

  • 速度提升 4500倍​:新版本移除了辅助 LLM,改用原生搜索逻辑,搜索时间从约 30秒缩短至 20毫秒,且结果更准确,不再出现幻觉。

生态扩展:xAI 深度集成与 MCP 成熟

1. xAI (Grok) 深度集成套件

  • 模型与搜索​:新增对 xAI Web Search 插件的支持,以及 Grok 模型的 OAuth 代理。
  • 生命周期管理​:自动检测已弃用的模型(如 Grok-4),并提供一键迁移配置命令。

2. MCP (模型上下文协议) 生态成熟

  • 官方 MCP 仓库​:推出了经过 Nous 认证的 MCP 服务器目录,并带有交互式选择器。
  • TLS 支持​:MCP 客户端现在支持 mTLS(双向 TLS),增强了企业级安全性。

部署现代化:Docker 与容器化

  • s6-overlay 监督​:引入了 s6-overlay 作为容器内的服务监督工具,实现了更可靠的进程管理和容器重启协调。
  • 镜像瘦身​:移除了不必要的构建依赖(如 build-essential),优化了镜像大小。

Hermes Agent v0.16.0 核心更新速览

类别 关键更新 说明
核心能力 Kanban Swarm 支持自动拆解任务、多智能体并行处理和结果验证。
交互方式 Vision-Action 像人类一样看懂屏幕并操作 GUI,支持 GPT-Driving。
安全 Bitwarden 集成 告别明文 Key,支持凭证自动轮换。
性能 毫秒级搜索 session_search速度提升 4500倍,且零成本。
架构 代码重构 核心代码减少 76%,冷启动时间大幅缩短。
生态 xAI 深度集成 支持 Grok 模型、Web Search 及 OAuth 代理。

Hermes Agent v0.16.0 是一个​集大成的版本​。它不仅继承了 v0.14.0 的视觉能力和 v0.15.0 的架构优化,还通过 Kanban Swarm 和 Bitwarden 集成,将 Hermes Agent 的能力推向了一个新的高度。无论是从安全性、性能还是自主性来看,这都是一个非常值得升级的版本。