这次 OpenClaw v2026.4.5 的升级非常重磅,主要集中在多媒体能力扩展(视频/音乐生成)、多语言支持、记忆系统的深度重构以及各大平台(Telegram/Discord等)的体验修复。
为了让你更直观地了解这次更新的亮点,我为你整理了以下核心内容:
核心新增功能
这次版本最大的变化是引入了原生的视频与音乐生成能力,并大幅扩展了模型支持:
| 功能模块 | 具体更新内容 |
|---|---|
| 视频生成 | 新增内置video_generate工具,支持 xAI (grok-imagine-video)、阿里万相、Runway 等模型。 |
| 音乐生成 | 新增内置music_generate工具,支持 Google Lyria、MiniMax,并集成了 ComfyUI 工作流。 |
| 多语言 UI | 控制面板(Control UI)新增了简体中文、繁体中文、日语、韩语等 12 种语言支持。 |
| 本地工作流 | 集成了 ComfyUI 插件,支持本地图像、视频和音乐生成工作流。 |
记忆系统(Memory)重大重构
本次更新对“做梦(Dreaming)”机制进行了彻底重写,使其更加智能和后台化:
- 三阶段模型:将梦境重构为 Light(浅层)、Deep(深层) 和 REM(快速眼动) 三个协同阶段,支持独立调度。
- 后台运行:耐久记忆提升(Durable memory promotion)现在可以在后台运行,无需复杂的手动设置。
- 交互优化:新增了梦境日记(Dream Diary)界面,权重调节和日志记录更加清晰。
平台与渠道修复
针对主流通讯平台的痛点进行了大量修复,特别是 Telegram 和 Discord:
- Telegram:
- 修复了群组回复消失的问题。
- 修复了语音消息转录,不再显示为原始占位符。
- 优化了
/model命令的确认格式。
- Discord:
- 修复了图片回复指向丢失文件的问题。
- 增加了对大型附件(100MB)的支持。
- 修复了回复线程断裂的问题。
- Matrix: 新增了原生的执行审批(Exec Approval)提示功能。
配置与架构调整 (Breaking Changes)
注意:这部分涉及配置变更,升级时需特别留意。
- 配置项移除:删除了大量旧的公共配置别名(Legacy Public Config Aliases),例如:
talk.voiceId/talk.apiKeyagents.*.sandbox.perSessionbrowser.ssrfPolicy.allowPrivateNetwork- 以及 channel/group/room 相关的
allow开关。
- 新路径:建议使用规范的公共路径(Canonical Public Paths)和
enabled字段。 - 兼容性:虽然加载时保留兼容性,但建议使用
openclaw doctor --fix进行迁移。
其他重要改进
- 模型扩展:捆绑了 Qwen、Fireworks AI、StepFun 等新提供商;Amazon Bedrock 现在支持 Mantle 和推理配置文件发现。
- 缓存优化:改进了提示词缓存(Prompt Caching),通过规范化空白符和工具定义,提高了缓存命中率。
- 工具提示修复:移除了代理系统提示中的重复工具清单,防止工具指导过时。
建议:如果你使用了被移除的旧配置项,请务必在升级后运行 openclaw doctor --fix 来自动修复配置文件。