OpenClaw 2026.4.23 版本的更新主要集中在图像生成能力的增强、多模态交互的修复以及系统安全性的全面加固。该版本通过 OAuth 集成解决了 OpenAI 图像模型的认证痛点,并修复了大量涉及 Telegram、WhatsApp 和 Slack 的显示与逻辑问题。
以下是该版本的核心更新内容整理:
核心功能:图像与多模态增强
1. OpenAI 图像生成免密支持
- OAuth 集成:Providers/OpenAI 模块新增通过 Codex OAuth 进行图像生成和参考图编辑的功能。这意味着
openai/gpt-image-2现在可以在没有OPENAI_API_KEY的情况下工作,直接通过 Codex 认证路由。 - 参考图修复:将参考图编辑改为受保护的 Multipart 上传,而非 JSON Data URLs,恢复了复杂多参考图编辑的功能。
2. OpenRouter 与工具扩展
- OpenRouter 支持:新增
image_generate接口支持,使 OpenRouter 的图像模型能配合OPENROUTER_API_KEY使用。 - 参数控制:允许 Agent 请求特定的图像质量(Quality)和输出格式(Format)提示,并传递 OpenAI 特有的背景、审核、压缩等参数。
- 超时设置:为图像、视频、音乐和 TTS 生成工具增加了可选的
timeoutMs支持,允许 Agent 根据需要延长特定生成任务的超时时间。
3. Agent 与记忆系统
- 上下文继承:Agent 的子进程(Subagents)现在支持可选的分叉上下文(Forked Context),允许子进程在需要时继承请求者的对话记录,同时默认保持隔离。
- 本地嵌入配置:增加了
memorySearch.local.contextSize配置项(默认 4096),允许在受限主机上调整本地嵌入的上下文大小。
关键修复:平台兼容性与体验
1. 平台特定修复
- Telegram:修复了 Markdown 图片语法解析问题,确保群组聊天中模型输出的
能正确渲染为媒体,而非纯文本 URL。 - WhatsApp:统一了直接发送和自动回复的媒体规范化流程;修复了首次运行设置加载时机,避免依赖路径问题。
- Slack:将 MPIM 群组 DM 分类为群组聊天上下文,并在非 DM 界面(如频道)中抑制工具/计划进度的冗余输出,防止内部“工作中...”痕迹泄露。
- WebChat:修复了非重试性提供方错误(如计费、授权、限流)的显示问题,现在会直接在界面上渲染错误,而非仅记录日志。
2. 流式与回放修复
- 流式阻断:修复了块传输中止后的文本重复问题,当已发送的文本块完全覆盖最终回复时,系统会抑制最终组装文本,防止重复回复。
- 工具回放:修复了 OpenAI/Codex 对话回放时合成缺失工具结果的问题(保留 Anthropic/Gemini 的修复逻辑)。
安全加固:全面防御升级
1. 认证与权限
- 通用安全:网关拒绝非 HTTP(S) 的入站附件 URL,防止 SSRF 攻击;日志中对上下文引擎组装失败进行脱敏处理。
- 移动端安全:Android 强制要求 Loopback-only 的明文网关连接,非 TLS 环境下私有 LAN 和 link-local 端点默认失败关闭;配对连接也要求私有 IP 或回环地址。
- 权限控制:
- Teams:要求共享 Bot Framework Token 必须包含经过验证的
appid或azp。 - Discord:原生 Slash Command 通道策略不再绕过所有者/成员限制。
- Approvals:明确要求显式启用聊天执行批准,不再自动根据配置启用。
- Teams:要求共享 Bot Framework Token 必须包含经过验证的
2. 插件与本地环境
- 插件安全:阻止 Setup-API 查找回退到启动目录,防止工作区本地文件被执行;修复了 Windows 下 Secrets 的 BOM 处理和 ACL 检查。
- MCP 工具:ACPX OpenClaw 工具桥接器不再列出或调用仅限所有者的工具(如
cron),防止权限提升。 - 隐私保护:WhatsApp 联系人/位置结构化数据不再混入内联消息体,而是通过围栏元数据 JSON 渲染,限制隐藏 Prompt 注入。
其他改进
- 依赖更新:捆绑的 Pi 包更新至
0.70.0,使用上游gpt-5.5目录元数据。 - 调试日志:为嵌入式 Harness 增加了结构化调试日志,解释自动选择和 Pi 回退原因。
- Dreaming 机制:将管理梦境任务与心跳分离,作为独立轻量级 Agent 运行,即使禁用心跳也能继续执行。
该版本通过 OAuth 解决了 OpenAI 图像模型的配置痛点,并在安全层面进行了大量“Fail-Closed”(默认拒绝)的策略调整,显著提升了私有化部署的稳定性和安全性。