启用 Self-Improving Agent 技能:让 AI 助手从错误中持续学习
1. 引言
手把手实践如何启用 Self-Improving Agent 技能,让 AI 助手在每次对话中自动识别错误、记录纠正、积累新经验,实现越用越聪明。
2. 问题
AI 助手犯过的错、用户纠正过的操作、发现的新技巧,如果不在对话结束前被记录,下一次新会话就全部清零。这导致:
- 同一个错误可能重复出现
- 用户的纠正不会累积为系统经验
- 新发现的技巧无法被后续任务复用
核心痛点:没有持久化的「错误-纠正-经验」闭环。
3. 排查路径
尝试 1:把经验写在对话里
- 思路:在对话中手动提醒「上次这个命令失败了」
- 问题:跨会话失效,每次新会话都是白纸
- 结论:不可持续
尝试 2:使用 Self-Improving Agent 技能
- 在 AGENTS.md 写入行为准则:对话中自动识别错误、纠正、新经验
- 后台运行规则定义:
- 命令/操作失败 → 记录到
.learnings/ERRORS.md - 用户纠正(“不对”、“应该是”) → 记录到
.learnings/LEARNINGS.md(类别:correction) - 用户提出缺失功能 → 记录到
.learnings/FEATURE_REQUESTS.md - 外部 API 失败 → 记录到 ERRORS.md
- 发现更好做法 → 记录到 LEARNINGS.md(类别:best_practice)
- 命令/操作失败 → 记录到
- 升级规则:同一错误短期重复出现才提升优先级
- 提升规则:适用于多场景的经验 → 提升到 AGENTS.md 或 TOOLS.md
验证结果: 运行后生成三个文件,当前状态:8 条 learnings、4 条 errors、0 条 feature requests。
4. 核心原理
Self-Improving Agent 的核心是 持续学习循环(Continuous Learning Loop):
对话发生 → 自动识别 → 分类记录 → 定期回顾 → 提升规范
↑ |
└────────── 下次对话受益 ←────────────┘
关键设计决策:
- 后台运行:不干扰对话流畅性,记录在静默中完成
- 分类存储:errors / learnings / feature_requests 分文件管理,便于检索
- 频率控制:避免噪音堆积,同一错误短期重复才升级
- 提升机制:从「点」的经验上升到「面」的规则,写入行为准则
5. 最终方案
- 安装技能:Self-Improving Agent 技能
- 配置行为准则(AGENTS.md 新增):
## 🔄 Self-Improving Agent 技能 — 自动行为准则
self-improving-agent 技能已启用。在对话过程中,无需用户要求,
自动从对话中识别错误、纠正和新经验,写入 .learnings/ 文件。
- 三个输出文件:
.learnings/LEARNINGS.md— 经验和最佳实践.learnings/ERRORS.md— 错误和失败记录.learnings/FEATURE_REQUESTS.md— 功能缺失请求
6. 可迁移经验
- 错误是资产:每次失败和纠正都是系统的训练数据,关键是要被正确记录下来
- 分级处理:普通错误只记录,重复出现的错误才升级——避免过度响应孤例
- 从点到面:单个经验的价值有限,但当它出现在多个场景中时,应该提炼为通用规则
- 不干扰体验:后台自动运行,用户感知不到学习过程,但每次对话都更聪明
通用模式:任何需要「越用越熟练」的自动化系统,都应该内置 self-improving 循环。关键不是不犯错,而是犯错后能被记录、分类、升级。