最近社区在传一个”自我蒸馏”的提示词,源头是 OpenAI Codex 团队成员 @VB。意思是让 Codex 回看你最近 30 天的执行记录,把里面反复出现的工作流打包成 Skill,把固定角色封成 Sub-agent,把周期性任务挂上 Automation。
灵姐说 AI 这期视频把这套玩法拆开做了实测,并在自己的 Codex 上升级了四轮。我看完之后觉得,这件事本身比提示词更值得讨论:Agent 的自我改进,关键变量是有没有真实的执行证据可以回看。提示词写得玄不玄反而是次要的。
原视频:https://www.youtube.com/watch?v=zMJG9s7T7L8
原版做了什么
@VB 的第一版提示词逻辑很短:
- 重复使用的工作流 → 生成一个 Skill
- 经常出现的固定角色 → 生成一个 Sub-agent
- 周期性的任务 → 挂成 Automation
- 偶发的,跳过
底层换一种说法:把 Codex 从”解一次性题的聪明助手”升格成”给执行者发牌的人”。一个是执行者,一个是 Agent 组织的设计者,完全两个维度。
V2 升级:从工作流到证据驱动
V1 发出后社区给了大量反馈,原作者当天就推了 V2。差距很明显。
V1 的话术是”把重复的工作变成可复用的能力”,听起来对,执行起来很容易跑成抽象口号——什么叫”重复”,标准谁来定?V2 直接给了四类证据入口:
- Sessions(会话历史)
- Memories(记忆)
- Chronicle(活动记录)
- 现有的 Skills / Custom agents / Automations
并加了一条克制原则:已经存在的 skill 或 agent 就不要重复建设。
这才是把”自我改进”落到地上。所谓自我改进,从来不是模型自己训练自己,而是 Agent 在执行过程中留下过程记录,下次回看时去识别重复模式,再打包成可复用资产。换 Karpathy 的话说,这是 Agent 给自己搭一个 evaluation harness。
灵姐做了什么
视频里灵姐对这套玩法做了四轮升级。最有意思的其实不是 V4 那份通用版提示词,反倒是她在 V2 加的 12 项改造。原文列得很碎,我看完归到三件事。
第一,从”找重复工作流”升级到”找能力断点”。 原版只看你做过什么,灵姐版还看你该做但没做成什么——Skill 该触发没触发、Sub-agent 配了但 worker 没跑起来、产物厚度过厚没人消化。这是质变:从复盘”做了什么”,到复盘”为什么不行”。
第二,强制扫描真实证据入口。 原版的证据入口列了但不够硬。灵姐版把它变成强约束——必须从 Sessions / Memories / Chronicle / 现有资产这四个地方找证据,没有证据的蒸馏一律不沉淀。
第三,加上评分循环和回执反哺。 蒸馏出来的 Skill 发布完不算结束,还要看后续命中率、看用户回执,挂不上钩的 Skill 反向触发更新。
底层一句话:原版是症状级蒸馏,灵姐升级到了系统级补丁。
我的判断:这是 Skill 五层模型的反向工程
我自己之前整理过一个 Skill 设计五层模型:Trigger(触发)、Contract(契约)、Boundary(边界)、Procedure(流程)、Verification(校验)。当时是从 Google ADK 的设计模式加自家 OpenClaw 的 Skill 开发实践里反推的——Skill 想做好,这五层得答全。
回头看 Codex 自我蒸馏,本质就是把这五层反向跑一遍:
| Skill 五层 | 自我蒸馏对应动作 |
|---|---|
| Trigger | 回看 Sessions,看什么场景反复出现 |
| Contract | 看输入输出格式是否稳定 |
| Boundary | 看是否反复出错在同一类边界 |
| Procedure | 把决策序列从执行记录里抽出来 |
| Verification | 评分循环 + 回执反哺 |
大部分人卡在第一层就停了。原版提示词只覆盖了 Trigger 和 Procedure 的一部分,灵姐 12 项升级补上了 Verification——这跟 Skill Gardener 体系里”评估集就是真实使用日志”是同一件事。
水位高低不取决于提示词写得多巧,取决于你的 Agent 平台留下了多少可复盘的执行证据。Codex 这边是 Sessions、Memories、Chronicle 三件套,Claude Code 那边是 transcripts、CLAUDE.md 和 skills 目录,Hermes 走的是 AGENTS.md + session_search。叫法不一样,三家正在收敛到同一个底盘。
风险:没有准入门禁的蒸馏会污染
这套玩法有一个我不太放心的地方:蒸馏出来的 Skill 没有验收,反而是新的不稳定源。
Skill 这玩意天生不稳定。今天好用明天就不行,context 一长判断就漂。如果让 Agent 自动蒸馏一批 Skill 直接挂上去,会出两类问题:
- Description 互相覆盖:触发逻辑打架,模型不知道叫哪个
- Boundary 失守:自动蒸馏看不到业务红线,把”绝对不能做”的事悄悄编进了 Procedure
我之前在团队里推过一个想法叫 Skill 准入治理:研发提交 Skill 必须带成果样本,系统自动扫描通过才能进 register。Codex 自我蒸馏要真上规模,前面必须挂一个类似的门——蒸馏只是生成候选,不直接合并到主干。
不然就是 AI 在帮你写一堆没经过验收的 prompt,这些 prompt 又去影响下一次执行,污染会复利。
一句话
自我蒸馏不是”找重复任务包装一下”,是让 Agent 在自己的执行历史里找补丁。关键变量是证据入口,提示词模板反倒次要;第二关是要有合并门禁,蒸馏的产物不能自动挂载。
通用版提示词原作者放在视频下方的共享文件里。我自己更倾向于把这套思路落进既有的 Skill 治理框架里跑,而不是直接搬提示词——下一步打算把灵姐 V2 那 12 项审计写成 Claude Code 的一个 skill,看看跑起来是什么样。
跑通了再写一篇。











AI周刊:大模型、智能体与产业动态追踪
程序员数学扫盲课
冲浪推荐:AI工具与技术精选导航
Claude Code 全体系指南:AI 编程智能体实战