Codex 在自己的执行历史里找补丁

最近社区在传一个”自我蒸馏”的提示词，源头是 OpenAI Codex 团队成员 @VB。意思是让 Codex 回看你最近 30 天的执行记录，把里面反复出现的工作流打包成 Skill，把固定角色封成 Sub-agent，把周期性任务挂上 Automation。

灵姐说 AI 这期视频把这套玩法拆开做了实测，并在自己的 Codex 上升级了四轮。我看完之后觉得，这件事本身比提示词更值得讨论：Agent 的自我改进，关键变量是有没有真实的执行证据可以回看。提示词写得玄不玄反而是次要的。

原视频：https://www.youtube.com/watch?v=zMJG9s7T7L8

原版做了什么

@VB 的第一版提示词逻辑很短：

重复使用的工作流 → 生成一个 Skill
经常出现的固定角色 → 生成一个 Sub-agent
周期性的任务 → 挂成 Automation
偶发的，跳过

底层换一种说法：把 Codex 从”解一次性题的聪明助手”升格成”给执行者发牌的人”。一个是执行者，一个是 Agent 组织的设计者，完全两个维度。

V2 升级：从工作流到证据驱动

V1 发出后社区给了大量反馈，原作者当天就推了 V2。差距很明显。

V1 的话术是”把重复的工作变成可复用的能力”，听起来对，执行起来很容易跑成抽象口号——什么叫”重复”，标准谁来定？V2 直接给了四类证据入口：

Sessions（会话历史）
Memories（记忆）
Chronicle（活动记录）
现有的 Skills / Custom agents / Automations

并加了一条克制原则：已经存在的 skill 或 agent 就不要重复建设。

这才是把”自我改进”落到地上。所谓自我改进，从来不是模型自己训练自己，而是 Agent 在执行过程中留下过程记录，下次回看时去识别重复模式，再打包成可复用资产。换 Karpathy 的话说，这是 Agent 给自己搭一个 evaluation harness。

灵姐做了什么

视频里灵姐对这套玩法做了四轮升级。最有意思的其实不是 V4 那份通用版提示词，反倒是她在 V2 加的 12 项改造。原文列得很碎，我看完归到三件事。

第一，从”找重复工作流”升级到”找能力断点”。 原版只看你做过什么，灵姐版还看你该做但没做成什么——Skill 该触发没触发、Sub-agent 配了但 worker 没跑起来、产物厚度过厚没人消化。这是质变：从复盘”做了什么”，到复盘”为什么不行”。

第二，强制扫描真实证据入口。 原版的证据入口列了但不够硬。灵姐版把它变成强约束——必须从 Sessions / Memories / Chronicle / 现有资产这四个地方找证据，没有证据的蒸馏一律不沉淀。

第三，加上评分循环和回执反哺。 蒸馏出来的 Skill 发布完不算结束，还要看后续命中率、看用户回执，挂不上钩的 Skill 反向触发更新。

底层一句话：原版是症状级蒸馏，灵姐升级到了系统级补丁。

我的判断：这是 Skill 五层模型的反向工程

我自己之前整理过一个 Skill 设计五层模型：Trigger（触发）、Contract（契约）、Boundary（边界）、Procedure（流程）、Verification（校验）。当时是从 Google ADK 的设计模式加自家 OpenClaw 的 Skill 开发实践里反推的——Skill 想做好，这五层得答全。

回头看 Codex 自我蒸馏，本质就是把这五层反向跑一遍：

Skill 五层	自我蒸馏对应动作
Trigger	回看 Sessions，看什么场景反复出现
Contract	看输入输出格式是否稳定
Boundary	看是否反复出错在同一类边界
Procedure	把决策序列从执行记录里抽出来
Verification	评分循环 + 回执反哺

大部分人卡在第一层就停了。原版提示词只覆盖了 Trigger 和 Procedure 的一部分，灵姐 12 项升级补上了 Verification——这跟 Skill Gardener 体系里”评估集就是真实使用日志”是同一件事。

水位高低不取决于提示词写得多巧，取决于你的 Agent 平台留下了多少可复盘的执行证据。Codex 这边是 Sessions、Memories、Chronicle 三件套，Claude Code 那边是 transcripts、CLAUDE.md 和 skills 目录，Hermes 走的是 AGENTS.md + session_search。叫法不一样，三家正在收敛到同一个底盘。

风险：没有准入门禁的蒸馏会污染

这套玩法有一个我不太放心的地方：蒸馏出来的 Skill 没有验收，反而是新的不稳定源。

Skill 这玩意天生不稳定。今天好用明天就不行，context 一长判断就漂。如果让 Agent 自动蒸馏一批 Skill 直接挂上去，会出两类问题：

Description 互相覆盖：触发逻辑打架，模型不知道叫哪个
Boundary 失守：自动蒸馏看不到业务红线，把”绝对不能做”的事悄悄编进了 Procedure

我之前在团队里推过一个想法叫 Skill 准入治理：研发提交 Skill 必须带成果样本，系统自动扫描通过才能进 register。Codex 自我蒸馏要真上规模，前面必须挂一个类似的门——蒸馏只是生成候选，不直接合并到主干。

不然就是 AI 在帮你写一堆没经过验收的 prompt，这些 prompt 又去影响下一次执行，污染会复利。

一句话

自我蒸馏不是”找重复任务包装一下”，是让 Agent 在自己的执行历史里找补丁。关键变量是证据入口，提示词模板反倒次要；第二关是要有合并门禁，蒸馏的产物不能自动挂载。

通用版提示词原作者放在视频下方的共享文件里。我自己更倾向于把这套思路落进既有的 Skill 治理框架里跑，而不是直接搬提示词——下一步打算把灵姐 V2 那 12 项审计写成 Claude Code 的一个 skill，看看跑起来是什么样。

跑通了再写一篇。

Codex 在自己的执行历史里找补丁

原版做了什么

V2 升级：从工作流到证据驱动

灵姐做了什么

我的判断：这是 Skill 五层模型的反向工程

风险：没有准入门禁的蒸馏会污染

一句话

相关推荐

GLM Claude Code · 国产平替不封号

官方 Claude Code 又涨价又要 KYC,封号还得重配环境?智谱 GLM 兼容 Claude Code,稳定不封号、价格友好,注册后把现有 Claude Code 工作流直接切过来继续用。