Claude Code 合租
AI编程 · 架构思考 · 技术人生
DigitalOcean 开发者云

Codex 在自己的执行历史里找补丁

GLM Claude Code 国产平替

最近社区在传一个”自我蒸馏”的提示词,源头是 OpenAI Codex 团队成员 @VB。意思是让 Codex 回看你最近 30 天的执行记录,把里面反复出现的工作流打包成 Skill,把固定角色封成 Sub-agent,把周期性任务挂上 Automation。

灵姐说 AI 这期视频把这套玩法拆开做了实测,并在自己的 Codex 上升级了四轮。我看完之后觉得,这件事本身比提示词更值得讨论:Agent 的自我改进,关键变量是有没有真实的执行证据可以回看。提示词写得玄不玄反而是次要的。

阿里云 全线产品特惠

原视频:https://www.youtube.com/watch?v=zMJG9s7T7L8

原版做了什么

@VB 的第一版提示词逻辑很短:

  • 重复使用的工作流 → 生成一个 Skill
  • 经常出现的固定角色 → 生成一个 Sub-agent
  • 周期性的任务 → 挂成 Automation
  • 偶发的,跳过

底层换一种说法:把 Codex 从”解一次性题的聪明助手”升格成”给执行者发牌的人”。一个是执行者,一个是 Agent 组织的设计者,完全两个维度。

V2 升级:从工作流到证据驱动

V1 发出后社区给了大量反馈,原作者当天就推了 V2。差距很明显。

V1 的话术是”把重复的工作变成可复用的能力”,听起来对,执行起来很容易跑成抽象口号——什么叫”重复”,标准谁来定?V2 直接给了四类证据入口:

  • Sessions(会话历史)
  • Memories(记忆)
  • Chronicle(活动记录)
  • 现有的 Skills / Custom agents / Automations

并加了一条克制原则:已经存在的 skill 或 agent 就不要重复建设。

这才是把”自我改进”落到地上。所谓自我改进,从来不是模型自己训练自己,而是 Agent 在执行过程中留下过程记录,下次回看时去识别重复模式,再打包成可复用资产。换 Karpathy 的话说,这是 Agent 给自己搭一个 evaluation harness。

灵姐做了什么

视频里灵姐对这套玩法做了四轮升级。最有意思的其实不是 V4 那份通用版提示词,反倒是她在 V2 加的 12 项改造。原文列得很碎,我看完归到三件事。

第一,从”找重复工作流”升级到”找能力断点”。 原版只看你做过什么,灵姐版还看你该做但没做成什么——Skill 该触发没触发、Sub-agent 配了但 worker 没跑起来、产物厚度过厚没人消化。这是质变:从复盘”做了什么”,到复盘”为什么不行”。

第二,强制扫描真实证据入口。 原版的证据入口列了但不够硬。灵姐版把它变成强约束——必须从 Sessions / Memories / Chronicle / 现有资产这四个地方找证据,没有证据的蒸馏一律不沉淀。

第三,加上评分循环和回执反哺。 蒸馏出来的 Skill 发布完不算结束,还要看后续命中率、看用户回执,挂不上钩的 Skill 反向触发更新。

底层一句话:原版是症状级蒸馏,灵姐升级到了系统级补丁。

我的判断:这是 Skill 五层模型的反向工程

我自己之前整理过一个 Skill 设计五层模型:Trigger(触发)、Contract(契约)、Boundary(边界)、Procedure(流程)、Verification(校验)。当时是从 Google ADK 的设计模式加自家 OpenClaw 的 Skill 开发实践里反推的——Skill 想做好,这五层得答全。

回头看 Codex 自我蒸馏,本质就是把这五层反向跑一遍:

Skill 五层 自我蒸馏对应动作
Trigger 回看 Sessions,看什么场景反复出现
Contract 看输入输出格式是否稳定
Boundary 看是否反复出错在同一类边界
Procedure 把决策序列从执行记录里抽出来
Verification 评分循环 + 回执反哺

大部分人卡在第一层就停了。原版提示词只覆盖了 Trigger 和 Procedure 的一部分,灵姐 12 项升级补上了 Verification——这跟 Skill Gardener 体系里”评估集就是真实使用日志”是同一件事。

水位高低不取决于提示词写得多巧,取决于你的 Agent 平台留下了多少可复盘的执行证据。Codex 这边是 Sessions、Memories、Chronicle 三件套,Claude Code 那边是 transcripts、CLAUDE.md 和 skills 目录,Hermes 走的是 AGENTS.md + session_search。叫法不一样,三家正在收敛到同一个底盘。

风险:没有准入门禁的蒸馏会污染

这套玩法有一个我不太放心的地方:蒸馏出来的 Skill 没有验收,反而是新的不稳定源。

Skill 这玩意天生不稳定。今天好用明天就不行,context 一长判断就漂。如果让 Agent 自动蒸馏一批 Skill 直接挂上去,会出两类问题:

  • Description 互相覆盖:触发逻辑打架,模型不知道叫哪个
  • Boundary 失守:自动蒸馏看不到业务红线,把”绝对不能做”的事悄悄编进了 Procedure

我之前在团队里推过一个想法叫 Skill 准入治理:研发提交 Skill 必须带成果样本,系统自动扫描通过才能进 register。Codex 自我蒸馏要真上规模,前面必须挂一个类似的门——蒸馏只是生成候选,不直接合并到主干。

不然就是 AI 在帮你写一堆没经过验收的 prompt,这些 prompt 又去影响下一次执行,污染会复利。

一句话

自我蒸馏不是”找重复任务包装一下”,是让 Agent 在自己的执行历史里找补丁。关键变量是证据入口,提示词模板反倒次要;第二关是要有合并门禁,蒸馏的产物不能自动挂载。

通用版提示词原作者放在视频下方的共享文件里。我自己更倾向于把这套思路落进既有的 Skill 治理框架里跑,而不是直接搬提示词——下一步打算把灵姐 V2 那 12 项审计写成 Claude Code 的一个 skill,看看跑起来是什么样。

跑通了再写一篇。

Claude Code 合租
赞(0)
未经允许不得转载:Toy's Tech Notes » Codex 在自己的执行历史里找补丁
ReClaude Claude Code 合租
阿里云函数计算 一键部署 AI 大模型

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC,封号还得自己重新折腾?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。

上车 4 人车 400/月查看四档套餐