Lee Robinson 的 “Recursive Model Improvement” 把话题带回模型训练。他讲 Cursor 如何用产品里的真实 agent 使用数据,反过来训练更适合工作流的模型。
原视频:https://www.youtube.com/watch?v=htM02KMNZnk
Cursor 不只是调用模型
很多 AI IDE 的早期形态,是在产品里调用一个通用模型。模型来自外部供应商,IDE 提供界面、上下文和工具。Cursor 现在想做更深一层:把产品里的真实使用反馈,变成模型训练的一部分。
Lee 提到,Cursor 过去一年开始大规模训练模型。Composer 2.5 在 5 月发布后,团队看到它在公开 eval 上表现不错,但更重要的是实际使用里的行为变化。
Cursor 的优势在于,它本身就是 agent 工作环境。用户在 IDE 里发任务、接受或拒绝改动、运行结果、修正反馈,这些都能形成训练信号。模型不只在公开数据上学代码,也在真实工作流里学什么行为有用。
outer loop 和 inner loop
他把改进分成 outer loop 和 inner loop。Outer loop 是产品和用户工作流:用户提出目标,agent 改代码,系统收集反馈,团队观察哪些行为有用。Inner loop 是模型训练:用这些信号改进模型,让下一版更适合真实工作。
这和 Pablo Castro 的 learned knowledge 呼应。组织和产品每天产生的 trace,不只是日志,而是下一代系统的训练材料。不同的是,Pablo 从企业知识系统讲,Lee 从模型训练讲。
Cursor 的路线说明一个趋势:最强的 AI 开发工具,不只是把外部模型接进来,而是拥有一套从使用过程到模型改进的闭环。
数据质量决定模型质量
这里有一个容易被忽略的问题:不是所有使用数据都值得训练。用户接受一个 diff,不一定代表它最好。用户拒绝一个结果,也可能只是需求没说清。测试通过不等于代码可维护,review 通过也不等于长期没问题。
所以 recursive model improvement 的难点,不是 “收集更多数据”。真正难的是把反馈分层:哪些是明确成功,哪些是噪音,哪些是短期可用但长期有债,哪些行为应该被模型学会,哪些应该被模型忘掉。
这和 software factory 的验证问题是同一件事。没有好 gate,训练信号也会脏。一个产品如果能把任务、上下文、diff、测试、review、用户反馈串起来,就有机会得到比公开 benchmark 更真实的数据。
我会把 Lee 这场看成第一天的收束:agent 工具不只是用模型,也会反过来塑造模型。谁拥有真实工作流和高质量反馈,谁就更可能训练出适合软件工厂的下一代模型。
Cursor 的护城河在真实工作流
Lee Robinson 这场把第一天带回模型训练。Cursor 不只是一个 IDE,也不只是调用外部模型的壳。它每天都在真实开发场景里观察用户如何给任务、如何接受改动、如何拒绝结果、如何继续追问。
这些数据和公开 benchmark 不一样。benchmark 测的是固定题目,真实工作流测的是混乱世界:半截需求、旧代码约束、本地测试、用户偏好、项目风格、review 反馈。能从这些信号里训练模型,是 Cursor 这类产品的长期优势。
这也解释了为什么 AI 开发工具会越来越像模型公司。谁掌握高质量使用数据,谁就能改进底层模型,而不只是换供应商。
recursive improvement 需要很强的数据治理
递归改进听起来漂亮,但风险也明显。如果训练信号脏,模型会学到错误行为。用户接受 diff 可能只是懒得改,测试通过可能只是测试不够,review 通过可能只是 reviewer 疲劳。把这些直接当正样本,会污染模型。
所以 Cursor 需要做的不只是收集数据,而是筛选和标注信号。哪些反馈代表真正成功?哪些任务有明确验收?哪些改动后来被 revert?哪些输出短期可用但长期有技术债?这些判断决定模型会向哪里进化。
第一日的闭环在这里收束
从 Pablo 的 learned knowledge 到 Lee 的 recursive model improvement,第一天形成了一个完整闭环:agent 做真实工作,系统记录过程,人和工具给出反馈,反馈进入产品和模型,下一轮 agent 更适合真实工作。
这也是 software factory 和传统工具链最大的差别。传统工具链不会因为你用它而自动变聪明;AI 工具链会。如果这种学习建立在高质量反馈上,它会变成巨大优势;如果建立在噪声上,它也会把坏习惯固化进模型。
所以,Cursor 这场不是简单的“我们也训练模型”。它指出了下一阶段竞争:谁能把真实开发过程变成高质量训练循环。
来源与说明
本文基于 AI Engineer World’s Fair 2026 Day 1 主舞台视频转录、官方日程信息,以及本地 AI engineering 知识库整理。文章不是逐字稿,而是按单场分享的主线、上下文和工程启发重写。






