AI Engineer World’s Fair 2026 第一天的主舞台,表面主题是 Software Factories。听完整天内容,我觉得更准确的说法是:AI 编程正在从单个工具,转向一套可验证、可编排、可复盘的工作系统。
原视频:https://www.youtube.com/watch?v=htM02KMNZnk
这一天不是模型发布会
这场直播很长,接近 9 小时。它不像普通产品发布会,只把观众带到一个结论:某个模型更强了,某个工具更快了。相反,几乎每个讲者都在回答同一个更麻烦的问题:模型已经能做事了,接下来怎么让它在真实组织里稳定做事。
Microsoft 的 Pablo Castro 先把 agent 的知识拆成三层:模型权重里的 intrinsic knowledge、组织系统里的 extrinsic knowledge、工作过程中沉淀出来的 learned knowledge。这个框架很重要,因为它把 “知识” 从 prompt 里拿出来,放回公司系统、检索系统和执行 trace 里。
OpenAI 的 Alexander Embiricos 和 Romain Huet 讲 Codex,重点也不是 autocomplete。他们讲的是 agent 可以使用电脑、运行代码、测试自己的工作,人的位置因此从内层执行,退到外层方向控制。Z.ai、MiniMax 和 Hugging Face 则补上另一条线:未来的软件工厂不会只依赖一个闭源模型,开放权重、模型路由和部署控制会变成基础设施。
中段的 Factory、Conductor、Warp、AgentCraft、Notion 都在讲编排。Tereza Tizkova 直接说 software factory 不是 coding agent,而是从任务进入到上线反馈的一整条生命周期。Charlie Holtz 用 “orchestra” 修正 “factory” 这个词,提醒大家 agent 系统更像多角色协作,不只是流水线。Zach Lloyd 把开源项目运营变成 agent loop,Sarah Sachs 则把模型选择权藏进 Notion 产品体验里。
后半段开始降温。Daksh Gupta 讲 100 万个 AI 生成 PR 的真实 review 数据,Vaibhav Gupta 讲如何用工具链治理 slop,Kyle Mistele 把 loop 拉回控制论,Dex Horthy 提醒大家 harness 不能解决所有训练层问题,Erik Meijer 直接把 agent 安全拉到 proof 和 taint analysis。
四条线串起来看
第一条线是知识。Pablo 的三分法告诉你,agent 不是只靠模型记忆工作。它要接组织资料、邮件、日历、数据仓库、公开网页,也要从过去执行过的任务里学习。这个判断和本地知识库里 “Agent = Model + Harness” 的笔记一致:模型只是智能来源,真正让智能有用的是周围那套系统。
第二条线是入口。Codex、Antigravity、Cursor 都在做同一件事:不要把 agent 困在聊天框里。模型要能读 repo、跑 terminal、看浏览器、开 worktree、记录状态、回报结果。工具入口变化后,人的工作也变化了。工程师不是每分钟盯着 token 滚动,而是写清目标、设置边界、看关键证据。
第三条线是编排。一个巨型 agent 拿到所有权限,不是自治,是失控。Tereza 的 software factory、Charlie 的 orchestra、Zach 的 open-source loop、Ido 的可视化 war room,讲的都是如何让多个 agent 和人一起工作。任务要分解,权限要分层,状态要可见,失败要能追。
第四条线是验证。当天最硬的结论其实在这里:生成不稀缺,验证稀缺。Daksh 的 PR 数据、Vaibhav 的 BAML 工具链、Kyle 的 control loop、Erik 的 proof,都在说同一件事。没有可自动拒绝坏结果的 gate,loop 只是模型在自我鼓励。
我会怎么用这一天
如果把这一天压成一句话,我会说:AI coding 的竞争点,已经从 “谁写得快” 变成 “谁能把生成放进可靠系统里”。
对个人开发者,这意味着不要只学 prompt。更值得沉淀的是项目 spec、常用 skill、测试命令、review checklist、可复用的验证脚本。对团队,这意味着不要把 AI 代码贡献率当唯一指标。accepted change、review 成本、线上回滚率、权限事故、长期维护性,才更接近真实收益。
我之前把这些短文写成了 300 字级别,这是错误的。那种长度只能做索引,不足以承载 20 分钟分享的材料密度。现在重写成长稿版,每篇都按一个讲者的主判断展开,保留材料细节,再加少量我的理解。
如果把第一天当成一张路线图
这一天最值得保存的,不是某个工具发布了什么功能,而是一张路线图:知识层、执行层、编排层、验证层、反馈层正在同时成熟。
知识层解决 agent 知道什么。Microsoft 讲 organizational knowledge,Notion 讲产品里的模型路由,Cursor 讲真实使用反馈进入训练。执行层解决 agent 怎么行动。Codex、Antigravity、Warp、OpenClaw 都在把 terminal、browser、repo、云沙箱、工作区变成 agent 可以操作的环境。编排层解决多个 agent 和人怎么协作。Factory、Conductor、AgentCraft 都在回答同一个问题:当任务不再是单线程聊天,状态应该怎么被看见。
验证层则更硬。Daksh 用一百万 PR 提醒大家,AI 代码不是天然可信;Kyle 说 loop 必须有 measurement;Erik 直接把证明放到执行前;Dex 则提醒,不要把所有失败都归因于 harness 不够好。最后的反馈层由 Cursor 收束:真实工作流产生的数据,可能反过来训练下一代模型。
所以,软件工厂不是一个产品名,而是一组工程能力的合流。谁只买一个 coding agent,谁只拿到其中一小块。谁把知识、执行、编排、验证、反馈连起来,谁才真正开始建工厂。
我会怎样落到自己的工作流
如果把这一天迁移到本地团队,我不会第一步就追求全自动。更现实的顺序是先做三件事。
第一,把项目知识变成 agent 能读的资产。README、架构图、测试命令、部署说明、常见坑、权限边界、负责人,这些比一个神奇 prompt 更有用。第二,把验证前置。每类任务都要有最小可运行测试、静态检查或人工验收点。没有 gate 的自动化,只会把错误放大。第三,把 agent 的过程留痕。谁发起任务、读了什么、改了什么、为什么停下、哪些测试过了,必须能回看。
做到这三件事后,再谈多 agent、模型路由、自动 PR、递归训练,才不会变成炫技。AI Engineer World’s Fair 2026 第一天的价值就在这里:它把热闹的工具市场,重新拉回了软件工程的基本功。
来源与说明
本文基于 AI Engineer World’s Fair 2026 Day 1 主舞台视频转录、官方日程信息,以及本地 AI engineering 知识库整理。文章不是逐字稿,而是按单场分享的主线、上下文和工程启发重写。






