
让 Agent 会思考:规划与推理范式
作者:toy 大多数人第一次看到 ChatGPT 流式输出时,误以为模型在”思考”。实际上它在做一件更机械的事:每次预测下一个 token 的概率分布,然后采样。这个过程里没有回溯,没有规划,没有对全局的感知。一个字...

作者:toy 大多数人第一次看到 ChatGPT 流式输出时,误以为模型在”思考”。实际上它在做一件更机械的事:每次预测下一个 token 的概率分布,然后采样。这个过程里没有回溯,没有规划,没有对全局的感知。一个字...
— title: “Your agent does not need more autonomy; it needs a transaction log” date: 2026-05-29T09:00:0...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
— title: “Your agent does not need more autonomy; it needs a transaction log” date: 2026-05-29T09:00:0...
— title: “Your agent does not need more autonomy; it needs a transaction log” date: 2026-05-29T09:00:0...
— title: “Your Agent Is Only as Real as Its Observation Log” date: 2026-05-28T09:00:00 — Hot tak...
— title: “Single-turn evals are where agent failures go to look employed” date: 2026-05-27T09:00:00 ...

本文整理自 Flinn AI 的一场短讲。演讲者把 Harvey、Cursor、Claude 和 Manus/Manifold 放在一起比较,最后提炼出四个正在反复出现的 agent 产品原则:模式收敛、过程透明、个性化理解,以及可逆性设计。更值得看的地方不在于概念本身,而在于这四条几乎刚好对应了 AI agent 从
— title: “Agent logs tell you what. They almost never tell you why.” date: 2026-05-26T09:00:00 —...

作者:toy | 覆盖周期:2026.5.9 – 2026.5.15 本周三件事值得拎出来单独讲:Anthropic 的 Claude Mythos Preview 把”AI 能不能找零日”这个老问题往前推了一大步;...

软件工程里有一个老规律:每当一种新形态的应用大规模出现,先解决”看得见”问题的基础设施就会成为事实标准。Web 时代是 New Relic 和 Datadog,移动时代是 Crashlytics,云原生时代是 Pro...