技术社区 Linux.do 近期出现关于 Anthropic Claude 模型表现的讨论。一位重度使用的 Claude Max 订阅用户指出,在高强度的编程实践中,近期模型表现出现显著波动。该用户特别提到,代号为 Opus 4.8 的模型在执行任务时,频繁出现工具返回结果被判定为“污染”或“损坏”的情况,同时也存在工具参数拼写错误等低级失误。更为严重的是,用户观察到模型陷入了“不执行-继续-开始执行”的逻辑死循环,导致自动化工作流无法正常推进。该用户还将此现象与 Codex(可能指代 OpenAI Codex 或相关代码生成功能)近期被锁定思考 token 的情况进行了类比,认为头部 AI 编程模型似乎普遍遭遇了性能瓶颈或“降智”危机。这一反馈揭示了 AI Agent 在实际落地过程中面临的严峻挑战:即便是最先进的大语言模型,在处理复杂的工具链调用和长上下文逻辑推理时,其稳定性仍难以满足生产环境的高标准要求。
事件分析
💡 核心观点:在 AI 编程从辅助对话向自主 Agent 进化的关键期,工具调用的“幻觉”与逻辑死循环成为阻碍其落地生产的最大隐患。
原文链接:Linux.do






