一位开发者在使用 Anthropic 旗下的 Claude Code 进行开发工作时遭遇了严重的模型幻觉现象。据该开发者描述,在正常的工作流中,随着对话上下文的增加,模型并未维持连贯的逻辑,而是开始出现自问自答的行为,并输出了与当前指令完全不相关的荒谬内容。此次测试使用的是官方 Max 订阅服务,理论上支持 1M token 的上下文窗口,但在实际运行中,当上下文长度达到约 365K token 时,系统似乎触发了自动压缩机制。开发者推测,正是这种为了维持运行而进行的上下文压缩,导致了关键信息的丢失,进而引发了严重的幻觉。该事件不仅暴露了当前超长上下文大模型在实际工程应用中的稳定性隐患,也引发了关于 AI 编程工具在处理大规模代码库时有效性的讨论。
事件分析
💡 核心观点:所谓“超长上下文”在实际落地中仍面临有效性与稳定性的巨大挑战,优化无损压缩能力是提升AI编程工具上限的关键。
原文链接:Linux.do







AI周刊:大模型、智能体与产业动态追踪
程序员数学扫盲课
冲浪推荐:AI工具与技术精选导航