一名资深开发者反馈,近期在体验大模型编程辅助服务时,DeepSeek 模型的表现出现了显著的性能波动。据其详细记录,在 6 月 1 日的实测中,DeepSeek 展现出了极高的性价比和推理速度,在处理复杂编码任务时表现出色,一度被认为可以替代价格昂贵的 Claude Opus 模型。然而,从 6 月 4 日开始,该模型在多轮对话中的表现出现断崖式下跌。核心问题集中在“指令遵循”能力的退化:模型开始频繁忽略用户的明确指令,生成的代码逻辑与需求背道而驰,即便在开发者反复纠正和细化提示词的情况下,依然无法按照预期逻辑实现功能。这种“反向执行”的现象并非偶发的推理幻觉,而是系统性的对齐失效。尽管响应速度尚可,但核心逻辑准确性的缺失使得该模型在当前状态下已无法胜任严肃的开发工作。该事件揭示了部分开源或低成本模型在长期服务一致性和精细指令控制力方面与顶尖闭源模型仍存在的差距。
事件分析
💡 核心观点:在AI编程赛道,性价比只是入场券,指令遵循的确定性才是开发者信任的基石。
原文链接:Linux.do







AI周刊:大模型、智能体与产业动态追踪
程序员数学扫盲课
冲浪推荐:AI工具与技术精选导航
Claude Code 全体系指南:AI 编程智能体实战