近日,有开发者在技术社区反馈,在阿里云百炼平台使用 DeepSeek 模型进行 AI Agent 开发时,遇到了审核机制逻辑不一致的问题。该开发者在进行 Agent 容错测试时发现,平台对模型直接输出的敏感内容(如测试用的违禁词)审核较为宽松,往往能够正常生成显示。然而,当程序将这些包含敏感词的历史对话记录作为上下文重新输入模型,以维持多轮对话的连贯性时,却频繁触发严格的输入内容检测,导致对话中断。这种“输出松、输入紧”的审核不对称现象,暴露了平台在处理历史回填(Context Backfill)场景下的风控策略缺陷,不仅增加了开发者的调试难度,也可能导致实际部署的 Agent 在处理用户历史记录时出现意外的误拦截,影响应用的流畅性与稳定性。
事件分析
💡 核心观点:平台安全机制需区分“生成”与“回填”场景,否则历史记录误封将成为 AI Agent 连续性体验的隐形阻碍。
原文链接:Linux.do






