近日,有开发者在技术社区 Linux.do 发帖反馈,在使用 DeepSeek 官方 API(api.deepseek.com)进行项目开发时,遇到了一个极具技术探讨价值的异常现象。当通过代码向模型提出“你是谁?”或“你是什么模型?”等基础身份验证问题时,DeepSeek 模型的回答表现出显著的不稳定性。在未修改代码和参数的情况下,多次调用 API 得到的回复呈现出随机漂移的状态:有时模型能正确表明自己是 DeepSeek,但更多时候它会错误地声称自己是 Anthropic 开发的 Claude,或是阿里巴巴推出的千问模型,仿佛在“开盲盒”。这一现象迅速引起了技术社区的关注。从技术原理推测,这种“模型幻觉”或“身份认知混乱”,很可能源于模型在训练阶段(尤其是微调或对齐阶段)使用了包含大量其他模型输出的合成数据。如果训练语料库中混杂了带有特定身份标识(如“I am Claude”指令响应)的数据,模型可能会在学习过程中将这些外部身份特征内化,导致在特定提示词触发下产生错误的自我归属。这不仅暴露了当前大模型在数据清洗和纯净度控制方面面临的严峻挑战,也反映了合成数据滥用可能带来的副作用。
事件分析
💡 核心观点:大模型的“身份迷失”折射出合成数据时代的隐忧,仅靠清洗海量语料已难以确保模型认知的纯粹性与一致性。
原文链接:Linux.do







AI周刊:大模型、智能体与产业动态追踪
程序员数学扫盲课
冲浪推荐:AI工具与技术精选导航
Claude Code 全体系指南:AI 编程智能体实战