美国政府依据出口管制权限,突然向 Anthropic 下达指令,要求立即暂停任何外籍人员(无论身处何地)访问 Fable 5 和 Mythos 5 模型。为确保全面合规,Anthropic 被迫切断所有客户(包括外籍员工)的访问权限。官方理由是国家层面发现了一种可能绕过安全防御的“越狱”方法。Anthropic 回顾指出,该技术仅能识别少量已知的、微小的漏洞,且 OpenAI 的 GPT-5.5 等其他公开模型同样具备该能力,并不构成独特的威胁。公司强调其采取了“深度防御”策略,虽承认当前技术水平下无法实现完美的防越狱,但通过数千小时的红队测试、强化的安全护栏及数据监控机制,已将风险控制在行业基准水平。尽管对政府基于“狭窄、非通用”的潜在漏洞而全面召回大模型持强烈异议,Anthropic 仍表示将遵守法律指令,同时批评若此标准普及将导致全行业的新模型部署实质性停滞。公司承诺将在未来 24 小时内公布更多技术细节以还原事实。
事件分析
💡 核心观点:当大模型能力触及国家安全红线,模糊的安全标准正成为技术部署的高门槛,AI 竞争已从技术比拼转向合规生存战。
原文链接:Hacker News







AI周刊:大模型、智能体与产业动态追踪
程序员数学扫盲课
冲浪推荐:AI工具与技术精选导航
Claude Code 全体系指南:AI 编程智能体实战