一位高阶付费用户发帖反馈,Claude 模型在过去三天内表现出明显的“降智”趋势,原本的发散性处理能力大幅退化,变得“言听计从”且缺乏兜底能力。在其全自动驾驶 AI 开发项目 solodawn 的实测中,相同测试任务的评分从 83 分断崖式下跌至 62 分,TypeScript 错误数更是从昨天的 0 个激增至 72 个。在排除了数据复用和架构问题后,用户将矛头直指官方模型的变动,质疑在官方积极推广之际,核心能力反而出现了严重衰退。
原文链接:Linux.do
一位高阶付费用户发帖反馈,Claude 模型在过去三天内表现出明显的“降智”趋势,原本的发散性处理能力大幅退化,变得“言听计从”且缺乏兜底能力。在其全自动驾驶 AI 开发项目 solodawn 的实测中,相同测试任务的评分从 83 分断崖式下跌至 62 分,TypeScript 错误数更是从昨天的 0 个激增至 72 个。在排除了数据复用和架构问题后,用户将矛头直指官方模型的变动,质疑在官方积极推广之际,核心能力反而出现了严重衰退。
原文链接:Linux.do
Opus 4.8 把"诚实"当成了卖点
AI 代理的四种记忆:从上下文窗口到跨会话学习
用 Claude 做一个会自己长脑子的知识库:比 Obsidian 插件栈更轻,也更像真正的第二大脑
大模型周刊 第 31 期:Mythos 把网安炸到震耳,Hermes 抢下 OpenRouter 日榜,DeepSeek V4 落地后继续杀价