一位开发者在技术社区分享了使用不同大模型解决 APP 爬虫风控问题的实战经历。该开发者最初尝试使用 Anthropic 的 Opus 模型(文中标注为 Opus 4.8),先后启用了 200k 和 1M 的上下文窗口。然而,尽管累计消耗了约 35 美元的额度,Opus 模型仍未能解决问题,且表现出对开发者验证结果的“固执”怀疑,导致最终失败。随后,开发者切换至 OpenAI 的 GPT 系列模型(文中称为 GPT 5.5)。结果显示,GPT 模型在首次尝试中便从开源项目中精准定位了正确的测试方案,总计仅花费 2.9 美元便完成了包括代码测试和验证在内的全部任务。这一案例在技术圈引发了关于长上下文实际效用、模型性格及 AI 辅助编程成本效益的广泛讨论。
事件分析
💡 核心观点:长上下文窗口不等于解决力,AI 编程的实战价值取决于精准推理与成本控制,而非盲目堆砌参数。
原文链接:Linux.do







AI周刊:大模型、智能体与产业动态追踪
程序员数学扫盲课
冲浪推荐:AI工具与技术精选导航