近期,一位重度使用 Claude Code 的开发者在社区反馈,其通过 cc-switch 插件接入国产大模型(如百炼平台的 Qwen3.7max)时,遇到了极为严重的 Token 消耗异常问题。该开发者使用的环境为 Claude Code 2.1.162 版本配合最新版 cc-switch,主要用于实现国产模型与中转服务的轮换,以控制 API 调用成本。据观察,在使用 Qwen3.7max 模型时,不到两小时内即消耗了套餐 30% 的额度,且 cc-switch 显示的输入 Token 数量居高不下。由于百炼后台未公开详细的计费明细,开发者最初误以为是新模型定价较高。然而,经过横向对比测试发现,使用 Qoder 系列产品接入同样的 Qwen3.7max 模型,或在 OpenCode 中进行操作,其 Token 消耗速度远低于 Claude Code 的消耗水平。在同等频次下(如 200 次调用),Qoder 等工具能维持更长时间的使用。该开发者随后两日的测试进一步证实,Claude Code 在接入非原生模型时的 Token 消耗可能存在未适配或计费计算方式不透明的问题,导致开发成本远超预期。目前尚不清楚问题具体出在 Claude Code 的版本更新、cc-switch 的适配逻辑,还是云厂商的计费机制上,这引发了关于 AI 编程工具跨模型兼容性与成本效率的讨论。
事件分析
💡 核心观点:AI 编程工具在跨模型调用时的 Token 效率差异显著,客户端的上下文管理能力正成为开发者选择工具的关键考量。
原文链接:Linux.do







AI周刊:大模型、智能体与产业动态追踪
程序员数学扫盲课
冲浪推荐:AI工具与技术精选导航
Claude Code 全体系指南:AI 编程智能体实战