近日,有开发者在使用 Claude Code 通过 CC Switch 和 NewAPI 接入智谱 GLM 模型时,遭遇了持续性的 500 错误,提示“Insufficient balance or no resource package”(余额不足)。经过深入排查,问题根源被锁定在智谱 GLM 接口地址的配置差异上。智谱 GLM 的 OpenAI 兼容接口将按量计费 API 与 Coding Plan(编程套餐)的端点进行了物理隔离。默认的请求地址 `https://open.bigmodel.cn/api/paas/v4/chat/completions` 实际指向按量计费通道,而用户持有的 Coding Plan 需要调用专属地址 `https://open.bigmodel.cn/api/coding/paas/v4/chat/completions`。由于 CC Switch 和 NewAPI 的配置默认指向了前者,导致用户明明有套餐资源却被判定为欠费。针对这一痛点,文章提供了三种解决方案:一是将 CC Switch 的 API 格式调整为 Anthropic Messages 原生格式;二是在 NewAPI 中将接口类型选择为 Anthropic;三是(推荐方案)在 NewAPI 中选择自定义接口类型,并手动填入 Coding Plan 的完整 URL。分析指出,方案一和方案二虽然能解决连通性问题,但存在混用按量计费余额的风险,可能导致意外扣费。而方案三通过强制指定 Coding Plan 专属端点,既保证了服务可用,又避免了消耗不必要的按量余额。这一案例揭示了在使用多层级 API 中间件连接大模型时,底层厂商的计费逻辑与接口规范细节往往容易被忽视,开发者需仔细甄别不同计费模式下的端点差异。
事件分析
💡 核心观点:API 格式标准化无法掩盖厂商计费逻辑的差异,智谱 GLM 复杂的端点策略暴露了多层级代理转发中的兼容性痛点。
原文链接:Linux.do







AI周刊:大模型、智能体与产业动态追踪