云聚 AI Token Plan 满 199 减 35 元
AI编程 · 架构思考 · 技术人生
DigitalOcean 开发者云

API 中转陷阱:OpenCode GLM 模型接入 Claude Code 遭遇缓存失效与高成本

云聚 AI Token Plan 满 199 减 35 元

一位开发者在使用 Claude Code 进行 AI 编程时,通过自建的 NewAPI 中转服务接入 OpenCode Go 提供的 GLM-5.2 模型,却遭遇了异常高昂的 API 调用费用。该用户的技术架构采用了多层转换模式:利用 NewAPI 将 OpenAI 格式接口转换为兼容 Claude Code 的格式,并经由 cc-switch 进行连接。在配置过程中,由于中间层出现了 `cache_control` 参数报错,用户被迫在 Claude Code 配置中启用了 `DISABLE_PROMPT_CACHING` 参数。然而,即便完成了配置,系统单次请求的平均费用仍高达 0.5 美元左右,远超使用 DeepSeek V4 Pro 等竞品的预期。通过检查请求日志,用户发现所有调用似乎均未命中提示词缓存,导致每次交互都按照全量输入输出 Token 进行计费。目前该问题引发了对中转服务是否透传缓存控制参数,以及 OpenCode 侧模型是否原生支持缓存的广泛质疑。

事件分析

该事件深刻揭示了当前 AI 生态中“协议适配”与“计费逻辑”之间的断层问题。Claude Code 等先进编码工具高度依赖 Anthropic 特有的 Prompt Caching(提示词缓存)机制来降低长上下文场景下的 Token 消耗,其核心在于 HTTP 请求头中的特定缓存控制指令。当开发者使用 NewAPI、cc-switch 等中间件进行异构模型接入(如将 OpenCode 的 GLM 模型伪装成 OpenAI 或 Claude 接口)时,中间层往往只实现了基础的对话补全协议映射,而忽略了对厂商特定的元数据(如缓存控制头)进行透传或转换。这导致即便底层模型能力强大,也会因中间层的“参数丢失”而无法享受缓存优惠,从而产生高额账单。这种现象不仅是技术实现的兼容性瑕疵,更直接关系到 AI 辅助编程在实际工作流中的经济可行性,提示开发者在使用复杂 API 链路时需格外关注计费一致性问题。

💡 核心观点:API 中转层对元数据的透传缺失会导致提示词缓存机制失效,开发者在构建异构模型链路时必须警惕协议兼容性带来的隐形技术债务。

阿里云 OPC 一人公司创业装备库

原文链接:Linux.do

阿里云函数计算 一键部署 AI 大模型
赞(0)
未经允许不得转载:Toy's Tech Notes » API 中转陷阱:OpenCode GLM 模型接入 Claude Code 遭遇缓存失效与高成本
ReClaude Claude Code 合租
阿里云函数计算 一键部署 AI 大模型

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC,封号还得自己重新折腾?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。

上车 4 人车 400/月查看四档套餐