GitHub 上名为 pxpipe 的开源项目提出了一种新颖的 AI 成本优化方案。该工具通过本地代理,将 Claude Code 等应用中冗长的系统提示词、工具文档和历史记录渲染为高密度图片发送给模型。其原理在于利用视觉 Token 的定价规则:一张固定像素图片的计费是固定的,而其中包含的文字量可以远超同价位的文本 Token。实测数据显示,这种“图文转换”能将输入 Token 减少 60% 至 70%,从而大幅降低 API 调用账单。尽管该方案属于有损压缩,可能导致模型无法精确读取哈希值或 ID,但在代码逻辑理解和 SWE-bench 测试中,它在大幅降低成本的同时保持了与原生文本相当的任务完成率,有效解决了长上下文应用成本高昂的痛点。
事件分析
💡 核心观点:利用视觉模态计费漏洞压缩上下文,是 AI 时代降低推理成本的硬核创新。
原文链接:Hacker News






