开源社区发布了一款名为 Kiyomizu 的轻量级 LLM 网关,旨在通过技术手段赋予 AI 更持久的记忆与人格化特征。该项目基于 Java 开发,以“Write Once, Run Anywhere”为理念,通过单一的 Fat JAR 文件简化部署流程,支持接入 Cherry Studio 等前端客户端。Kiyomizu 的核心技术亮点在于对 Anthropic Claude 模型的深度适配。针对 Claude 独特的缓存降价策略,该项目实现了特化的缓存控制模式,允许开发者配置 TTL(生存时间)及断点数量,解决了第三方网关难以自动标记缓存断点的问题,从而有效降低长对话的 Token 成本。在交互体验上,Kiyomizu 引入了基于 Embedding 的记忆检索系统与情感量化机制。系统会自动提取对话关键摘要并转化为向量,通过计算余弦相似度在后续对话中召回相关记忆。同时,系统还会基于交互内容评估“亲密度”与“信任度”并存入数据库,使 AI 能够根据长期关系调整回复风格。作者坦言该项目属于 Vibe Coding 快速构建的“玩具”性质,存在一定安全风险,建议仅在本地或局域网环境运行。
事件分析
💡 核心观点:通过封装 Claude 缓存机制与基于向量检索的情感量化,该项目探索了以低成本构建持久记忆型 AI 应用的技术路径。
原文链接:Linux.do







AI周刊:大模型、智能体与产业动态追踪
程序员数学扫盲课
冲浪推荐:AI工具与技术精选导航