Claude Code 合租
AI编程 · 架构思考 · 技术人生
DigitalOcean 开发者云
FoxCode AI Coding 助手

AI

追踪AI行业一线动态。Claude、GPT、Gemini模型解读,RAG技术解析,AI推理边界探索。每周大模型周刊,第一时间捕获技术风向。
Cowork 五条规则背后的同一件事-Toy's Tech Notes

Cowork 五条规则背后的同一件事

最近这半年,Anthropic 在做一件不太显眼但方向很清楚的事:把原本只有开发者会写的 CLAUDE.md、MEMORY.md、skills 这一整套工程化写法,整体搬到 Web 端给非开发者用。这个新产品叫 Claude Cowork,...

赞(0)ToyToy阅读()
Codex 在自己的执行历史里找补丁-Toy's Tech Notes

Codex 在自己的执行历史里找补丁

最近社区在传一个”自我蒸馏”的提示词,源头是 OpenAI Codex 团队成员 @VB。意思是让 Codex 回看你最近 30 天的执行记录,把里面反复出现的工作流打包成 Skill,把固定角色封成 Sub-age...

赞(0)ToyToy阅读()
Claude Code 合租,4 人车 400 一个月,KYC 封号都不用你管

Claude Code 合租,4 人车 400 一个月,KYC 封号都不用你管

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。

LLM 排行榜的另一条轴-Toy's Tech Notes

LLM 排行榜的另一条轴

最近看 LLM 编码能力的排行榜,越来越像高考分数榜。SWE-bench 跑出 84%、HumanEval 80%+、MBPP 85%——一个分数评所有,再把模型按这条轴排队。 工程世界没那么简单。一段代码能不能通过测试是一回事,它能不能被...

赞(0)ToyToy阅读()
Claude Code Routines:把 Agent 从等待模式变成主动干活-Toy's Tech Notes

Claude Code Routines:把 Agent 从等待模式变成主动干活

去年,Anthropic 的文档工程师 Sarah 遇到了一个没法靠加班解决的问题:Claude Code 团队的 PR 合并量比年初增加了 200%,但维护文档的人只有她一个。每次有代码改动,她都要手动比对源码和文档有没有偏差,再开 PR...

赞(0)ToyToy阅读()
GPT-5.5 的提示词,从流程控制变成了结果验收-Toy's Tech Notes

GPT-5.5 的提示词,从流程控制变成了结果验收

我注意到一件有意思的事:同样是用 GPT-5.5 或者 Codex,有的人能稳定跑完复杂任务,有的人则反复拿到跑偏的结果。差距不在模型能力,在于提示词的写法有没有跟上模型的进化方向。 灵姐(灵姐说AI)最近结合 OpenAI 官方的 Pro...

赞(0)ToyToy阅读()
把 Agent 送上生产:RAG、工程、安全、评测-Toy's Tech Notes

把 Agent 送上生产:RAG、工程、安全、评测

作者:toy 一、为什么最后一篇要把这四件事放在一起 这个系列到了第九篇,前八篇依次拆解了 Agent 的基础理论、规划推理、开发框架、工具调用、记忆模块、微调方案、推理服务、显存优化。每一篇都可以单独成立,但如果你真的要把 Agent 推...

赞(0)ToyToy阅读()
榨干每块显存:LLM 底层显存优化-Toy's Tech Notes

榨干每块显存:LLM 底层显存优化

作者:toy GPU 显存是 LLM 推理与训练的硬约束,不是软性资源。当一个 70B 参数模型以 BF16 格式加载时,光是参数本身就需要约 140GB,单张 H100 的 80GB 显存根本装不下。工程师的任务不是抱怨硬件贵,而是理解显...

赞(0)ToyToy阅读()
让 Agent 跑得快:LLM 推理服务-Toy's Tech Notes

让 Agent 跑得快:LLM 推理服务

作者:toy 一个 Agent 工作流,最终的性能瓶颈往往不在路由逻辑、工具调用,而在 LLM 推理本身。同样的模型,同样的硬件,不同的推理框架可以带来 10 倍以上的吞吐差距。这篇文章讨论推理服务的底层机制,以及三个主流框架:vLLM、S...

赞(0)ToyToy阅读()
把模型练成你的 Agent:微调方案-Toy's Tech Notes

把模型练成你的 Agent:微调方案

作者:toy 一、为什么需要微调 Prompt Engineering 的三类失效 用 Prompt 调教通用模型,是大多数 Agent 项目的第一站。这条路走得顺时,能省掉大量工程复杂度。但在三类场景下,它会系统性失效。 第一类是领域术语...

赞(0)ToyToy阅读()
Agent 的记忆:从上下文到向量库-Toy's Tech Notes

Agent 的记忆:从上下文到向量库

作者:toy 一、Agent 为什么需要记忆 无状态 LLM 的根本局限 把一个 LLM 想象成一位每隔五分钟就会彻底失忆的顾问。你在上午告诉他你的背景、偏好、当前项目的约束条件,五分钟后他已经一无所知,对话只能从头开始。这不是比喻,而是 ...

赞(0)ToyToy阅读()
Agent 的手脚:工具调用-Toy's Tech Notes

Agent 的手脚:工具调用

作者:toy 一、工具调用是什么:让模型伸手摸真实世界 从纯文本生成到”有手有脚” 大语言模型在工具调用出现之前,本质上是一台极其复杂的文字处理机器。你问它”今天北京的 PM2.5 是多少”,...

赞(0)ToyToy阅读()
搭 Agent 的脚手架:主流开发框架-Toy's Tech Notes

搭 Agent 的脚手架:主流开发框架

作者:toy 一、为什么需要 Agent 框架 从”手写循环”到框架 构建一个最简单的 ReAct Agent,大概需要五十行 Python:一个 while 循环,调 LLM,解析输出,调工具,把结果塞回上下文,再...

赞(0)ToyToy阅读()
让 Agent 会思考:规划与推理范式-Toy's Tech Notes

让 Agent 会思考:规划与推理范式

作者:toy 大多数人第一次看到 ChatGPT 流式输出时,误以为模型在”思考”。实际上它在做一件更机械的事:每次预测下一个 token 的概率分布,然后采样。这个过程里没有回溯,没有规划,没有对全局的感知。一个字...

赞(0)ToyToy阅读()
Agent 是什么:从闭环到自主决策-Toy's Tech Notes

Agent 是什么:从闭环到自主决策

作者:toy 一、智能体不是聊天机器人 有一个误解在 2025 年前后反复出现:只要套上”AI Agent”的名字,就算 Agent 了。实则不然。一个每次都从零开始的对话框,无论填了多么精心的 system pro...

赞(0)ToyToy阅读()
Opus 4.8 把

Opus 4.8 把"诚实"当成了卖点

Anthropic 今天发布了 Claude Opus 4.8。价格没变,跑分照常往上走,这本来是一次很常规的小版本升级。但发布稿里花了不小的篇幅讲一件事:这个模型更”诚实”了。 诚实度被拿出来当主打,这是个值得留意...

赞(1)ToyToy阅读()
Superpowers 不是 vibe coding 的对立面-Toy's Tech Notes

Superpowers 不是 vibe coding 的对立面

最近 GitHub 上 spec-driven 工具一片虚火。OpenSpec、SpecKit、BMAD 一字排开,每个都说自己是”让 AI 不再 vibe coding 的那一个”。WorldofAI 频道这周又加...

赞(0)ToyToy阅读()
推理慢不在语言慢,慢在加载、量化和调度-Toy's Tech Notes

推理慢不在语言慢,慢在加载、量化和调度

你可能听过一个直觉:C++ 比 Python 快很多倍,所以 llama.cpp(C++ 写的)应该比 vLLM(Python 写的)快很多倍。实测打脸——同一个模型同一张卡,vLLM 在不少场景下比 llama.cpp 还快。这就是 Ca...

赞(0)ToyToy阅读()
最好的 AI Agent 其实都在收敛到四个产品原则-Toy's Tech Notes

最好的 AI Agent 其实都在收敛到四个产品原则

本文整理自 Flinn AI 的一场短讲。演讲者把 Harvey、Cursor、Claude 和 Manus/Manifold 放在一起比较,最后提炼出四个正在反复出现的 agent 产品原则:模式收敛、过程透明、个性化理解,以及可逆性设计。更值得看的地方不在于概念本身,而在于这四条几乎刚好对应了 AI agent 从

赞(0)ToyToy阅读()

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC,封号还得自己重新折腾?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。

上车 4 人车 400/月查看四档套餐