Toy Tech Blog - AI 进化与软件工程哲学

 

最新发布第5页

AI工具美国电信直连云主机

大模型面试100问02：训练与优化篇-Toy's Tech Notes

大模型面试100问02：训练与优化篇

TL;DR 全参数微调一个7B模型要14GB显存，65B模型要130GB——普通人根本玩不起。但LoRA只需要0.1%的参数，QLoRA更狠，单张24GB显卡就能训65B模型。本文从10个高频面试题入手，带你搞懂大模型训练的核心技术：LoR...

Toy2026-01-04AI 阅读(66)去评论

大模型面试100问01：基础概念与架构篇-Toy's Tech Notes

大模型面试100问01：基础概念与架构篇

TL;DR 面试官问你Transformer原理，你能答到什么深度？本文从12个高频面试题入手，带你搞懂大模型的底层架构——不是背概念，是真正理解为什么GPT用单向注意力、LLaMA为什么选RoPE、多头注意力到底在干什么。读完这篇，你能用...

Toy2026-01-04AI 阅读(93)去评论

大模型面试100问：从基础到实战的完整指南-Toy's Tech Notes

大模型面试100问：从基础到实战的完整指南

大模型面试100问：从基础到实战的完整指南为什么需要这个系列？大模型面试不是背八股文——面试官要的是系统性理解和实战经验。市面上的面试题要么太碎片化（100个孤立问题），要么太理论化（只讲公式不讲应用）。这个系列不一样： ✅ 系统化：...

Toy2026-01-04AI 阅读(137)去评论

Karpathy神经网络零基础课程：从零手撸到GPT-Toy's Tech Notes

Karpathy神经网络零基础课程：从零手撸到GPT

TL;DR Andrej Karpathy（前特斯拉AI总监、OpenAI创始成员）做了个神经网络课程，从零开始手撸代码，一路搞到GPT。不讲虚的，全是实战。你要是会Python和高中数学，就能跟着学。为什么值得看？先说重点：这课程跟市...

Toy2026-01-04AI 阅读(88)去评论

Claude Code 架构深度解析：Commands、Skills、Agents、Plugins 一文说清-Toy's Tech Notes

Claude Code 架构深度解析：Commands、Skills、Agents、Plugins 一文说清

TL;DR 你可能听说过 Claude Code 的 Commands、Skills、Agents、Plugins，但搞不清它们到底有啥区别？简单说： – Commands = 你按的按钮（手动触发） – Skil...

Toy2026-01-04AI 阅读(141)去评论

程序员数学扫盲课：10年经验程序员的数学补习指南-Toy's Tech Notes

程序员数学扫盲课：10年经验程序员的数学补习指南

为什么10年经验的程序员还需要补数学？你写了10年代码，却看不懂Redis的SINTER为什么这么快？你做过无数次容量规划，却不知道为什么缓存命中率从90%提升到95%，性能能翻倍？你天天用负载均衡，却不明白一致性哈希为什么能解决扩容...

Toy2026-01-04架构阅读(67)去评论

程序员数学10：组合数学 - 容量规划-Toy's Tech Notes

程序员数学10：组合数学 - 容量规划

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学09：信息论 – 数据压缩 TL;DR 为什么100万用户需要多少台服务器？为什么数据库连接池要设置多大？为什么缓存命中率从90%提升到95%，性能能翻倍？答案都藏在组合...

Toy2026-01-04架构阅读(53)去评论

程序员数学09：信息论 - 数据压缩-Toy's Tech Notes

程序员数学09：信息论 - 数据压缩

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学08：哈希与模运算 – 负载均衡 | → 下一篇：程序员数学10：组合数学 – 容量规划 TL;DR 为什么ZIP能把文件压缩到原来的1/10？为什么HTTP...

Toy2026-01-04架构阅读(62)去评论

程序员数学08：哈希与模运算 - 负载均衡-Toy's Tech Notes

程序员数学08：哈希与模运算 - 负载均衡

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学07：线性代数 – 推荐系统 | → 下一篇：程序员数学09：信息论 – 数据压缩 TL;DR 为什么负载均衡能把请求均匀分配到服务器？为什么一致性哈希能解决...

Toy2026-01-04架构阅读(52)去评论

程序员数学07：线性代数 - 推荐系统-Toy's Tech Notes

程序员数学07：线性代数 - 推荐系统

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学06：统计学 – P99延迟监控 | → 下一篇：程序员数学08：哈希与模运算 – 负载均衡 TL;DR 为什么推荐系统能猜出你喜欢什么？为什么协同过滤这么准...

Toy2026-01-04架构阅读(55)去评论

程序员数学06：统计学 - P99延迟监控-Toy's Tech Notes

程序员数学06：统计学 - P99延迟监控

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学05：概率论 – 系统可用性 | → 下一篇：程序员数学07：线性代数 – 推荐系统 TL;DR 为什么监控报警不看平均值要看P99？为什么1%的慢请求能毁掉...

Toy2026-01-04架构阅读(54)去评论

程序员数学05：概率论 - 系统可用性-Toy's Tech Notes

程序员数学05：概率论 - 系统可用性

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学04：图论 – 微服务依赖管理 | → 下一篇：程序员数学06：统计学 – P99延迟监控 TL;DR 为什么三个99.9%的服务串联后，整体可用性只有99....

Toy2026-01-04架构阅读(49)去评论

程序员数学04：图论 - 微服务依赖管理-Toy's Tech Notes

程序员数学04：图论 - 微服务依赖管理

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学03：集合论 – Redis与SQL | → 下一篇：程序员数学05：概率论 – 系统可用性 TL;DR 为什么微服务会出现循环依赖？为什么CI/CD流水线要...

Toy2026-01-04架构阅读(56)去评论

程序员数学03：集合论 - Redis与SQL-Toy's Tech Notes

程序员数学03：集合论 - Redis与SQL

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学02：对数Log – 数据库索引 | → 下一篇：程序员数学04：图论 – 微服务依赖管理 TL;DR 为什么Redis的SINTER能瞬间找出共同好友？为什...

Toy2026-01-04架构阅读(50)去评论

程序员数学02：对数Log - 数据库索引-Toy's Tech Notes

程序员数学02：对数Log - 数据库索引

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学01：破冰篇 – 数学符号就是代码 | → 下一篇：程序员数学03：集合论 – Redis与SQL TL;DR 为什么MySQL能在1000万条数据里瞬间找到...

Toy2026-01-04架构阅读(46)去评论

程序员数学01：破冰篇 - 数学符号就是代码-Toy's Tech Notes

程序员数学01：破冰篇 - 数学符号就是代码

本文是《程序员数学扫盲课》系列文章 → 下一篇：程序员数学02：对数Log – 数据库索引 TL;DR 写了10年代码，看到数学符号就头疼？其实那些吓人的希腊字母，翻译成代码你早就会了。这篇文章把最常见的6个数学符号直接对应到G...

Toy2026-01-04架构阅读(50)去评论

Boris Cherny 的 Claude Code 实战手册：13 条生产力心法-Toy's Tech Notes

Boris Cherny 的 Claude Code 实战手册：13 条生产力心法

TL;DR 上篇讲了 Boris Cherny 的核心理念，这篇直接上干货：他的 13 条 Claude Code 实战技巧。从环境配置（5 终端并行、系统通知）、到工具链（slash commands、subagents、hooks）、...

Toy2026-01-04AI 阅读(107)去评论

Claude Code 创造者 Boris Cherny：用 AI 写 AI 的极致实践-Toy's Tech Notes

Claude Code 创造者 Boris Cherny：用 AI 写 AI 的极致实践

TL;DR Boris Cherny 在 2024 年 9 月加入 Anthropic，用 5 个月时间，大量依赖 AI（Claude）来构建 Claude Code——用 AI 写 AI 工具。2025 年 2 月 24 日，Claude...

Toy2026-01-04AI 阅读(67)去评论

Claude Reflect：将对话反馈转化为智能配置-Toy's Tech Notes

Claude Reflect：将对话反馈转化为智能配置

Claude Reflect 是什么 Claude Reflect 是一个 Claude Code 的自学习插件。它的核心功能很简单：自动捕获你对 Claude 的纠正和偏好，写入配置文件，让 Claude 在未来的对话中记住这些经验。举...

Toy2026-01-04工具阅读(87)去评论

Claude Code Workflow Studio：拖拽就能搞定 AI 自动化-Toy's Tech Notes

Claude Code Workflow Studio：拖拽就能搞定 AI 自动化

TL;DR 先说重点：你每天要让 AI 干重复的活儿，比如定时爬数据、生成报告、推送消息，以前得写一堆代码。现在有个 VS Code 插件叫 Claude Code Workflow Studio，拖拖拽拽就能把这些流程画出来，甚至直接跟 ...

Toy2026-01-01工具阅读(62)去评论

上一页
1
2
3
4
5
6
7
8
...
下一页
共 16 页

前沿哨所

Run Skill AI上线：汇集3万+技能库，提供免费AI运行服务

Run Skill AI是一个新上线的免费AI技能运行平台。该平台资源丰富，内置了超过3万个精选的AI技能供用户选择，覆盖了多种应用场景。用户可以直接在该网站上免费调用并运行这些技能，无需支付任何费用。这一举措降低了普通用户使用AI工具的门槛，有助于AI技术的普及与应用。目前平台已开放访问，开发者邀请广大科技爱好者试用并提出宝贵意见。

原文链接：V2EX 分享发现

55分钟前
巧解OpenClaw搜索难题：利用自修改机制接入Bing搜索

针对OpenClaw部署中因缺少Brave Search API密钥导致无法联网搜索的问题，作者提出了一种替代方案。通过启用无头浏览器功能，让Agent自主编写Bing搜索技能，并自动修改配置文件以禁用原生web_search工具，转而使用国内网络更友好的Bing。实测表明，该方法有效避免了因API调用失败而终止任务的情况，成功实现了稳定搜索，展示了AI Agent在环境适应和自我修正方面的潜力。

原文链接：V2EX 分享发现

55分钟前
解决AI“健忘症”，开发者推出跨LLM持久记忆API

开发者发布了项目 yomemo.ai，旨在解决 AI 应用中“记忆”碎片化的问题。该服务提供跨 LLM 的持久记忆 API，允许开发者在 Cursor、MCP 等不同工具间共享偏好、决策和上下文。项目采用 Go 和 PostgreSQL 构建，已接入支付并部署于 fly.io，实现了 Serverless 架构。作者诚邀社区探讨该需求的实际场景价值及隐私安全优化方案。

原文链接：V2EX 分享发现

56分钟前
AI开发哲学：与其盲目追逐前沿，不如“落后一步”

本文分享了Monarch工程团队关于在软件开发中应用AI的内部哲学。面对AI技术的狂热，作者主张与其盲目追逐“最前沿”，不如保持“落后一步”，待技术成熟且安全后再采用，以规避频繁变动和安全风险。文章强调工程师必须对产出的代码质量负责，利用AI处理繁琐事务，但核心深度思考必须由人完成。此外，团队应设计合理的验证反馈机制，并在原型开发等安全场景中更开放地使用AI。

原文链接：Hacker News

57分钟前
B站弹幕聚合神器：一键合并多源弹幕的油猴脚本

针对B站因版权变动导致视频资源分散、弹幕割裂的痛点，开发者推出了一款“B站弹幕合并器”油猴脚本。该脚本支持通过关键词或BV号快速查找，允许用户管理分P并设置时间偏移，实现多源弹幕同屏显示。它还适配时间戳弹幕并支持点击跳转。用户安装Tampermonkey插件并获取脚本后，即可在B站页面一键合并弹幕，有效提升观影时的互动氛围与体验。

原文链接：V2EX 分享发现

2小时前
编码时往往是我们效率最低的时刻

文章挑战了代码产出即生产力的传统观念。作者分享亲身经历，通过实地走访门店观察业务流程，最终仅修改3行代码便解决了可能导致全国性错误的收银系统问题。这表明，真正的生产力并非来自敲击键盘，而是深入理解问题和验证反馈。在AI加速代码生成的当下，若对问题的理解速度跟不上编码速度，我们只是在堆砌错误的假设。

原文链接：Hacker News

2小时前

十年稳如初 — LocVPS，用时间证明实力

10+ 年老牌云主机服务商，全球机房覆盖，性能稳定、价格厚道。

老品牌，更懂稳定的价值你的第一台云服务器，从 LocVPS 开始