Toy Tech Blog - AI 进化与软件工程哲学

 

最新发布第3页

智谱GLM 搬瓦工 AnyRouter LocVPS

Karpathy神经网络01：Micrograd - 手撸一个AI大脑-Toy's Tech Notes

Karpathy神经网络01：Micrograd - 手撸一个AI大脑

本文是《Karpathy神经网络零基础课程》系列文章 ← 上一篇：无 | → 下一篇：Karpathy神经网络02：Makemore – 语言模型入门这不仅是一个视频总结，更是一堂为你量身定制的 AI 原理启蒙课。视频的作者...

Toy2026-01-04AI 阅读(39)去评论

大模型面试100问08：开源生态篇-Toy's Tech Notes

大模型面试100问08：开源生态篇

TL;DR 开源大模型已经追上闭源——LLaMA 3.1 405B在多项任务上接近GPT-4，Qwen 2.5在中文理解上超越GPT-4o。选模型不是看参数大小，而是看任务适配：LLaMA生态最丰富、Mistral推理最快、Qwen中文最强...

Toy2026-01-04AI 阅读(64)去评论

大模型面试100问07：特殊架构篇-Toy's Tech Notes

大模型面试100问07：特殊架构篇

TL;DR 稠密模型的参数规模竞赛已经到头，MoE用稀疏激活让470亿参数的模型跑出130亿的速度；多模态让LLM能看图说话，GPT-4V的视觉编码器是关键；Diffusion模型让AI能画画，DDPM和DDIM是两条技术路线。本文从6个高...

Toy2026-01-04AI 阅读(44)去评论

大模型面试100问06：评估与安全篇-Toy's Tech Notes

大模型面试100问06：评估与安全篇

TL;DR 评估和安全是LLM落地的两大关键——不能衡量就无法改进，不能保护就不敢上线。BLEU/ROUGE适合机器翻译但不适合开放生成，困惑度只能评估语言建模能力；幻觉检测用语义熵，偏见测量用CrowS-Pairs；红队测试模拟攻击，差分...

Toy2026-01-04AI 阅读(52)去评论

大模型面试100问05：RAG与Agent篇-Toy's Tech Notes

大模型面试100问05：RAG与Agent篇

TL;DR LLM的知识有截止日期，RAG让它能查最新资料；LLM只会聊天，Agent让它能干活。RAG的核心是检索+生成，文档分块策略直接影响效果；Agent的核心是感知+规划+记忆+工具，ReAct架构让它能像人一样思考和行动。本文从8...

Toy2026-01-04AI 阅读(60)去评论

大模型面试100问04：Prompt工程篇-Toy's Tech Notes

大模型面试100问04：Prompt工程篇

TL;DR Prompt工程是让LLM听懂人话的艺术——同样的问题，换个问法效果天差地别。”让我们一步步思考”这句话为什么能让GPT-4准确率从17%提升到79%？Tree of Thoughts如何让模型像下棋一样...

Toy2026-01-04AI 阅读(49)去评论

大模型面试100问03：推理与部署篇-Toy's Tech Notes

大模型面试100问03：推理与部署篇

TL;DR 推理才是大模型的真正战场——训练一次，推理百万次。标准Attention的内存带宽成为瓶颈，Flash Attention通过Tiling技术让速度提升5倍；KV Cache让解码快10倍，但长上下文会吃掉几十GB显存；vLLM...

Toy2026-01-04AI 阅读(65)去评论

大模型面试100问02：训练与优化篇-Toy's Tech Notes

大模型面试100问02：训练与优化篇

TL;DR 全参数微调一个7B模型要14GB显存，65B模型要130GB——普通人根本玩不起。但LoRA只需要0.1%的参数，QLoRA更狠，单张24GB显卡就能训65B模型。本文从10个高频面试题入手，带你搞懂大模型训练的核心技术：LoR...

Toy2026-01-04AI 阅读(47)去评论

大模型面试100问01：基础概念与架构篇-Toy's Tech Notes

大模型面试100问01：基础概念与架构篇

TL;DR 面试官问你Transformer原理，你能答到什么深度？本文从12个高频面试题入手，带你搞懂大模型的底层架构——不是背概念，是真正理解为什么GPT用单向注意力、LLaMA为什么选RoPE、多头注意力到底在干什么。读完这篇，你能用...

Toy2026-01-04AI 阅读(62)去评论

大模型面试100问：从基础到实战的完整指南-Toy's Tech Notes

大模型面试100问：从基础到实战的完整指南

大模型面试100问：从基础到实战的完整指南为什么需要这个系列？大模型面试不是背八股文——面试官要的是系统性理解和实战经验。市面上的面试题要么太碎片化（100个孤立问题），要么太理论化（只讲公式不讲应用）。这个系列不一样： ✅ 系统化：...

Toy2026-01-04AI 阅读(79)去评论

Karpathy神经网络零基础课程：从零手撸到GPT-Toy's Tech Notes

Karpathy神经网络零基础课程：从零手撸到GPT

TL;DR Andrej Karpathy（前特斯拉AI总监、OpenAI创始成员）做了个神经网络课程，从零开始手撸代码，一路搞到GPT。不讲虚的，全是实战。你要是会Python和高中数学，就能跟着学。为什么值得看？先说重点：这课程跟市...

Toy2026-01-04AI 阅读(56)去评论

Claude Code 架构深度解析：Commands、Skills、Agents、Plugins 一文说清-Toy's Tech Notes

Claude Code 架构深度解析：Commands、Skills、Agents、Plugins 一文说清

TL;DR 你可能听说过 Claude Code 的 Commands、Skills、Agents、Plugins，但搞不清它们到底有啥区别？简单说： – Commands = 你按的按钮（手动触发） – Skil...

Toy2026-01-04AI 阅读(84)去评论

程序员数学扫盲课：10年经验程序员的数学补习指南-Toy's Tech Notes

程序员数学扫盲课：10年经验程序员的数学补习指南

为什么10年经验的程序员还需要补数学？你写了10年代码，却看不懂Redis的SINTER为什么这么快？你做过无数次容量规划，却不知道为什么缓存命中率从90%提升到95%，性能能翻倍？你天天用负载均衡，却不明白一致性哈希为什么能解决扩容...

Toy2026-01-04架构阅读(43)去评论

程序员数学10：组合数学 - 容量规划-Toy's Tech Notes

程序员数学10：组合数学 - 容量规划

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学09：信息论 – 数据压缩 TL;DR 为什么100万用户需要多少台服务器？为什么数据库连接池要设置多大？为什么缓存命中率从90%提升到95%，性能能翻倍？答案都藏在组合...

Toy2026-01-04架构阅读(29)去评论

程序员数学09：信息论 - 数据压缩-Toy's Tech Notes

程序员数学09：信息论 - 数据压缩

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学08：哈希与模运算 – 负载均衡 | → 下一篇：程序员数学10：组合数学 – 容量规划 TL;DR 为什么ZIP能把文件压缩到原来的1/10？为什么HTTP...

Toy2026-01-04架构阅读(34)去评论

程序员数学08：哈希与模运算 - 负载均衡-Toy's Tech Notes

程序员数学08：哈希与模运算 - 负载均衡

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学07：线性代数 – 推荐系统 | → 下一篇：程序员数学09：信息论 – 数据压缩 TL;DR 为什么负载均衡能把请求均匀分配到服务器？为什么一致性哈希能解决...

Toy2026-01-04架构阅读(35)去评论

程序员数学07：线性代数 - 推荐系统-Toy's Tech Notes

程序员数学07：线性代数 - 推荐系统

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学06：统计学 – P99延迟监控 | → 下一篇：程序员数学08：哈希与模运算 – 负载均衡 TL;DR 为什么推荐系统能猜出你喜欢什么？为什么协同过滤这么准...

Toy2026-01-04架构阅读(36)去评论

程序员数学06：统计学 - P99延迟监控-Toy's Tech Notes

程序员数学06：统计学 - P99延迟监控

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学05：概率论 – 系统可用性 | → 下一篇：程序员数学07：线性代数 – 推荐系统 TL;DR 为什么监控报警不看平均值要看P99？为什么1%的慢请求能毁掉...

Toy2026-01-04架构阅读(33)去评论

程序员数学05：概率论 - 系统可用性-Toy's Tech Notes

程序员数学05：概率论 - 系统可用性

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学04：图论 – 微服务依赖管理 | → 下一篇：程序员数学06：统计学 – P99延迟监控 TL;DR 为什么三个99.9%的服务串联后，整体可用性只有99....

Toy2026-01-04架构阅读(30)去评论

程序员数学04：图论 - 微服务依赖管理-Toy's Tech Notes

程序员数学04：图论 - 微服务依赖管理

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学03：集合论 – Redis与SQL | → 下一篇：程序员数学05：概率论 – 系统可用性 TL;DR 为什么微服务会出现循环依赖？为什么CI/CD流水线要...

Toy2026-01-04架构阅读(33)去评论

上一页
1
2
3
4
5
6
...
下一页
共 14 页

前沿哨所

RealStock AI 智能体探索主动投资，实现交易逻辑全透明化

RealStock AI 智能体近期在美股实盘测试中表现亮眼，两个月收益率超 30%。与传统黑盒预测产品不同，该系统主打逻辑穿透性，公开买卖及调仓逻辑，实现了从概率预测到逻辑实证的跨越。其核心优势包括高精度去噪策略、实时穿透式风险监控以及基于大模型的智能情绪量化引擎，旨在展示 AI 在真实市场环境下的生存能力。

原文链接：V2EX 分享发现

36分钟前
无需重训：新技术通过递归自约束减少大模型幻觉

该研究针对大语言模型普遍存在的“阿谀奉承”和“幻觉”问题，提出了一种名为“Analog I协议”的提示词架构。该架构通过构建递归的“三重循环”内心独白，使模型能像过滤器一样监控并拒绝低质量、无信息量的候选输出。实验表明，这种利用计算消耗抑制预测路径的方法，能在不重新训练模型权重的情况下，显著减少幻觉，使AI保持逻辑严密性和独立性，有效摆脱RLHF训练带来的“应声虫”效应。

原文链接：Hacker News

36分钟前
开源开锁机器人问世：自动化暴力破解物理锁具

这是一个开源的开锁机器人项目，通过空心键穿入铜线按压弹子，以0.7秒/次的速度暴力穷举密码。该机制不依赖触觉反馈，能无视安全锁芯防护。虽然破解耗时较长，但它降低了物理开锁的技术门槛，为锁具安全设计提供了全新的测试视角与挑战。

原文链接：Hacker News

36分钟前
Astro 正式加入 Cloudflare，回归开源核心专注研发

Astro 技术公司宣布加入 Cloudflare。Astro 框架将保持 MIT 开源协议及平台无关性，持续支持多云部署。创始人表示，此前的商业化尝试分散了精力，此次合作将使团队摆脱业务干扰，利用 Cloudflare 的资源 100% 聚焦于框架代码，共同推动以内容为中心的 Web 开发，适应 AI 编码与智能代理的未来趋势。

原文链接：Hacker News

37分钟前
零成本自建AI助手：Hugging Face部署Open WebUI实战指南

本教程详细介绍了如何在 Hugging Face Spaces 上免费部署 Open WebUI。通过复制官方样板并配置环境变量，用户可以轻松搭建支持 OpenAI API 和 Ollama 的自托管 WebUI。文章重点讲解了数据库连接、安全身份验证设置以及 RAG 嵌入模型的配置，并特别强调了关闭默认匿名访问和定期备份的重要性。这为开发者提供了一种无需本地算力即可运行强大 LLM 交互界面的低成本方案。

原文链接：Linux.do

37分钟前
Hexo博客智能推荐插件：基于OpenAI Embedding的语义搜索方案

该方案介绍了一款基于Hexo博客的智能推荐插件，利用OpenAI Embedding技术实现基于内容的语义搜索推荐。其核心优势在于支持结果缓存，仅当文章正文或标题变化时才重新计算，有效避免非内容修改引发的无效刷新。此外，插件采用数据分片存储策略，解决大量文章时的性能瓶颈。文章提供了完整的Node.js脚本与前端JS代码，推荐配合OpenRouter的高性价比模型使用，能显著提升博客站点的内链建设与用户阅读体验。

原文链接：Linux.do

37分钟前

十年稳如初 — LocVPS，用时间证明实力

10+ 年老牌云主机服务商，全球机房覆盖，性能稳定、价格厚道。

老品牌，更懂稳定的价值你的第一台云服务器，从 LocVPS 开始