 

架构内幕

深入系统设计的底层逻辑。B树深度教学5篇系列、私有化部署授权系统7章完整方案、搜索引擎索引架构与查询优化。从数据结构到分布式系统，用代码级视角剖析技术本质。

程序员数学扫盲课：10年经验程序员的数学补习指南-Toy's Tech Notes

程序员数学扫盲课：10年经验程序员的数学补习指南

为什么10年经验的程序员还需要补数学？你写了10年代码，却看不懂Redis的SINTER为什么这么快？你做过无数次容量规划，却不知道为什么缓存命中率从90%提升到95%，性能能翻倍？你天天用负载均衡，却不明白一致性哈希为什么能解决扩容...

Toy2026-01-04阅读(23)去评论

程序员数学10：组合数学 - 容量规划-Toy's Tech Notes

程序员数学10：组合数学 - 容量规划

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学09：信息论 – 数据压缩 TL;DR 为什么100万用户需要多少台服务器？为什么数据库连接池要设置多大？为什么缓存命中率从90%提升到95%，性能能翻倍？答案都藏在组合...

Toy2026-01-04阅读(19)去评论

程序员数学09：信息论 - 数据压缩-Toy's Tech Notes

程序员数学09：信息论 - 数据压缩

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学08：哈希与模运算 – 负载均衡 | → 下一篇：程序员数学10：组合数学 – 容量规划 TL;DR 为什么ZIP能把文件压缩到原来的1/10？为什么HTTP...

Toy2026-01-04阅读(16)去评论

程序员数学08：哈希与模运算 - 负载均衡-Toy's Tech Notes

程序员数学08：哈希与模运算 - 负载均衡

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学07：线性代数 – 推荐系统 | → 下一篇：程序员数学09：信息论 – 数据压缩 TL;DR 为什么负载均衡能把请求均匀分配到服务器？为什么一致性哈希能解决...

Toy2026-01-04阅读(18)去评论

程序员数学07：线性代数 - 推荐系统-Toy's Tech Notes

程序员数学07：线性代数 - 推荐系统

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学06：统计学 – P99延迟监控 | → 下一篇：程序员数学08：哈希与模运算 – 负载均衡 TL;DR 为什么推荐系统能猜出你喜欢什么？为什么协同过滤这么准...

Toy2026-01-04阅读(15)去评论

程序员数学06：统计学 - P99延迟监控-Toy's Tech Notes

程序员数学06：统计学 - P99延迟监控

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学05：概率论 – 系统可用性 | → 下一篇：程序员数学07：线性代数 – 推荐系统 TL;DR 为什么监控报警不看平均值要看P99？为什么1%的慢请求能毁掉...

Toy2026-01-04阅读(13)去评论

程序员数学05：概率论 - 系统可用性-Toy's Tech Notes

程序员数学05：概率论 - 系统可用性

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学04：图论 – 微服务依赖管理 | → 下一篇：程序员数学06：统计学 – P99延迟监控 TL;DR 为什么三个99.9%的服务串联后，整体可用性只有99....

Toy2026-01-04阅读(12)去评论

程序员数学04：图论 - 微服务依赖管理-Toy's Tech Notes

程序员数学04：图论 - 微服务依赖管理

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学03：集合论 – Redis与SQL | → 下一篇：程序员数学05：概率论 – 系统可用性 TL;DR 为什么微服务会出现循环依赖？为什么CI/CD流水线要...

Toy2026-01-04阅读(13)去评论

程序员数学03：集合论 - Redis与SQL-Toy's Tech Notes

程序员数学03：集合论 - Redis与SQL

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学02：对数Log – 数据库索引 | → 下一篇：程序员数学04：图论 – 微服务依赖管理 TL;DR 为什么Redis的SINTER能瞬间找出共同好友？为什...

Toy2026-01-04阅读(12)去评论

程序员数学02：对数Log - 数据库索引-Toy's Tech Notes

程序员数学02：对数Log - 数据库索引

本文是《程序员数学扫盲课》系列文章 ← 上一篇：程序员数学01：破冰篇 – 数学符号就是代码 | → 下一篇：程序员数学03：集合论 – Redis与SQL TL;DR 为什么MySQL能在1000万条数据里瞬间找到...

Toy2026-01-04阅读(13)去评论

程序员数学01：破冰篇 - 数学符号就是代码-Toy's Tech Notes

程序员数学01：破冰篇 - 数学符号就是代码

本文是《程序员数学扫盲课》系列文章 → 下一篇：程序员数学02：对数Log – 数据库索引 TL;DR 写了10年代码，看到数学符号就头疼？其实那些吓人的希腊字母，翻译成代码你早就会了。这篇文章把最常见的6个数学符号直接对应到G...

Toy2026-01-04阅读(19)去评论

第06章：生产环境部署：从原型到产品-Toy's Tech Notes

第06章：生产环境部署：从原型到产品

第06章：生产环境部署：从原型到产品监控系统、缓存策略、容量规划确保搜索系统稳定运行 📝 TL;DR (核心要点速览) – 部署架构：主从复制 + 读写分离 + 负载均衡 – 性能调优：数据库参数优化 + 查询缓存...

Toy2025-12-03阅读(65)去评论

第05章：搜索查询优化：从SQL到结果排序-Toy's Tech Notes

第05章：搜索查询优化：从SQL到结果排序

第05章：搜索查询优化：从SQL到结果排序复杂SQL查询实现毫秒级搜索响应，排序算法决定用户体验 📝 TL;DR (核心要点速览) – 查询核心：复杂JOIN + 聚合函数实现多维度权重计算 – 性能关键：参数化查...

Toy2025-12-03阅读(63)去评论

第04章：索引系统架构：高性能数据存储-Toy's Tech Notes

第04章：索引系统架构：高性能数据存储

第04章：索引系统架构：高性能数据存储两个核心表支撑整个搜索系统，批量操作决定性能 📝 TL;DR (核心要点速览) – 核心设计：index_tokens + index_entries = 完整反向索引 – 性...

Toy2025-12-03阅读(62)去评论

第03章：权重系统设计：相关性评分的科学-Toy's Tech Notes

第03章：权重系统设计：相关性评分的科学

第03章：权重系统设计：相关性评分的科学三层权重架构实现精确相关性控制，这是搜索质量的核心 📝 TL;DR (核心要点速览) – 核心公式：$finalWeight = $fieldWeight × $tokenizerWei...

Toy2025-12-03阅读(60)去评论

第02章：搜索引擎核心原理：Tokenization的艺术-Toy's Tech Notes

第02章：搜索引擎核心原理：Tokenization的艺术

第02章：搜索引擎核心原理：Tokenization的艺术搜索质量取决于分词策略，这是搜索引擎的DNA 📝 TL;DR (核心要点速览) – 核心概念：Tokenization是将文本转换为可搜索单元的艺术 – 四...

Toy2025-12-03阅读(63)去评论

第01章：为什么需要自建搜索引擎-Toy's Tech Notes

第01章：为什么需要自建搜索引擎

第01章：为什么需要自建搜索引擎当所有人都说”用Elasticsearch”时，我们选择回到第一性原理 📝 TL;DR (核心要点速览) – 核心问题：外部搜索服务复杂、昂贵、依赖性强 – ...

Toy2025-12-03阅读(60)去评论

从零构建可用搜索引擎：数据库驱动的搜索系统实战-Toy's Tech Notes

从零构建可用搜索引擎：数据库驱动的搜索系统实战

从零构建可用搜索引擎：数据库驱动的搜索系统实战当所有人都说”用Elasticsearch”时，我们选择回到第一性原理 📝 TL;DR (系列总览) – 核心问题：为什么现代搜索系统越来越复杂？ R...

Toy2025-12-03阅读(59)去评论

B树深度教学系列（五）：替代方案与未来趋势-Toy's Tech Notes

B树深度教学系列（五）：替代方案与未来趋势

B树深度教学系列（五）：替代方案与未来趋势从B树到AI索引：数据结构选择的演进与未来 📝 TL;DR (核心要点速览) 🎯 本篇核心： B树不是唯一选择，场景决定了最优数据结构 💡 关键发现： – B树适合：通用OLTP、中等...

Toy2025-12-02阅读(74)去评论

B树深度教学系列（四）：生产环境实现 - 从理论到工程实践-Toy's Tech Notes

B树深度教学系列（四）：生产环境实现 - 从理论到工程实践

B树深度教学系列（四）：生产环境实现 – 从理论到工程实践数据库工程师的实战指南：B树在真实系统中的工程挑战 📝 TL;DR (核心要点速览) 🎯 本篇核心：生产环境中的B树实现远比教科书复杂 💡 关键发现： –...

Toy2025-12-02阅读(112)去评论

1
2
下一页
共 2 页

前沿哨所

Embassy：Rust异步框架革新嵌入式开发

Embassy是一个基于Rust和async的下一代嵌入式框架，让开发者编写安全、正确、节能的嵌入式代码更高效。它利用Rust的内存安全特性，通过async/await实现无动态内存分配的多任务处理，替代传统RTOS。支持STM32、nRF52、RP2040等多种微控制器，提供硬件抽象层（HAL）、网络栈（TCP/UDP）、蓝牙（BLE）、LoRa和USB等功能，并内置低功耗设计，自动休眠核心以延长电池寿命，显著简化开发流程并提升性能。

原文链接：Hacker News

1小时前
xAI发布Grok Build CLI工具，进军编程代理市场

xAI宣布即将推出Grok Build，一个基于Grok的CLI工具，预计晚些时候发布。该工具支持Web UI，并计划引入远程编程代理功能。同时，Grok Code也将升级至可能的新版本Grok Code 2。这一发布标志着xAI在AI编程工具领域的扩展，旨在提升开发者效率和体验。社区讨论显示，用户对早期版本表示关注，期待其正式落地。该工具将强化AI代理在代码生成和自动化中的作用，为开发者提供更智能的编程支持。

原文链接：Linux.do

1小时前
Google AI Studio反代理测试版发布，邀用户测bug

Google AI Studio的反代理工具预览版测试已启动，邀请用户参与测试以发现潜在bug。该工具版本为aistudio-gemini-proxy-v4.0-Preview（test），文件大小90.6 KB，社区已有2个帖子参与讨论。此工具可能帮助用户更安全地访问Google AI服务，提升AI开发体验。测试旨在通过社区反馈优化工具稳定性，推动AI技术在实际应用中的普及。

原文链接：Linux.do

1小时前
FinePDFs：3TB数据库赋能AI训练，覆盖4.75亿PDF文档

FinePDFs是一个专注于PDF文档的数据集项目，爬取了2013至2025年间的PDF文件，经过数据清洗与标记后，构建了一个包含1733种语言、规模达4.75亿文档的数据库。团队发现当前AI模型训练内容中PDF文档占比仅0.6%，但大量技术文档和理论文件以PDF格式存在，因此该项目旨在填补这一空白。该数据集对AI模型训练有重要帮助，相关技术说明和数据库可在Hugging Face平台访问。

原文链接：Linux.do

2小时前
NVIDIA发布Music Flamingo模型，AI助力音乐解析

NVIDIA正式推出Music Flamingo模型，一款基于AI的音乐分析工具。用户可上传音乐文件或粘贴YouTube链接，系统自动解析音乐的类型、乐器、情绪、歌词等细节。该模型依托Hugging Face平台，提供开源接口和在线演示功能，旨在降低音乐理解门槛，为创作者和爱好者提供专业级分析支持。这一创新展示了AI在音乐领域的深度应用，预示着音乐产业智能化转型的加速趋势。

原文链接：Linux.do

2小时前
Magic Leap绕过Nvidia安全链，破解特斯拉自动驾驶

Hacker News帖子讨论Magic Leap如何绕过Nvidia的安全启动链并破解Tesla的Autopilot系统。评论中，用户分享相关演讲链接，并指出Magic Leap虽已破产但仍在运营，沦为与Google合作的空壳，效果极差。用户怀念90年代科技乐观主义，认为现在仅剩Meta、Google和Apple等巨头垄断行业，凸显AR创新困境与科技巨头统治。

原文链接：Hacker News

2小时前

十年稳如初 — LocVPS，用时间证明实力

10+ 年老牌云主机服务商，全球机房覆盖，性能稳定、价格厚道。

老品牌，更懂稳定的价值你的第一台云服务器，从 LocVPS 开始