Karpathy神经网络01：Micrograd – 手撸一个AI大脑

本文是《Karpathy神经网络零基础课程》系列文章

← 上一篇：无 | → 下一篇：Karpathy神经网络02：Makemore – 语言模型入门

这不仅是一个视频总结，更是一堂为你量身定制的 AI 原理启蒙课。

视频的作者是大名鼎鼎的 AI 大神 Andrej Karpathy（特斯拉前 AI 总监，OpenAI 创始成员）。他在这堂课里做了一件非常酷的事情：他不只是教你“怎么用”AI，而是带你从零开始，用 Python 代码手写了一个微型的“AI 大脑”——Micrograd。

如果把当今强大的 AI（如 ChatGPT）比作一辆法拉利，那么 Micrograd 就是一个用乐高积木拼出来的迷你电动车。虽然它很小，但它运行的核心原理和法拉利是一模一样的！

以下是为你整理的“初中生也能懂”的 AI 核心原理与造车指南：

在写代码之前，你需要理解几个让电脑学会思考的关键概念：

1. 导数 (Derivative) = “敏感度”

书本定义： 函数在某一点的切线斜率。
Karpathy 的通俗解释： 想象你在调收音机的音量旋钮。导数就是告诉你：“如果我把这个旋钮（输入）往右稍微拧一点点，音乐声（输出）会变大还是变小？变多少？”
在 AI 里，导数告诉我们：如果稍微调整一下神经元的连接强度，最后的预测结果会变好还是变坏。

2. 损失函数 (Loss Function) = “错题本的打分”

AI 刚开始是“笨蛋”，它猜的答案通常是错的。
损失函数用来衡量“它错得有多离谱”。如果在考 100 分的试卷上，AI 预测它是 0 分，那“损失”就很高。我们的目标是把这个“损失”降到最低（接近 0）。

3. 反向传播 (Backpropagation) = “找背锅侠” (全片最核心！)

4. 链式法则 (Chain Rule) = “传话游戏”

Andrej 在视频中带大家写了一个叫 micrograd 的库，步骤如下：

我们不能直接用普通的数字。我们需要一种“神奇数字”，它不仅知道自己是多少（比如 3.0），还知道它是怎么来的。

一个神经元就是一个简单的数学公式：

输出 = 激活函数 ( 输入 × 权重 + 偏置 )

权重 (Weight): 也就是连接的粗细。这正是 AI 真正“学习”和“记忆”的地方。
激活函数 (Activation Function): 视频里用了 tanh。它的作用是把输出限制在 -1 到 1 之间，模拟生物神经元的“激活”状态（要么兴奋，要么抑制）。

这是最精彩的“教学”时刻。Andrej 写了一个循环，让 AI 反复练习。这个过程分为四步，一定要记住：

重复这个过程 20 次、100 次……你会发现 Loss 越来越小，AI 从瞎猜变成了神算子！

在视频最后，Andrej 故意（或者不小心）犯了一个经典的错误，这是给初学者的重要一课：

错误： 他忘记在每一轮训练前“清零梯度” (zero_grad)。
后果： 就像你做算术题，做完第一题没擦黑板，直接在上面叠着写第二题，结果数字全乱套了。在代码里，这意味着上一轮的“错误指引”累加到了这一轮，导致 AI 学习方向跑偏。
教训： 在调用 backward() 之前，一定要把之前的梯度清零！这是写 AI 代码最容易犯的错。

看完这个视频，你不再是一个只会调用工具的“调包侠”，你已经理解了 AI 的灵魂：

给初中生的建议： 不要被“微积分”这个词吓跑！Andrej 在视频里证明了，只需要高中甚至初中的代数知识，配合代码，你就能直观地看到数学是如何让机器产生智慧的。

返回系列总览