智谱 GLM，支持多语言、多任务推理。从写作到代码生成，从搜索到知识问答，AI 生产力的中国解法。

AI工程师英文学习小抄

一、词符切分

Tokenization (n. 词符切分)：把句子切成一个个小零件

术语	含义
token	语言的小积木
Byte-pair Encoding	聪明的字节对编码方法
Byte Latent Transformer	补丁比词符扩展得更好

二、矢量化

Vectorization (n. 矢量化)：把文字、图片、声音都变成数字

模型	说明
BERT	深度双向转换器的语言理解大师
IMAGEBIND	一个嵌入空间捆绑所有模态
SONAR	句子级别的多模态表示
FAISS	海量数据相似性搜索库

三、基础设施

Infrastructure (n. 基础设施)：AI系统的地基

工具	用途
TensorFlow	谷歌的机器学习框架
Milvus DB	向量搜索专用数据库
Ray	分布式应用框架

四、核心架构

Core Architecture (n. 核心架构)：AI的大脑设计

技术	说明
Attention is All You Need	注意力机制时代的宣言
FlashAttention	像闪电一样快的注意力算法
Multi-Query Attention	多查询注意力
Grouped-Query Attention	分组查询注意力

五、混合专家

Mixture of Experts (n. 混合专家)：多个”专家”模型各显神通

模型	特点
Sparsely-Gated MoE	稀疏激活的混合专家层
GShard	谷歌的分片训练技术
Switch Transformers	带开关的Transformer

六、人类反馈强化学习

RLHF (Reinforcement Learning from Human Feedback)：让AI懂礼貌、会说话

论文	内容
Deep RL with Human Feedback	AI的情商培养皿
Fine-Tuning LMs with RLHF	用人类反馈微调模型

七、思维链

Chain of Thought (n. 思维链)：让AI一步一步思考

技术	说明
CoT Prompting	激发大模型推理能力
Demystifying Long CoT	揭秘长思维链推理过程

八、推理能力

Reasoning (n. 推理)：衡量AI智能的重要标准

论文	核心观点
Transformer Reasoning Capabilities	探索推理能力上限
Scale model test times > scale parameters	测试次数比参数量更重要

九、模型优化

Optimizations (n. 优化)：让模型跑得更快、吃得更少

技术	效果
1.58-bit LLMs	极致压缩，所有大模型都在1.58比特内
FlashAttention-3	更快更准，支持异步和低精度
Speculative Decoding	推测性解码，加速生成

十、知识蒸馏

Distillation (n. 蒸馏)：把大模型的知识提炼给小模型

方法	说明
Distilling Knowledge in NN	祖师爷的配方
BYOL – Distilled	自学成才还能当老师

十一、状态空间模型

SSMs (State Space Models)：Transformer的新兴挑战者

模型	特点
RWKV	Transformer时代重新发明RNN
Mamba	像曼巴蛇一样快速
LoLCATs	低秩线性化

十二、模型竞赛

Competition Models (n. 竞争模型)：AI界的奥林匹克

赛事	说明
Google Math Olympiad	数学AI挑战
Competitive Programming with LRM	编程竞赛

十三、炒作与质疑

Hype Makers & Breakers (n. 吹鼓手与泼冷水)：理性看待AI

观点	代表
语言不等于智能	Language is not intelligence
区分交流与智能	Separating communication from intelligence

十四、图像Transformer

Image Transformers (n. 图像转换器)：让AI看懂图片

模型	说明
Image is 16×16 word	把图像当文字处理
CLIP	文字和图像手拉手

十五、视频Transformer

Video Transformers (n. 视频转换器)：理解动态视觉

模型	用途
ViViT	专为视频打造的视觉Transformer
VideoJAM	Facebook的AI视频生成

十六、实际案例

Case Studies (n. 案例研究)：AI在真实世界的应用

公司	应用
Meta	自动改进单元测试
OpenAI	o1系统、Swarm集群
Netflix	个性化推荐基础模型
Uber	queryGPT查询优化

参考链接
– 原文：https://docs.80aj.com/docs/AI%20%E5%B7%A5%E7%A8%8B%E5%B8%88%E7%9A%84%E5%A5%87%E5%B9%BB%E6%BC%82%E6%B5%81%EF%BC%9A%E4%B8%80%E4%BB%BD%E5%B8%A6%E6%A2%97%E7%9A%84%E8%8B%B1%E6%96%87%E5%AD%A6%E4%B9%A0%E5%B0%8F%E6%8A%84.html

AI工程师英文学习小抄

AI工程师英文学习小抄

一、词符切分

二、矢量化

三、基础设施

四、核心架构

五、混合专家

六、人类反馈强化学习

七、思维链

八、推理能力

九、模型优化

十、知识蒸馏

十一、状态空间模型

十二、模型竞赛

十三、炒作与质疑

十四、图像Transformer

十五、视频Transformer

十六、实际案例

相关推荐

评论抢沙发

作者介绍

Toy

文章目录

置顶推荐

前沿哨所

GitHub Copilot实战：一键生成DDNS动态解析脚本

告别大模型内卷：寻找低成本、易获取的“小模型”API方案

Claude Code 支持热切换，CC Switch 实现多 AI 终端统一管理

claudecode新增Windows任务完成通知，点击快速跳转

Kiro-Gateway发布：修复接口缺陷，支持Cursor调用免费Claude模型

想生成法新社风格大片？这份Gemini提示词请收好

最新文章

热门专题

热门标签

网站统计

最新评论

十年稳如初 — LocVPS，用时间证明实力

10+ 年老牌云主机服务商，全球机房覆盖，性能稳定、价格厚道。

AI工程师英文学习小抄

一、词符切分

二、矢量化

三、基础设施

四、核心架构

五、混合专家

六、人类反馈强化学习

七、思维链

八、推理能力

九、模型优化

十、知识蒸馏

十一、状态空间模型

十二、模型竞赛

十三、炒作与质疑

十四、图像Transformer

十五、视频Transformer

十六、实际案例

相关推荐

评论 抢沙发

作者介绍

Toy

文章目录

置顶推荐

前沿哨所

GitHub Copilot实战：一键生成DDNS动态解析脚本

告别大模型内卷：寻找低成本、易获取的“小模型”API方案

Claude Code 支持热切换，CC Switch 实现多 AI 终端统一管理

claudecode新增Windows任务完成通知，点击快速跳转

Kiro-Gateway发布：修复接口缺陷，支持Cursor调用免费Claude模型

想生成法新社风格大片？这份Gemini提示词请收好

最新文章

热门专题

热门标签

网站统计

最新评论

十年稳如初 — LocVPS，用时间证明实力

10+ 年老牌云主机服务商，全球机房覆盖，性能稳定、价格厚道。

评论抢沙发