LLM 101大模型体系化教程

从 Transformer 到 RLHF，系统掌握大语言模型的核心技术

🏗️

体系化知识架构

从基础数学到前沿技术，六大模块系统覆盖大模型全栈知识。不是碎片化的博客合集，而是一本完整的在线教材。

💻

每个核心概念都配有从零实现的代码，做到概念与实践紧密结合。理解原理，更要能写出来。

🧠

通过引导性提问促进深度思考。配套四级渐进练习系统：选择题 → 代码填空 → 模块实现 → 完整实现。

🔬

深入阅读 vLLM 等开源项目源码，发现设计精妙之处与潜在问题，培养工程批判性思维。

模块	内容	适合人群
基础知识	数学、Python、神经网络、NLP	零基础入门
模型架构	Transformer → GPT → Llama → DeepSeek-V3	所有人（核心）
训练	预训练、SFT、RLHF/DPO/GRPO	想训练/微调模型的人
工程化	推理优化、量化、分布式、评估	想部署模型的人
应用	RAG、Agent、多模态	想做应用的人
深度剖析	开源项目源码分析	想深入理解的人

适合有编程基础、想快速了解 LLM 核心技术的人：

数学基础(选读) → Transformer → 注意力机制 → 分词器 → GPT 架构
→ 预训练 → 推理优化 → Prompt Engineering

按模块顺序学完全部内容，从零到一建立完整知识体系：

基础知识(全部) → 模型架构(全部) → 训练(全部) → 工程化(全部) 
→ 应用(全部) → 深度剖析 → 练习系统

聚焦每章的"面试考点"和"苏格拉底时刻"：

Day 1: Transformer + Attention + 分词器 + 解码策略（架构核心）
Day 2: 预训练 + SFT + RLHF/DPO + LoRA（训练核心）
Day 3: KV Cache + PagedAttention + 量化 + 分布式（工程核心）

本项目的核心理念：不只是看懂，更要写得出来。

每个知识点都遵循：概念理解 → 代码阅读 → 代码填空 → 独立实现 的渐进路径。