🏗️
体系化知识架构
从基础数学到前沿技术,六大模块系统覆盖大模型全栈知识。不是碎片化的博客合集,而是一本完整的在线教材。
| 模块 | 内容 | 适合人群 |
|---|---|---|
| 基础知识 | 数学、Python、神经网络、NLP | 零基础入门 |
| 模型架构 | Transformer → GPT → Llama → DeepSeek-V3 | 所有人(核心) |
| 训练 | 预训练、SFT、RLHF/DPO/GRPO | 想训练/微调模型的人 |
| 工程化 | 推理优化、量化、分布式、评估 | 想部署模型的人 |
| 应用 | RAG、Agent、多模态 | 想做应用的人 |
| 深度剖析 | 开源项目源码分析 | 想深入理解的人 |
适合有编程基础、想快速了解 LLM 核心技术的人:
数学基础(选读) → Transformer → 注意力机制 → 分词器 → GPT 架构
→ 预训练 → 推理优化 → Prompt Engineering按模块顺序学完全部内容,从零到一建立完整知识体系:
基础知识(全部) → 模型架构(全部) → 训练(全部) → 工程化(全部)
→ 应用(全部) → 深度剖析 → 练习系统聚焦每章的"面试考点"和"苏格拉底时刻":
Day 1: Transformer + Attention + 分词器 + 解码策略(架构核心)
Day 2: 预训练 + SFT + RLHF/DPO + LoRA(训练核心)
Day 3: KV Cache + PagedAttention + 量化 + 分布式(工程核心)本项目的核心理念:不只是看懂,更要写得出来。
每个知识点都遵循:概念理解 → 代码阅读 → 代码填空 → 独立实现 的渐进路径。