目录

1. 传统深度学习 9
1.1 基础概念 5
1.1.1 训练基础 1
1.1.2 模型训练流程 1
1.1.3 激活函数 1
1.1.4 正则化 1
1.1.5 知识蒸馏 1
1.2 序列模型 3
1.2.1 RNN / LSTM 1
1.2.2 xLSTM 2
1.3 工程实践 1
1.3.1 PyTorch 1
2. 大模型技术 30
2.1 学习路线 3
2.1.1 LLM 知识库 2
2.1.2 大语言模型速成 1
2.2 模型架构与基础 9
2.2.1 Transformer 架构 1
2.2.2 Attention 4
2.2.3 LLaMA 1
2.2.4 MoE 1
  • MoE
2.2.5 Embedding 2
2.3 训练与微调 2
2.3.1 预训练 1
2.3.2 参数高效微调 1
2.4 训练基础设施 3
2.4.1 GPU 通信 1
2.4.2 并行策略 2
2.5 推理与部署 13
2.5.1 确定性推理 2
2.5.2 不确定性 1
2.5.3 解码策略 1
2.5.4 KV Cache 4
2.5.5 推理压测 1
2.5.6 显存估算 1
2.5.7 量化 3
3. RAG 13
3.1 基础与流程 2
3.1.1 基础概念 1
3.1.2 系统流程 1
3.2 检索与排序 5
3.2.1 Query 改写 1
3.2.2 检索排序 1
3.2.3 混合检索 3
3.3 图谱与框架 3
3.3.1 GraphRAG 1
3.3.2 LangChain 1
3.3.3 LightRAG 1
3.4 Prompt与评测 2
3.4.1 Prompt 1
3.4.2 评测 1
3.5 先进方法 1
3.5.1 先进方法 1
4. 强化学习与对齐 6
4.1 偏好优化 1
4.1.1 DPO 1
4.2 策略优化 3
4.2.1 GRPO 1
4.2.2 PPO 2
  • PPO
  • PPO
4.3 价值学习 2
4.3.1 Q-learning 2
5. 智能体应用开发 11
5.1 Agent 工具链 4
5.1.1 Skill 2
5.1.2 MCP 2
5.2 多智能体框架 2
5.2.1 MetaGPT 2
5.3 AI 编程工具 5
5.3.1 Claude Code / Codex 5
6. 热点问题分析 1
6.1 模型输出异常 1
6.1.1 输出异常分析 1
7. 算法与面试 1
7.1 算法面试 1
7.1.1 算法面试 1