目录
1.
传统深度学习
9
1.1
基础概念
5
1.1.1
训练基础
1
1.1.2
模型训练流程
1
1.1.3
激活函数
1
1.1.4
正则化
1
1.1.5
知识蒸馏
1
1.2
序列模型
3
1.2.1
RNN / LSTM
1
1.2.2
xLSTM
2
1.3
工程实践
1
1.3.1
PyTorch
1
2.
大模型技术
30
2.1
学习路线
3
2.1.1
LLM 知识库
2
2.1.2
大语言模型速成
1
2.2
模型架构与基础
9
2.2.1
Transformer 架构
1
2.2.2
Attention
4
2.2.3
LLaMA
1
2.2.4
MoE
1
2.2.5
Embedding
2
2.3
训练与微调
2
2.3.1
预训练
1
2.3.2
参数高效微调
1
2.4
训练基础设施
3
2.4.1
GPU 通信
1
2.4.2
并行策略
2
2.5
推理与部署
13
2.5.1
确定性推理
2
2.5.2
不确定性
1
2.5.3
解码策略
1
2.5.4
KV Cache
4
2.5.5
推理压测
1
2.5.6
显存估算
1
2.5.7
量化
3
3.
RAG
13
3.1
基础与流程
2
3.1.1
基础概念
1
3.1.2
系统流程
1
3.2
检索与排序
5
3.2.1
Query 改写
1
3.2.2
检索排序
1
3.2.3
混合检索
3
3.3
图谱与框架
3
3.3.1
GraphRAG
1
3.3.2
LangChain
1
3.3.3
LightRAG
1
3.4
Prompt与评测
2
3.4.1
Prompt
1
3.4.2
评测
1
3.5
先进方法
1
3.5.1
先进方法
1
4.
强化学习与对齐
6
4.1
偏好优化
1
4.1.1
DPO
1
4.2
策略优化
3
4.2.1
GRPO
1
4.2.2
PPO
2
4.3
价值学习
2
4.3.1
Q-learning
2
5.
智能体应用开发
11
5.1
Agent 工具链
4
5.1.1
Skill
2
5.1.2
MCP
2
5.2
多智能体框架
2
5.2.1
MetaGPT
2
5.3
AI 编程工具
5
5.3.1
Claude Code / Codex
5
6.
热点问题分析
1
6.1
模型输出异常
1
6.1.1
输出异常分析
1
7.
算法与面试
1
7.1
算法面试
1
7.1.1
算法面试
1