标签

标签云

输入关键词快速筛选标签和对应文章。

Attention 4

MHA 1

GQA 1

MQA 1

MLA 1

Flash Attention 2

Tiling 1

SRAM 1

HBM 1

Transformer 架构 1

Encoder-only 1

Decoder-only 1

低秩退化 1

注意力矩阵 1

LLaMA 1

Tokenization 3

Embedding 5

Transformer 1

Query 改写 1

Query 扩展 1

HyDE 2

检索增强 4

预训练 1

数据清洗 1

训练流程 2

算法 2

面试 1

复杂度 1

数据结构 1

训练基础 1

Loss 1

梯度 1

参数 1

优化器 1

正则化 1

Dropout 1

过拟合 1

泛化 1

模型训练流程 1

深度学习 2

前向传播 1

反向传播 1

激活函数 1

ReLU 1

Sigmoid 1

非线性 1

GPU 通信 1

GPU 1

显存 2

并行训练 2

知识蒸馏 1

黑盒蒸馏 1

白盒蒸馏 1

Teacher-Student 1

多头注意力 1

交叉注意力 1

线性注意力 1

RNN / LSTM 1

RNN 1

LSTM 3

门控机制 1

序列建模 1

并行策略 2

FSDP 1

参数分片 1

分布式训练 1

ZeRO 1

数据并行 1

张量并行 1

流水线并行 1

MoE 1

专家混合 1

门控网络 1

稀疏激活 1

BGE 1

FlagEmbedding 1

稀疏向量 1

微调 2

对比学习 1

向量模型 1

确定性推理 2

SGLang 2

推理稳定性 2

采样 3

启动参数 1

推理部署 3

不确定性 1

LLM 5

解码策略 1

推理加速 1

生成质量 1

检索排序 1

Rerank 2

召回 1

重排序 2

输出异常分析 1

Token 1

热点问题 1

Paged Attention 1

KV Cache 5

推理优化 3

Key 1

Value 1

显存优化 2

PD 分离 1

缓存命中 1

请求示例 1

推理流程 1

缓存 1

Prefill 1

Decode 1

推理阶段 1

参数高效微调 1

BPE 1

LoRA 1

推理压测 1

vLLM 1

压测 1

吞吐量 1

显存估算 1

参数量 1

容量规划 1

GraphRAG 1

知识图谱 2

实体关系 1

LangChain 1

Chain 1

应用开发 1

LightRAG 2

流程分析 1

Prompt 1

中文提示词 1

基础概念 1

检索 1

知识库 2

术语 1

系统流程 1

系统设计 1

检索流程 1

混合检索 3

BM25 3

向量检索 2

评测 1

RAGAS 1

RAG 评测 1

指标 1

问答质量 1

检索策略 1

RRF 2

线性加权 1

量化 3

BF16 1

FP16 1

INT8 1

GPTQ 1

AWQ 1

QA 1

INT4 1

DPO 1

偏好学习 1

RLHF 3

对齐 1

GRPO 1

强化学习 5

奖励模型 1

LLM 知识库 2

全栈知识库 2

博客 2

PPO 2

策略梯度 2

Q-learning 2

价值函数 2

Bellman 方程 2

Skill 3

Agent 6

工具调用 2

自动化 2

Q&A 1

工具链 1

MCP 2

MetaGPT 2

PRD 1

多智能体 2

需求生成 1

辩论 1

自定义流程 1

Claude Code / Codex 5

Claude Code 2

上下文压缩 2

开发工具 4

Codex 1

Compact 1

Hook 1

钩子 1

TodoWrite 1

任务管理 1

大语言模型速成 1

大语言模型 1

入门指南 1

PyTorch 1

张量维度 1

维度转换 1

xLSTM 2

mLSTM 1

System Prompt 1

Prompt Cache 1

Streamable HTTP 1

SSE 1

stdio 1

JSON-RPC 1