R

AI技术底层逻辑 v2 - 索引

创建 2026-05-13 更新 2026-05-18 40 条双链 共创

AI 技术底层逻辑 v2 — 索引

本文档的源内容来自 Google Doc《AI 技术底层逻辑与模型范式解析(v2)》,by Claude Opus 4.6。为便于在 Obsidian 中建立知识关联,已按章节拆分为独立页面,并为跨章关键概念建立了独立概念卡。


章节地图

#章节核心关联
01认知重构:从确定性系统到概率系统幻觉SFTEmbedding
02Tokenization 与词表工程Tokenization
03Transformer 核心机制与注意力变体AttentionKV CacheSoftmax
04模型训练全阶段 Pipeline预训练SFTScaling Laws对齐RAG
05算力物理定律与 KV CacheKV Cache自回归GQA 联动
06架构演进:后 Transformer 时代的抉择MoESSM vs Attention
07量化与端侧部署量化QLoRAKV Cache 量化
08解码策略与生成控制TemperatureFunction CallingAgent
09RAG 架构的工程解构与非参数化记忆RAGEmbedding 检索LLM 基础
10Agent 技术栈与工具调用AgentFunction Calling
11System 2 思维、强化学习与产品范式重构Test-Time Compute算力转移RL
12多模态融合与具身智能自回归CLIP视觉 Tokenization
13彻底祛魅:为什么”幻觉”无法被彻底消除?幻觉Softmax 本质对齐税
14模型评估体系的重构与 Goodhart 陷阱校准SFT 过拟合Benchmark 通胀
15数据墙与后训练霸权Scaling Laws预训练合成数据

核心概念卡

概念涉及章节一句话定位
Attention 机制c03, c05, c06, c12Transformer 的”我在找什么/我能提供什么”机制
Tokenizationc02, c03, c09, c12模型”看到”世界的底层分词方式
KV Cachec03, c05, c07决定并发上限的显存物理约束
Scaling Lawsc04, c14, c15模型性能与参数量/数据量的幂律关系
PEFT / LoRA 微调c04, c07低成本微调的主流工程方案
RLHF / DPO 对齐c04, c13, c15将模型行为与人类偏好对齐的方法
量化 Quantizationc04, c05, c07精度压缩换取推理速度和端侧可行
RAG 检索增强生成c04, c09, c13外挂”硬盘”给 LLM 的非参数化记忆
Agent 与工具调用c08, c10, c11LLM 外围的规划-执行-反馈循环
System 2 / Test-Time Computec11将算力从预训练转移到推理阶段
幻觉与校准c01, c13, c14生成式模型的核心架构特性,非 Bug
预训练 Pre-trainingc04, c11, c15消耗 90%+ 算力的基座模型学习阶段
SFT 监督微调c01, c04, c09, c14教会基座模型”听懂人话、格式化输出”
Softmaxc03, c08, c13将 logits 转为概率分布的核心数学函数
自回归生成c05, c12逐个 token 预测的文本生成范式
Embedding 向量嵌入c01, c09, c12将非结构化数据映射为高维向量
强化学习 RLc04, c11, c15在 LLM 中三次出现的关键训练方法
合成数据 Synthetic Datac04, c15突破数据墙的核心手段,需防 model collapse
灾难性遗忘c04, c09微调时丢失旧知识,RAG 不引发遗忘
Function Callingc08, c10LLM 输出结构化函数调用的能力
MoE 混合专家模型c06每次推理只激活部分专家的稀疏架构

全文联动图

c01(认知重构)
  ↓ 底层机制
c02(Tokenization)←→ c03(Attention 机制)
  ↓                          ↓
c04(训练 Pipeline)←→ c05(KV Cache — GQA 联动)
  │   ├─ Scaling Laws → c15(数据墙)
  │   ├─ PEFT/LoRA  → c07(量化)
  │   └─ RLHF/DPO   → c13(幻觉与对齐税)

c06(架构演进 Dense/MoE/SSM)←→ c07(量化 → 端侧部署)

c08(解码策略)→ c10(Agent Function Calling)
  ↓                ↓
c09(RAG)      c11(System 2 + Agent = Reasoning Agent)

c12(多模态 + 具身智能)

c13(幻觉不可消除)←→ c14(评估体系)←→ c15(数据墙)

版本:v2 · 源文档:c01c15 同步自 Google Doc《AI 技术底层逻辑与模型范式解析(v2)》by Claude Opus 4.6