AI 技术底层逻辑 v2 — 索引

本文档的源内容来自 Google Doc《AI 技术底层逻辑与模型范式解析（v2）》，by Claude Opus 4.6。为便于在 Obsidian 中建立知识关联，已按章节拆分为独立页面，并为跨章关键概念建立了独立概念卡。

章节地图

#	章节	核心关联
01	认知重构：从确定性系统到概率系统	→ 幻觉、SFT、Embedding
02	Tokenization 与词表工程	→ Tokenization
03	Transformer 核心机制与注意力变体	→ Attention、KV Cache、Softmax
04	模型训练全阶段 Pipeline	→ 预训练、SFT、Scaling Laws、对齐、RAG
05	算力物理定律与 KV Cache	→ KV Cache、自回归、GQA 联动
06	架构演进：后 Transformer 时代的抉择	→ MoE、SSM vs Attention
07	量化与端侧部署	→ 量化、QLoRA、KV Cache 量化
08	解码策略与生成控制	→ Temperature、Function Calling、Agent
09	RAG 架构的工程解构与非参数化记忆	→ RAG、Embedding 检索、LLM 基础
10	Agent 技术栈与工具调用	→ Agent、Function Calling
11	System 2 思维、强化学习与产品范式重构	→ Test-Time Compute、算力转移、RL
12	多模态融合与具身智能	→ 自回归、CLIP、视觉 Tokenization
13	彻底祛魅：为什么”幻觉”无法被彻底消除？	→ 幻觉、Softmax 本质、对齐税
14	模型评估体系的重构与 Goodhart 陷阱	→ 校准、SFT 过拟合、Benchmark 通胀
15	数据墙与后训练霸权	→ Scaling Laws、预训练、合成数据

核心概念卡

概念	涉及章节	一句话定位
Attention 机制	c03, c05, c06, c12	Transformer 的”我在找什么/我能提供什么”机制
Tokenization	c02, c03, c09, c12	模型”看到”世界的底层分词方式
KV Cache	c03, c05, c07	决定并发上限的显存物理约束
Scaling Laws	c04, c14, c15	模型性能与参数量/数据量的幂律关系
PEFT / LoRA 微调	c04, c07	低成本微调的主流工程方案
RLHF / DPO 对齐	c04, c13, c15	将模型行为与人类偏好对齐的方法
量化 Quantization	c04, c05, c07	精度压缩换取推理速度和端侧可行
RAG 检索增强生成	c04, c09, c13	外挂”硬盘”给 LLM 的非参数化记忆
Agent 与工具调用	c08, c10, c11	LLM 外围的规划-执行-反馈循环
System 2 / Test-Time Compute	c11	将算力从预训练转移到推理阶段
幻觉与校准	c01, c13, c14	生成式模型的核心架构特性，非 Bug
预训练 Pre-training	c04, c11, c15	消耗 90%+ 算力的基座模型学习阶段
SFT 监督微调	c01, c04, c09, c14	教会基座模型”听懂人话、格式化输出”
Softmax	c03, c08, c13	将 logits 转为概率分布的核心数学函数
自回归生成	c05, c12	逐个 token 预测的文本生成范式
Embedding 向量嵌入	c01, c09, c12	将非结构化数据映射为高维向量
强化学习 RL	c04, c11, c15	在 LLM 中三次出现的关键训练方法
合成数据 Synthetic Data	c04, c15	突破数据墙的核心手段，需防 model collapse
灾难性遗忘	c04, c09	微调时丢失旧知识，RAG 不引发遗忘
Function Calling	c08, c10	LLM 输出结构化函数调用的能力
MoE 混合专家模型	c06	每次推理只激活部分专家的稀疏架构

全文联动图

c01（认知重构）
  ↓ 底层机制
c02（Tokenization）←→ c03（Attention 机制）
  ↓                          ↓
c04（训练 Pipeline）←→ c05（KV Cache — GQA 联动）
  │   ├─ Scaling Laws → c15（数据墙）
  │   ├─ PEFT/LoRA  → c07（量化）
  │   └─ RLHF/DPO   → c13（幻觉与对齐税）
  ↓
c06（架构演进 Dense/MoE/SSM）←→ c07（量化 → 端侧部署）
  ↓
c08（解码策略）→ c10（Agent Function Calling）
  ↓                ↓
c09（RAG）      c11（System 2 + Agent = Reasoning Agent）
  ↓
c12（多模态 + 具身智能）
  ↓
c13（幻觉不可消除）←→ c14（评估体系）←→ c15（数据墙）

版本：v2 · 源文档：c01 → c15 同步自 Google Doc《AI 技术底层逻辑与模型范式解析（v2）》by Claude Opus 4.6

AI技术底层逻辑 v2 - 索引

AI 技术底层逻辑 v2 — 索引

章节地图

核心概念卡

全文联动图