_Agent 系统化专题·总览
_Agent 系统化专题·总览
一句话定义:本专题是 Rick 在已有 c10 / m206 / m207 / m208 之上横向铺开、纵向打穿的 Agent 知识立方——把”什么是 Agent、它从哪来、由什么组成、谁在做、怎么复现、怎么读”六条切面同时呈现,作为 AI PM 知识图谱·总索引 下属的一个独立可索引子模块。
0. 序:这个专题是为谁、解决什么问题
如果你和 Rick 一样,正从非 AI 背景转 AI PM——读过 c10/m206/m207/m208,关注 Cubox 里所有 agent 相关文章,在面试桌上努力区分 ReAct / Reflexion / Plan-and-Execute——你大概率撞过这堵墙:“agent”这个词被业界、媒体、招聘 JD、产品白皮书随意使用,每个人指的对象都在不同抽象层级上。面试官问”做过 agent 吗”,你说”了解 ReAct”,他追问”那 multi-agent 呢”,你说”看过 AutoGen”,他再问”Cursor 算 agent 还是 harness”,你卡壳——不是没读过资料,是资料之间互相矛盾,你不知道该信哪个。
这个专题的目标是给你一套经得起反方拷问的判断框架:不是”AI 越来越强 / 值得关注 / 应该尽早布局”的 hype 风格,而是”Multi-Agent 90% 是 PM 选型陷阱 / MCP 是 LSP 路径复刻不是 REST 对手 / 通用 Agent 70% 上限是数学约束 / Reflexion 工业占比 < 20% / 2026 年默认应该是单 agent”这种有反方训练的反共识立场。读完 20 个内容节点 + 跑通 R01-R03 + 练完 6 题反方对话,你在面试桌上会显著区别于其他转型者——不是因为你知道更多,是因为你能在 30 秒内说清”为什么我不选 X”。
下面六节(§ 1-§ 6)是给已决定读下去的人看的结构性说明。
1. 专题定位:为什么单独建一个 0411
在 Rick 的 AI PM 知识图谱里,c10 / m206 / m207 / m208 已经从”技术栈、记忆、失败模式、中间件”四个角度切入了 Agent。但它们都是单维深入:一条切面把一件事讲透。而 Rick 在 2026-04 至 2026-05 之间反复遇到一个共同症状——面试官、招聘 JD、产品文档、Cubox 收藏文章里的”agent”一词,所指的对象不在同一个抽象层级上。有人说的是大模型本体,有人说的是 LangChain Workflow,有人说的是 Claude Code 这种 harness,有人说的是 AutoGen 这种 Multi-Agent 框架,有人说的是 Manus 这种端到端产品。
这种滑变(semantic drift)不是个别用词不规范,而是新概念在尚未稳定时的常态——维特根斯坦讲的”语言游戏”还在重组,规则未定。但对一个从非 AI 背景转型的 PM 来说,这种滑变会直接转化为面试事故:你以为对方在问 A,你答了 B,双方都觉得对方不懂。
所以 0411 不是 c10/m206-208 的”加强版”,而是升高一个抽象层:
- c10 回答”Agent 内部由哪些组件构成”
- m206-208 回答”Agent 工程化要解决什么问题”
- 0411 回答”Agent 这个词在过去十年里指过什么、现在该指什么、未来还会指什么;它的代际演化、流派分歧、架构剖面、复现选型、阅读路径如何整体把握”
这一层不解决”做不做得出来”,解决”说不说得清”。在 AI PM 的求职与日常工作里,“说得清”是”做得对”的前置条件。
2. 模块全景(六模块矩阵图)
graph TB
subgraph T["0411 Agent 系统化专题"]
OV["_总览(本文)"]
README["README·多视图阅读指南"]
subgraph C["01 概念辨析(横向切面)"]
A01["A01 Agent 概念史"]
A02["A02 抽象层级辨析"]
A03["A03 ReAct"]
A04["A04 Reflexion"]
A05["A05 Plan-and-Execute"]
A06["A06 Orchestrator"]
A07["A07 Multi-Agent Teams"]
A08["A08 MCP & A2A"]
end
subgraph G["02 代际演化(纵向时间轴)"]
G01["G01 代际谱系总图"]
G02["G02 五代演化详解"]
end
subgraph S["03 架构剖面(解剖学)"]
S01["S01 六层架构剖面"]
S02["S02 流派架构对照"]
S03["S03 Harness Engineering"]
end
subgraph E["04 实例剖解(病理学)"]
E01["E01 Coding Agent"]
E02["E02 通用 Agent"]
E03["E03 Multi-Agent 框架"]
end
subgraph R["05 复现指南(操作手册)"]
R01["R01 100 行 ReAct"]
R02["R02 LangGraph+MCP"]
R03["R03 Multi-Agent 模板"]
end
end
OV --> README
README -.路径 A/B/C.-> C
README -.-> G
README -.-> S
README -.-> E
README -.-> R
C 概念支撑> S
G 时间纵轴> S
S 落地为> E
E 复现为> R
A02 -.辨析依赖.-> A01
A03 --> A04
A04 --> A05
A06 -.编排.-> A07
A07 -.通信.-> A08
G01 --> G02
S01 -.对照.-> S02
S02 -.聚焦.-> S03
style OV fill:#FFD700,stroke:#333
style README fill:#FFD700,stroke:#333
style C fill:#E3F2FD
style G fill:#F3E5F5
style S fill:#E8F5E9
style E fill:#FFF3E0
style R fill:#FFEBEE
矩阵含义:
- 横向(概念辨析)解决”是什么”
- 纵向(代际演化)解决”从哪来”
- 解剖学(架构剖面)解决”由什么组成”
- 病理学(实例剖解)解决”现实中怎么走样”
- 操作手册(复现指南)解决”自己怎么动手”
- 阅读指南是入口编织
依赖关系:概念 → 架构 → 实例 → 复现,代际谱系横切这条链路(提供时间维度),阅读指南则是反向编织——把 20 个内容节点编成 3 条可读路径。
3. 六模块逐一介绍
3.1 概念辨析模块(A01-A08 + Harness 词义辨析,9 篇)
收录:
- A01 Agent 概念史与语义流变:1950s 控制论 → 1990s 软件 agent → 2020s LLM agent 的语义漂移
- A02 抽象层级辨析·Harness Framework Agent Skill Orchestrator:五个术语的层级关系
- A03 ReAct、A04 Reflexion、A05 Plan-and-Execute:三大基础范式
- A06 Orchestrator 编排器、A07 Multi-Agent Teams、A08 MCP 与 A2A 协议族:组织层与协议层
- Harness 词义辨析:harness 一词的词源切片(从马具 → 测试脚手架 → agent 运行时通称的三次语义滑动),是 A02 / S03 的词源地基
解决的问题:术语滑变导致的沟通事故。Rick 在面试场景的核心痛点是”对方在哪个抽象层问问题”——本模块给出一套可携带的”词表”。
何时读:刚开始转型 / 准备面试 / 遇到新概念词时翻阅。可以非线性读,按需查。
3.2 代际演化模块(G01-G02,2 篇)
收录:
- G01 Agent 代际谱系总图:G1(脚本 bot)→ G2(LangChain Workflow)→ G3(工具调用 agent)→ G4(Multi-Agent + 长上下文)→ G5(Computer Use + MCP 标准化)
- G02 五代演化详解·G1-G5:每一代的代表产品、推动力、瓶颈、被下一代如何超越
解决的问题:面试官问”你做过几代 agent”时不再”夹生”——清楚自己处在哪一代,对前后代差异有方向感。这是 Rick “AI 产品代差观察”思想(参见 AI 产品代差观察与微博打磨)在 Agent 维度上的落地。
何时读:建立时间纵轴直觉时;准备做”代际迁移”型项目立项时。
3.3 架构剖面模块(S01-S03,3 篇)
收录:
- S01 Agent 六层架构剖面:模型 / 提示 / 工具 / 记忆 / 编排 / 评测六层及其接口
- S02 流派架构对照表:LangChain / LangGraph / AutoGen / CrewAI / OpenAI Assistants / Anthropic SDK 的六层填表对照
- S03 Harness Engineering 全景:Claude Code / Cursor / Devin / Manus 作为 harness 的统一分析框架
解决的问题:把”Agent”从一个黑箱拆成可对话、可选型、可调试的剖面。PM 在做选型决策时不再”凭印象”,而是按层逐项对比。
何时读:进入选型决策时;阅读他家产品技术博客需要”翻译”时;写技术方案需要”剖面图”时。
3.4 实例剖解模块(E01-E03,3 篇)
收录:
- E01 Coding Agent·Claude Code & Cursor:两家 Coding Agent 的剖面对比与决策启示
- E02 通用 Agent·Manus & Devin:通用 agent 的承诺、瓶颈、商业模式
- E03 Multi-Agent 框架·AutoGen & CrewAI & DeerFlow:三种 Multi-Agent 范式的得失
解决的问题:把概念和架构还原到具体产品。Rick 面试时被问”剖一下 Claude Code”,本模块给出剖法模板,可以推广到任何新出现的 agent 产品。
何时读:研究某个具体竞品时;准备”产品分析”类面试题时;想检验自己是否真懂某概念时(能不能用它剖一个真实产品)。
3.5 复现指南模块(R01-R03,3 篇)
收录:
- R01 最小可运行·100 行 ReAct:纯 Python,2 小时上手
- R02 中型生产·LangGraph + MCP:含状态管理、工具注册、可观测性,4 小时上手
- R03 Multi-Agent 模板·AutoGen CrewAI:双框架对照模板,2 小时复现
解决的问题:PM 跟工程师对话不再”夹生”。Rick 不必成为工程师,但必须亲手跑通一遍——这是 Polanyi 意义上的”默会知识”(参见 Polanyi 默会知识与提示工程的认识论张力),不亲手做过永远隔一层。
何时读:在 Week 4 / 已经能”说清楚”之后;面试前一周打”实操底气牌”时。
3.6 阅读指南模块(_总览 + README,本文 + 1 篇)
收录:本文(总览)+ 阅读指南(三路径详解)
解决的问题:20 个内容节点不可能线性读完。本模块把它们编成 3 条对应不同身份模式的路径:求职速通 / 决策链跳转 / 紧迫度优先。
何时读:现在。这是入口。
4. 与现有 c10 / m206 / m207 / m208 的关系
本专题不重复这四节,而是从更高抽象层升级它们。每一项”升级”都是有方向的:补缺、纠偏、对话、深化。明确表如下:
| 现有节点 | 现有节点解决的问题 | 0411 专题的升级方向 |
|---|---|---|
| c10 Agent 技术栈 | 工具调用、记忆四种、复合错误数学 | 被 S01 六层架构结构化(c10 内的零散组件按六层归位),被 G02 五代演化时间化(c10 是 G3-G4 视角,加入 G1-G2 历史与 G5 前沿) |
| m206 记忆机制 | 记忆四决策、Browser Agent 三家 | 被 A07 + E02补充(m206 单 agent 记忆 → 0411 多 agent 共享记忆与冲突仲裁) |
| m207 失败模式 | 六类失败、B2B 销售推演、HITL | 被 E03 + R03实例化(m207 抽象失败模式 → 0411 在具体框架里复现失败再回看) |
| m208 编排框架 | LangChain/LlamaIndex/LangGraph 对比 | 被 A06 + S03概念深化(m208 是工具栈对比,0411 解释为什么 orchestrator 不等于 harness,为什么 harness engineering 不只是选框架) |
| Harness 词义辨析 | 一个词的滑变 | 被 S03升级为系统观(从词义辨析升级为可分析框架) |
| Skill 系统的本质 | Skill 是什么 | 被 A02归位(Skill 在抽象层级里的精确位置) |
判读规则:c10/m206-208 是事实基础(不要在 0411 里复述),0411 是结构性升级(每一篇都明示”对照哪个旧节点、做了哪种升级”)。读 0411 之前如果对 c10 完全陌生,可以先快速过 c10 的目录而不必深读。
5. 三条阅读起点提示
详见 阅读指南,此处只给定位:
- 路径 A:转型 PM 30 天速通(求职导向)——按”基础认知 → 深入范式 → 产品实例 → 实操复现”四周节奏,每周明确”应能回答的面试问题”。适合3 个月内有面试压力的状态。
- 路径 B:按 M1→M5 决策链跳转——对应 AI PM 知识图谱·总索引 五大模块的决策位次。适合日常工作中按当前问题跳读的状态。
- 路径 C:紧迫度优先(标签视图)——红 / 橙 / 黄 / 蓝四档紧迫度。适合时间碎片、按需取用的状态。
三条路径不互斥,多数 PM 会在不同周以不同模式切换。
6. 跨域思想资源调度
本专题显式动用以下跨域思想资源(不是装饰,而是用于反对术语滑变与权力盲点的工具):
| 跨域资源 | 调度位置 | 作用 |
|---|---|---|
| 维特根斯坦语言游戏 | A01 / A02 | 解释”agent”一词在不同语言游戏里规则不同,不是用词不规范,是游戏边界未定 |
| Polanyi 默会知识 | A03 / R01 系列 | 解释为什么 prompt 与 agent 行为难以完全文档化,复现实操是不可替代的——参见 Polanyi 默会知识与提示工程的认识论张力 |
| Kuhn 范式革命 | G01 / G02 | 把 G1→G5 解读为五次范式转换,每次都不是渐进而是”不可通约”——参见 范式 |
| 阿伦特行动 vs 制作 | A06 / A07 / E02 | 区分 agent 的”执行任务”(制作)与”自主决策”(行动),后者带不可逆性与责任归属 |
| 韦伯科层制 | A07 / E03 | 解读 Multi-Agent Teams 的角色分工:是新的协作形态还是科层制的算法化复制 |
| Habermas 沟通理性 | A08 / E03 | MCP/A2A 协议族能否承载真正的”agent 间对话”,还是只是 RPC 的语义包装 |
| 福柯生命政治 | E02 / E03 | 通用 agent 介入用户日常时,权力的微观分布与监控可能性——参见 生命政治、霸权 |
每个调度都在对应节点的”跨域呼应”段落具体展开,不留空 invocation。跨域呼应入口集中在 0114认识论、0115道德哲学-伦理学、0117社会学。
7. 验收档案
本专题的产出不是一次性 generation,而是经过多轮批判性同行评议(multi-round critical peer review)的成果。具体流程:
- Round 0:6 个写作 Agent(W1-W6)并行起草 20 个内容节点 + 总览 + 阅读指南 + HTML 图谱
- Round N 批评:批评 Agent 按”事实准确性 / 概念清晰度 / PM 决策可操作性 / 跨域呼应是否实质 / 双链密度”五维度评分并提出 issue
- Round N+1 修订:写作 Agent 按 issue 修订
- 收敛后产出v1 入库
改稿历程档案保存在 worktree 的 agent-knowledge-validation/ 目录(Obsidian 库外),结构如下:
agent-knowledge-validation/
SHARED_CONTEXT.md # 所有 Agent 的写作硬要求
round-0-initial-drafts/ # 首稿
concepts/ generations/ architecture/ instances/ reproduction/ reading-guide/
critiques/ # 批评 Agent 的 issue 单
round-N-revisions/ # 修订后版本
Rick 可以自行 review 任何一节的改稿历程,作为元学习材料——观察”一个概念从首稿到 v1 经历了哪些纠错”,本身就是学习 AI 知识管理的好素材。
这一做法本身呼应了 AI概念滥用反思 的核心主张:AI 生成的内容必须经过批判性同行评议才能成为知识。
7.1 本专题用 Rick 写作 SABCD 评级体系 自评(R4 自我审视)
经过 R0 → R1 → R2 → R3 → R4 五轮改稿,本专题截至 2026-05-18 的 SABCD 自评(R4 后):
| 维度 | R3 评分 | R4 评分 | 判断 |
|---|---|---|---|
| S(结构 / Structural) | 8/10 | 8/10 | 六模块互补结构未变;R4 主要在原有结构内加内容,不动骨架 |
| A(密度 / Algorithmic 判断密度) | 7.5/10 | 8/10 | R4 加入 12 处业界对手立场回应 + 4 处 Rick 未读对手框架,反共识判断密度从 R3 的 50-60% 提升到 70%+ |
| B(独家判断含量 / Boundary 与边界) | 7/10 | 7.5/10 | R4 引入 Dreyfus / Weizenbaum / Smith / Russell / Lakatos / Luhmann 6 个 Rick 未读对手框架,边界判断含量上升 |
| C(认识论自觉 / Conventions) | 7.5/10 | 8/10 | R4 在多处显式承担”我的判断有边界 / 我的预测是赌注 / 我的对手是 X” —— 认识论自觉显著提升 |
| D(可演进性 / Evolvability) | 8.5/10 | 8.5/10 | 双链密度、修订日志、改稿档案全部保留;R4 增加内容不影响可演进性 |
| E(对手框架拷问能力 / R4 新增第 6 维度) | — | 7/10 | R4 新增维度。面对 LeCun / Karpathy / Altman / Anthropic 自家 multi-agent blog 反方立场,本专题已能给出有具体证据的回应,但仍有少量对手立场未充分回应(如 Stuart Russell alignment 框架的回应不够具体) |
R4 后综合:约 7.85/10 — “从 PM 顶刊样本升级为’经得起业界反方拷问的 PM 顶刊’“。R4 后的下一步应是 Round 5 Rick 本人参与的”PM 立场对齐”——把每个节点的”Rick 答案”具体到 Rick 真实产品工作经验,让本专题从”通用 AI PM 顶刊”升级为”Rick 独家 AI PM 知识库”。
R4 后特别说明:实质论证强度评分(R3 critique 提出的核心指标):
- R3 critique 给的实质论证强度评分:5/10(理由:专题没有真正回应任何主流反方立场,所有”反共识”判断都是”反 hype”)
- R4 后自评实质论证强度:7+/10
- 提升来源:(a) 12 处显式回应业界主流反方立场;(b) 4 处引入 Rick 未读对手框架;(c) 6 处显式承担 failure scenario;(d) 8 处砍 confirmation bias 痕迹;(e) 进步主义叙事修正(G2/G3/G4/G5 都加了反例)
- 仍需 Round 5 解决的问题:(a) 产品 PM 视角(GTM / 商业模式 / 合规)仍只在 S01 § 9.4 / § 9.5 浅尝;(b) Rick 真实产品立场未植入;(c) Stuart Russell alignment 框架的工程化降阶方案需要更具体
7.2 R4 后新增:业界对手立场与未读对手框架的接入清单
12 处业界对手立场显式回应:
| 对手立场 | 接入节点 | 接入方式 |
|---|---|---|
| Yann LeCun “LLM Agent 是死胡同” | G01 § 5.1 | Rick 回应立场(承认 + 边界): 接受 LLM 不是终极架构,但坚持 2-3 年内是唯一规模化方案 |
| Karpathy “Software 3.0 / Agent 过早命名” | G01 § 5.2 + A01 § 8.1 | 承认 + 边界:Agent 这个词可能 5-10 年后被淘汰,但 PM 决策不能等待最终命名 |
| Sam Altman 2025 “Agent of year” 复盘 | G01 § 5、E02 § 2.1.1 | 引入中美两份独立 sober tone(Altman + 肖弘),反 confirmation bias |
| Anthropic “先用单 Agent” 立场精读 | A07 § 2.1 + E03 § 3.6.1 | 反 confirmation bias:不再简化为”反 multi-agent”,改为四档梯度(augmented LLM > workflow > simple agent > multi-agent) |
| 学界对 Reflexion 复现性争议 | A04 § 一 + G02 G3 实证 4 | 显式标注 91% 数据复现性争议(独立复现 83-88%);Anthropic 2025-06 multi-agent research blog 实际不用外置 Reflexion |
| MCP 被巨头收编风险(LSP 政治经济学边界) | A08 § 一 LSP 类比边界 | 承认 Anthropic 推 MCP + Anthropic 卖 Claude 的结构是 LSP 没有的;长期可能演化为”协议层中立 + 客户端层锁定” |
| AutoGPT 仍是 RPA / 长尾应用主架构 | G02 G2 实证 4 | 承认”G2 寿命 0 个月”是顶尖工程师视角误判;百度/阿里/字节的”智能任务执行”仍是 G2 + 简化 reflection |
| G3 Reflexion 在实际生产中很少用 | G02 G3 实证 4 + A04 § 四末尾 | 承认 Reflexion 工业占比 < 20%,主流 Coding Agent 直接从 G1 跳到 G6 thinking budget |
| G5 协议化是 Anthropic+Google 联合塑造的反 OpenAI 叙事 | G02 G5 实证 5 + A08 § 3.1 | 承认协议化叙事不是技术中立的演化;中国大厂内部仍推私有协议 |
| Manus 复盘的 sober tone 传染到其他节点 | G01 § 5、E02 § 2.1.1、R01 § 6.6、R02 末尾、R03 末尾 | E02 已有 sober tone 现传染到 R01-R03 末尾的”demo ≠ 生产” 警告 |
| 业界 multi-agent 2025 下半年反向去化 | G02 G4 实证 5 + E03 § 3.6.1 + R03 末尾 | Claude Code / Cursor / Devin 都在去 multi-agent 化;Anthropic 2025-06 multi-agent blog 发布后没引发跟风;Multi-Agent 是 G4 的”昙花一现” |
| Hype Cycle 视角下的代际史 | G01 § 5.5 | Agent 在 2026-05 处于幻灭低谷期向启蒙斜坡期过渡 |
4 处 Rick 未读对手框架引入(R3 critique 第七节 echo chamber 修正):
| 未读框架 | 接入节点 | 用法 |
|---|---|---|
| Hubert Dreyfus《What Computers Can’t Do》《Mind over Machine》 | S03 § 5.4 | 技能分级理论(Level 1-5):LLM 永远停在 Level 1-2,无法达到 Level 3+;给本专题元定位提供诚实承担(本专题让 Rick 达到 Level 2) |
| Joseph Weizenbaum《Computer Power and Human Reason》 | A01 § 8.2 | ELIZA 反思 + Agent 拟人化危险;2026 通用 Agent hype 是 ELIZA 走红的放大版 |
| Brian Cantwell Smith《On the Origin of Objects》 | A02 § 五末尾 | 现象学对 AI 的根本性质疑:LLM 不能真正”指称”现实对象,只能在 token 空间操作;承认本节点六层抽象表是工程便利 不是认识论真理 |
| Stuart Russell《Human Compatible》 | A07 § 5.2 | Inverse Reward Design:multi-agent 的对齐风险是累加的;给 PM 提供工程化降阶方案 |
| (额外引入) Imre Lakatos《科研纲领的方法论》 | G01 § 5.4 | 科研纲领的进步性 vs 退化性判据:G3 Reflexion 在工业上是退化性纲领(占比 < 20%) |
| (额外引入) Niklas Luhmann《社会系统》 | A07 § 5.1 | 反 Habermas 立场:沟通是系统的自我再生产,不需要”理性主体”;给同底模 multi-agent 提供替代辩护框架 |
6 处 failure scenario 显式标注(R3 critique 第五节 PM 启示反例):
| Failure 场景 | 接入节点 | 反例内容 |
|---|---|---|
| LangGraph 在 1-2 人小团队过度工程 | A06 § 三末尾 + R02 末尾 | 裸 ReAct + Redis 更划算;升级 LangGraph 硬触发条件 |
| MCP 在金融/医疗/政府私有部署反 ROI | A08 § 四后 | MCP server 安全审计成本 + 供应链风险;私有协议反而合规 |
| Trae Solo / v0 / Bolt 第三条路 | E01 § 1.5.4 | ”协作者 vs 延伸的手” 不是穷尽分类;非程序员市场更大 |
| 复合错误数学的 first-order approximation 边界 | E02 § 2.6.1 | 步骤独立性假设 + HITL 提升量固定假设都不严格成立 |
| R01-R03 demo ≠ 生产可用 | R01 § 6.6 + R02 末尾 + R03 末尾 | 跑通后的真实陷阱清单 + 教学时长 vs 真实时长差距 |
| AI PM 转型窗口可能正在关闭 | G01 § 5.5 末尾 | 2026 年 AI PM 市场已饱和,转型者面临”有 3 年 AI 经验的工程师转 PM”的竞争 |
8 处 confirmation bias 痕迹砍除(R3 critique 第三节):
| Confirmation bias | 接入节点 | 修正方式 |
|---|---|---|
| 反复引 Anthropic “先单 agent” | A07 § 2.1 + E03 § 3.6.1 | 不再简化为反 multi-agent,改为四档梯度 |
| Manus 反复引为正面案例 | E02 § 2.1.1 | 引入 Altman 复盘并列;承认本节点早期只引肖弘是 bias |
| Claude Code 反复引为 harness 标杆 | S03 § 4.1 | 承认 Cursor 用户量明显高于 Claude Code 的市场事实 |
| G5 协议化反复推为”历史必然” | G02 G5 实证 5 + A08 § 3.1 | 承认协议化是 Anthropic+Google 联合塑造的反 OpenAI 叙事;协议化降低锁定但也降低差异化 |
| ”登楼撤梯” 反复用为代际预测方法论 | G01 § 5.3 | 显式承担两个赌注前提;给出梯子在登顶前断 / 登顶后不是想去的楼两种反案例 |
| Polanyi 默会知识反复引为”已被验证真理” | S02 § 4 末尾 | 承认 Polanyi 原版是强版本,LLM 时代需要弱版本(可显性化 Level 1-2,不可显性化 Level 3+) |
| 跨域框架(福柯/阿伦特/Kuhn/Habermas)反复使用是 echo chamber | 多节点引入 Dreyfus / Weizenbaum / Smith / Russell / Lakatos / Luhmann | 引入 Rick 未读对手框架,破除 echo chamber |
| PM 狭义化为工程 PM | S01 § 9.4 + § 9.5 | 显式补充产品视角看走眼(用户心理模型 / 商业模式 / 合规边界) |
SABCD 自评的元价值:本专题用自己的 Rick 写作 SABCD 评级体系 评估自己——这是方法论的自洽实践。如果本专题不能用 Rick 自己的写作评估方法论评出”够用”的分数,那本专题本身就是失败的——评估自己的能力是知识工作者的元能力。
8. 关联节点(双链密度 ≥ 20)
8.1 现有节点(升级对照)
- Agent
- c10 - Agent 技术栈与工具调用
- m206 - Agent 产品化:记忆机制与技术进展
- m207 - Agent 产品化:场景推演与失败模式
- m208 - AI 基础设施与中间件选型
- m209 - 推理成本控制手册
- c09 - RAG 架构
- c11 - System 2 思维与 Test-Time Compute
- c14 - 模型评估体系与 Goodhart 陷阱
- Harness 词义辨析
- Skill 系统的本质
- AI概念滥用反思
- Polanyi 默会知识与提示工程的认识论张力
- AI 产品代差观察与微博打磨
- Rick 写作 SABCD 评级体系
- 登楼撤梯-后弥赛亚的公民道德
8.2 本专题节点(六模块)
- A01 Agent 概念史与语义流变、A02 抽象层级辨析·Harness Framework Agent Skill Orchestrator
- A03 ReAct、A04 Reflexion、A05 Plan-and-Execute
- A06 Orchestrator 编排器、A07 Multi-Agent Teams、A08 MCP 与 A2A 协议族
- G01 Agent 代际谱系总图、G02 五代演化详解·G1-G5
- S01 Agent 六层架构剖面、S02 流派架构对照表、S03 Harness Engineering 全景
- E01 Coding Agent·Claude Code & Cursor、E02 通用 Agent·Manus & Devin、E03 Multi-Agent 框架·AutoGen & CrewAI & DeerFlow
- R01 最小可运行·100 行 ReAct、R02 中型生产·LangGraph + MCP、R03 Multi-Agent 模板·AutoGen CrewAI
- 阅读指南
8.3 跨域锚点
- 0114认识论、0115道德哲学-伦理学、0117社会学
- 范式、生命政治、霸权
8.4 总索引
8.5 公司/产品
修订日志
- R4 → R5(2026-05-18):本轮聚焦出版就绪——B 类必做(入口节点偏元数据)。修订要点:
- § 1 之前新增 § 0 “序:这个专题是为谁、解决什么问题” —— 230 字故事钩子,从”PM 面试桌上撞过的那堵墙” 开局,给出本专题与”AI 越来越强 / 值得关注”hype 风格的反共识立场对比;让陌生读者愿意读下去
- 序段明示读完产出(“不是因为知道更多,是因为能在 30 秒内说清为什么不选 X”);让总览从”专题元数据” 变成”专题序章”
- R3 → R4(2026-05-18):本轮聚焦反方对话训练 + echo chamber 打破。修订要点:
- § 7.1 SABCD 自评从 R3 的 7.7 升级到 R4 的 7.85,新增第 6 维度 E”对手框架拷问能力”(评 7/10);特别说明实质论证强度从 R3 critique 评的 5/10 提升到 R4 后自评 7+/10
- 新增 § 7.2 “R4 后新增:业界对手立场与未读对手框架的接入清单” —— 12 处业界对手立场 + 4(实际 6)处 Rick 未读对手框架 + 6 处 failure scenario + 8 处 confirmation bias 砍除
- 引入的对手立场清单(本节点级别汇总):LeCun / Karpathy / Sam Altman 2025 复盘 / Anthropic 自家 multi-agent blog / 学界 Reflexion 复现性争议 / MCP 被巨头收编 / AutoGPT 仍是 RPA 主架构 / G3 工业占比 < 20% / G5 协议化是合谋叙事 / 肖弘 sober tone 传染 / 业界 multi-agent 反向去化 / Hype Cycle
- 引入的 Rick 未读对手框架(本节点级别汇总):Dreyfus 技能分级 / Weizenbaum ELIZA 反思 / Brian Cantwell Smith object reference / Stuart Russell IRD / Lakatos 科研纲领 / Luhmann 系统论
- R2 → R3(2026-05-18):聚焦判断密度提升。本轮微调(总览本身已合理,主要补 R3 反思):
- 新增 § 7.1 “本专题用 Rick 写作 SABCD 评级体系 自评”——5 维度评分(S 8 / A 7.5 / B 7 / C 7.5 / D 8.5,综合 7.7),明确”够 PM 顶刊样本,不够 Rick 最终内化”——回应 Round 2 [独家机会-8]
- § 7.1 末尾强调 SABCD 自评的元价值——本专题用自己的写作方法论评估自己即是方法论的自洽实践
- § 8.1 现有节点(升级对照)新增 Rick 写作 SABCD 评级体系、登楼撤梯-后弥赛亚的公民道德 两个 R3 新接入的双链
- R1 → R2(2026-05-18):
AI 概念滥用反思(有空格,死链)统一改为[AI概念滥用反思](/kb/基础知识库/ai概念滥用反思/)(无空格,匹配真实文件名)。 - 2026-06-12 内审修复:① §3.1 概念辨析模块花名册登记 Harness 词义辨析(此前未登记),模块计数从 8 篇改为 9 篇;② frontmatter 补 final_path 字段;③ 复核 see_also——本专题无
NNNN 总览形式的跨专题链,保持 [](0114认识论 等为跨域锚点,非 04T 专题号)。 - 2026-06-12 内审修复:节点计数重算自洽(Harness 入册,内容节点 20)。§0 序、§2 末依赖关系、§3.6、§7 Round 0 四处”22 个节点”统一改写为”20 个内容节点”——口径=20 内容节点(概念辨析 9 / 代际演化 2 / 架构剖面 3 / 实例剖解 3 / 复现指南 3)+阅读指南(总览 + README + 交互图谱);旧”22”= 20 内容节点 + 2 导航页 = 22 个 .md 文件的混淆口径,已弃用。append-only 历史日志中的旧”22”留痕不动。