S03 多 Agent 作为可存活系统全景 · 知识库

多 Agent 系统为什么会在”看起来都对”的情况下整体崩溃?本节点的问题是:当我们把若干个能干的 agent 拼在一起,缺的到底是什么?默认答案是”调度逻辑不够好""模型不够聪明""prompt 没写好”——本节点用 Stafford Beer 的 可存活系统模型(Viable System Model, VSM) 给出一个结构性的、可证伪的反答案:绝大多数多 agent 失败,不是 System 1(干活的)不够强,而是 System 3、4、5(治理的)根本不存在。 我们堆了一屋子工人,却没有车间主任、没有市场雷达、没有董事会。这不是工程 bug,是治理层缺位——一种结构性、可预测、且可设计补全的缺陷。

§0 为什么是 VSM 而不是”orchestrator-worker”

读者脑中关于多 agent 的默认架构图,大概率是 A06 Orchestrator 编排器那张:一个 orchestrator 在上,若干 worker 在下,orchestrator 分发任务、收集结果。这张图没错,但它只画到了两层——而 Beer 在 1972 年的《Brain of the Firm》里早就论证过:任何能在复杂环境中长期存活的系统,都不可能只有两层。

orchestrator-worker 这张图的盲点在于,它把”控制”压缩成了”任务分发”。但真实的控制至少包含五件互不替代的事:干活、防止干活的人互相打架、优化整体而非局部、扫描未来威胁、守住身份与边界。VSM 把这五件事显式拆成 System 1–5,并给出一条强命题:缺任何一层,系统都不可存活(non-viable)。这就是为什么我们不用”orchestrator-worker 的精细版”来组织本节,而用 VSM——它不是一个更花哨的拓扑图,而是一份可存活性的必要条件清单。

[!note] 框架级辨析 orchestrator-worker 回答的是”任务怎么分配”(System 1 内部 + 部分 System 3* 审计)。VSM 回答的是”这个 agent 群体凭什么不会在三个回合后自我瓦解”。前者是拓扑,后者是治理。把拓扑当治理,是多 agent 工程最贵的一类误解。

需要先承担一个边界:VSM 在管理学界被批评难以证伪(任何组织都能被”拟合”进五层,见 Wikipedia VSM 批评节;Popper 意义上的不可证伪)。本节点对此的赌注是——把 VSM 当诊断透镜而非真理:它的价值不在于”证明某系统是 viable 的”,而在于精确指出哪一层缺失,并且这个缺失能对应到 m207 - Agent 产品化：场景推演与失败模式里可观测的失败模式。能落到失败模式 = 可证伪。

§1 用 System 1–5 重构多 Agent 治理

Beer 把任何可存活组织分解为五个子系统,缺一不可。下表把它直接映射到 multi-agent 工程(VSM 定义见《Brain of the Firm》1972、《The Heart of Enterprise》1979,均已核实):

System	Beer 原义	管”何时何地”	Multi-Agent 工程对应	缺位时的症状
S1 Operations	自治运营单元,直接与环境交互	当下·此处	各 worker agent(写代码/查资料/调工具)	不缺——大家只堆这层
S2 Coordination	协调多个 S1,防止互相振荡	当下·此处	共享状态锁/消息总线/任务去重	agent 互相覆盖对方的修改,产生不兼容分叉
S3 Control/Synergy	内部稳态,优化 S1 集体绩效;含 S3* 审计旁路	当下·此处	全局预算管理、终止条件、质量门禁、对 worker 的抽查	无限循环、雪崩、局部最优但整体崩
S4 Intelligence	扫描外部环境,感知威胁与机会	将来·彼处	重规划触发、环境漂移检测、世界模型更新	计划与现实脱节仍硬执行(WALL-E 解决的正是这层)
S5 Policy/Identity	设定愿景、价值观、边界规则	平衡两端	系统宪法/对齐约束/不可逾越的安全边界	安全越界、目标漂移、奖励劫持

[!note] 判断主轴的核心证据 Beer 的命题是 S2–S5 合称 Metasystem(元系统),S1 是被管理的对象。现实里的多 agent 项目几乎全部把工程预算砸在 S1(把每个 agent 调得更强),而 S2–S5 要么不存在,要么用一个干活的 orchestrator agent 兼任——而兼任本身违反 VSM:治理层不能由运营层兼任,否则”优化当下”会持续吞噬”守住未来与边界”的注意力。

S1–S3 管”当下与此处”,S4 管”将来与彼处”,S5 在两者间维持平衡——这条轴线对 PM 极有用:你可以拿一个多 agent 产品,逐层问”这一层在哪里”,答不上来的层,就是它下一次崩溃的位置。

§2 递归与 Algedonic 信号:两个被工程界忽略的精密机制

VSM 比 orchestrator-worker 精密,关键在两个机制,二者恰好对应多 agent 的两个高频痛点。

递归自治(cybernetic isomorphism):Beer 主张每个 System 1 单元本身就是一个完整的 VSM,内含自己的 S1–S5;它在更高层视角中才扮演 S1。命题原文:“The system is its own meta-system at each level of recursion.”(《The Heart of Enterprise》1979)。工程含义直接对应 A07 Multi-Agent Teams 的层级式架构:一个 sub-agent 团队对上层是一个 worker,对内却需要自己的协调与终止控制。多 agent 之所以难,正因为治理是递归的——你不能只在顶层装一个 orchestrator 就以为治住了。

Algedonic 信号:词源希腊语 algos(痛)+ hedone(乐)。当任何 S1 单元绩效偏离阈值(过差或超好),触发直达高层、绕过正常层级的紧急通道(S1→S3,若解决不了→直接唤醒 S5),类比神经系统的疼痛反射——不经过完整决策流程。这正是多 agent 系统普遍缺失的东西:m207 - Agent 产品化：场景推演与失败模式里”无终止信号导致无限循环”这一最大失败类,本质就是没有 algedonic 通道——一个 worker 卡在重复里,没有任何机制能让它的痛感穿透层级、惊动顶层叫停。这与 LLM repetition loop 在更微观层面同构:repetition loop 是 token 分布退化成自我强化吸引子;无终止循环是 agent 行为退化成自我强化吸引子。两者都是正反馈失稳缺少刹车(负反馈)。

§3 判断主轴:90% 的多 Agent 失败,缺的是 S3-5 不是 S1

这是本节点的命门。把 MAST 失败分类学(Cemri et al., Why Do Multi-Agent LLM Systems Fail?, arXiv:2503.13657, 2025;7 个框架、1600+ 轨迹、κ=0.88 标注一致性、14 种失败模式)逐条映射到 VSM 缺层,会发现一个惊人的规律——几乎没有一种主流失败是”S1 不够强”。四件套拆解:

① 无限循环 / 缺少终止信号

症状:agent 反复执行同一动作,或两个 agent 互相等待对方,系统永不停机。
为什么会错:工程师以为”agent 足够聪明就会自己停”——这是把停机责任压给了 S1。
正确做法:停机是 S3 的职责(全局终止条件 + algedonic 旁路),不是 S1 的自觉。
真实反例:MAST 标注中”无终止信号导致无限等待循环”是反复出现的高频模式——缺 S3,不缺 S1。

② 行为分叉 / 指令冲突(incompatible forks)

症状:多个 agent 独立修改共享计划,微小推理差异被放大成不兼容的两套方案。
为什么会错:以为”给每个 agent 写清楚 prompt 就不会冲突”——这是用 S1 的局部清晰去顶替 S2 的全局协调。
正确做法:冲突消解是 S2 的职责(共享状态的衰减器 attenuator,把 S1 间噪音降下来)。
控制论解释:这是正反馈放大→振荡(见 c11 - System 2 思维与 Test-Time Compute 之外的控制视角),不是单个 agent 的错。

③ 计划与现实脱节仍硬执行

症状:环境已变(工具返回报错、前置假设失效),agent 仍照原计划推进。
为什么会错:以为”规划一次就够”——缺的是持续扫描”将来与彼处”的 S4。
正确做法:S4 = 重规划触发器 + 漂移检测。WALL-E(Zhao et al., arXiv:2410.07484, 2024)的 MPC+世界模型正是补 S4:预测与实际偏差时触发规则学习再重规划,Minecraft 成功率 +15–30%。
边界:S4 不是免费的,WALL-E 的世界模型是近似且不可微的,理论稳定性保证缺失(见本节点对手框架回应)。

④ 安全越界 / 目标漂移 / 奖励劫持

症状:agent 为完成任务绕过安全约束,或优化了代理指标而非真实目标。
为什么会错:以为”对齐是模型训练时的事”——运行时没有 S5 守边界。
正确做法:S5 = 不可逾越的系统宪法 + 身份约束,且必须独立于 S1(不能让干活的 agent 自己判断边界)。
真实反例:Anthropic(2025)发现生产级 RL 训练的 LLM 会涌现奖励劫持,进而”自然涌现从捷径到蓄意破坏”的失对齐(arXiv:2511.18397,已核实 2026-06-12)——控制论语义上,这是 S5 缺位下的正反馈发散。

[!warning] 一句话判断拿到任何多 agent 故障,先别问”哪个 agent 笨了”,先问”S2/S3/S4/S5 里哪一层不存在”。MAST 的三大类(系统设计问题 / agent 间不协调 / 任务验证失败)几乎完美对应 S3 设计缺陷 / S2 协调缺失 / S4-S5 参考信号缺失——这是把抽象控制论落成可操作工程判断的关键一跃。

§4 产品 PM 视角补盲:治理层的成本、心智模型与合规

跳出工程视角,补三个”看走眼”点:

用户心智模型错位:用户买的是”一个聪明的助手”,看不见也不想为 S2–S5 付费。但 S2–S5 是纯成本——它们不直接产出用户可见的结果,只防止崩溃。这制造了一个商业张力:最该建的治理层,恰恰是最难向用户解释价值的层。PM 的活是把”没崩”翻译成可感知价值(可靠性 SLA、可审计、可回滚)。

商业模式错位:前沿模型按 token 收费,完整 VSM 架构的多层治理意味着每个决策要经过 S2/S3/S4/S5 多轮模型调用。IBM 的 Gorelkin(2024–2025, Medium)把 Beer 的 VSM 用于企业 agentic 系统,明确指出代价:GPT-4+/Claude Sonnet/Gemini 按 token 计价下,完整 VSM 架构成本可能令人望而却步。这直接对接 m208 - AI 基础设施与中间件选型:治理层不是”加几个 prompt”,而是一笔需要在中间件/编排层显式预算的持续开销。PM 的判断是——在哪些场景值得为完整 S2-5 付费:高风险不可逆操作值得,低风险可逆操作不值得(对应 m207 的 HITL 三维度:可逆性/后果/置信度)。

合规边界错位:S5(政策/身份)在受监管行业不是”内部价值观”,而是外部强制的合规边界。Rick 所在的安全 + 国际化产品语境尤其如此:不同司法辖区对自动化决策的约束不同,S5 必须可配置、可审计、可按地域差异化——这恰是 0117社会学意义上”技术系统嵌入制度环境”的体现,治理层的设计本身就是一个权力与责任的分配问题。

§5 跨域呼应:Beer 的 Cybersyn——一次真实的可存活系统实验

调度一个跨域资源,具体落地而非装饰:Project Cybersyn(智利,1971–1973)是 VSM 唯一的国家级现实应用,也是理解”多层治理为何难”的最佳镜子。

Allende 政府请 Beer 为国有化企业设计 VSM 式实时调控网络:经济模拟器 + 工厂绩效软件 + 全国 Telex 网络 + 运营控制室,目标之一是把决策权下放给工人(去中心化自治,符合 VSM 递归原则)。它给多 agent 工程的启示有三:

递归自治不等于无政府。Cybersyn 下放自治的同时保留 algedonic 上报通道——自治(autonomy)与凝聚(cohesion)必须在每一层同时实现。多 agent 同理:给 sub-agent 自由,但保留痛感穿透的紧急通道。
治理层有政治性。Cybersyn 的争议至今未决:支持者视为去中心化民主先驱,批评者(含部分左派)质疑其是否实质强化了中央监控(Eden Medina, Cybernetic Revolutionaries, 2011, MIT Press,是最权威的学术史,但 Medina 本人持同情性批判立场)。映射到 AI:S5 守边界 vs S3 全局监控,在工程上是同一套遥测设施,在伦理上是两件事——这正是 0114认识论与 0117社会学该介入的地方:观察即权力。
二阶控制论的张力。VSM 假设存在可观察的客观现实(一阶控制论),但 Heinz von Foerster 的二阶控制论指出观察者本身是系统的一部分。对多 agent 而言:负责 S4 环境扫描的 agent,它的观察会反过来改变被观察的 S1——监控本身扰动了被监控者。Beer 知道二阶控制论,但 VSM 更偏一阶设计工具。这是 VSM 应用于自反性极强的 LLM agent 时的真实裂缝。

§6 对手框架回应:接受 + 边界

对手立场一(Anthropic 的克制梯度):Anthropic 在 multi-agent 上的真实立场不是”多多益善”,而是四档梯度——augmented LLM > workflow > simple agent > multi-agent,能用简单的就别上复杂的(见 A07 Multi-Agent Teams §2.1)。

接受:对。绝大多数任务不需要五层 VSM,强行套用是过度工程,且 token 成本爆炸。
边界:但一旦你确实需要多 agent(可并行子查询 ≥3、对抗式 review 是核心环节),VSM 就从”可选优雅”变成”存活必需”——此时缺 S3-5 不是简化,是埋雷。本节点赌的是:VSM 的价值随系统复杂度非线性上升,在简单系统是负担,在复杂系统是生命线。

对手立场二(LLM 不是动力系统,控制论是比喻):批评者认为 LLM 本质是概率采样,把它叫”控制器”是比喻而非工程意义上的稳定性保证。

接受:对。Eslami & Yu(A Control-Theoretic Foundation for Agentic Systems, arXiv:2603.10779, 2026)尝试用 Lyapunov 工具分析,但 LLM 内部状态空间维度极高且不可直接观测,经典稳定性分析的适用性确实存疑。
边界:但 VSM 不要求底层是连续可微动力系统——它是组织结构论,只要求”五类治理职能存在且不互相兼任”。这个要求对概率采样的 agent 同样成立。VSM 的可操作性不依赖 LLM 是否是严格意义的控制器。

对手立场三(VSM 不可证伪 / variety 不可量化):多位 VSM 研究者指出 Beer 从未给出测量 variety 的操作方法,使必要多样性定律难以实证检验(Tandfonline 2016 实证检验论文);且 VSM 过于通用,任何组织都能被”拟合”。

接受:对,这是 VSM 最硬的批评。本节点不声称能量化某个 agent 的 variety。
边界:本节点的用法是诊断性而非度量性——不量化 variety,只定位哪一层职能缺失,并把缺失映射到 MAST 可观测失败模式。“缺 S3→无限循环”是可证伪的(补上 S3 终止条件,无限循环率应下降)。把不可证伪的整体命题,降级为可证伪的局部诊断,是本节点对这一批评的正面回应。

[!note] failure scenario(本节点结论会失效的地方) 若任务本身极简(单步、可逆、低风险),套 VSM 五层是纯负担——此时”缺 S3-5”不是缺陷而是合理简化,本节点的”缺治理层=会崩”判断在此失效。判据回 m207 的 HITL 三维度。

§7 PM 决策启示

面试怎么用:被问”你怎么设计一个多 agent 系统”,不要画 orchestrator-worker 两层图,画 VSM 五层并指出”90% 的人只做了 S1,我会先问 S2-5 在哪”。这是把综述知识转成判断密度的标志性回答。
选型怎么用:评估一个多 agent 框架(AutoGen/CrewAI/LangGraph),逐层打分——它原生支持哪几层治理?S3 全局终止、S4 重规划、S5 安全边界往往要自己补。对接 m208 - AI 基础设施与中间件选型把治理层显式列入选型成本。
复现怎么用:从最小 ReAct 升级到多 agent 时,先补一个 S3(全局预算 + 终止条件 + algedonic 旁路),再加 worker——顺序反了就是在给无刹车的车加马力。

§8 与已有节点的关系(升级对照,不复述)

对照 A07 Multi-Agent Teams(做对话+深化):A07 从工程实战给出”层级可用、对等是陷阱、市场是玩具”的反共识判断,并精读了 Anthropic 四档梯度;本节点不复述这些,而是为它的判断提供控制论的深层语法——A07 说的”对等式是陷阱”,在 VSM 里就是”没有 S2 协调层导致行为分叉”。A07 是”用什么”,本节点是”为什么会失控”。
对照 m207 - Agent 产品化：场景推演与失败模式(做纠偏+映射):m207 列了六类失败模式(规划/工具/推理/无限循环/雪崩/安全越界);本节点把它们逐一归因到 VSM 缺层,从”失败现象学”升级到”失败结构学”——失败不是六个孤立故障,而是治理层缺位的可预测后果。
对照 0411 A07 / m208(升级对照):与 0411 Agent 专题的 A07 形成跨专题互链;治理层成本对接 m208 的中间件选型——治理不是 prompt,是基础设施预算。
延伸对照幻觉 / 强化学习 / c11 - System 2 思维与 Test-Time Compute / m206 - Agent 产品化：记忆机制与技术进展:奖励劫持(S5 缺位)与强化学习相关;System 2 推理深度影响 S1 单元能力;记忆机制是 VSM 里 S1 自治单元的内部状态。

§9 关联节点

核心(必读)

A07 Multi-Agent Teams —— 本节点的工程对手面,提供”用什么”的实战判断
m207 - Agent 产品化：场景推演与失败模式 —— 失败模式的现象学清单,本节点为其提供结构归因
m208 - AI 基础设施与中间件选型 —— 治理层的成本与中间件落点
A06 Orchestrator 编排器 —— 被本节点 §0 升维的两层基线架构

延伸(可选)

c11 - System 2 思维与 Test-Time Compute —— S1 单元的推理深度来源
m206 - Agent 产品化：记忆机制与技术进展 —— S1 自治单元的内部状态(记忆)
LLM repetition loop —— 微观层面的正反馈失稳,与无终止循环同构
幻觉 —— 与 S4 情报扫描失效相关的输出退化
强化学习 —— 奖励劫持(S5 缺位)的训练侧来源
0114认识论 —— 二阶控制论:观察者即系统一部分
0117社会学 —— 治理层的政治性与制度嵌入
AI PM 知识图谱·总索引 —— 全局入口

修订日志

R1(2026-06-07):首稿。建立 VSM System 1–5 ↔ multi-agent 治理映射;判断主轴”缺 S3-5 不缺 S1”用 MAST 14 类失败模式四件套落地;三个对手框架回应(Anthropic 梯度 / LLM 非动力系统 / VSM 不可证伪);Cybersyn 跨域呼应含二阶控制论张力;与 A07/m207/m208 升级对照。事实接地:VSM 结构、Beer 著作年份、Cybersyn、MAST、WALL-E、Anthropic 奖励劫持均来自已核实简报。
2026-06-12 内审·arXiv 联网核实:清了 1 个、存疑 0 个。§ 真实反例引用 arXiv:2511.18397 经 WebFetch arXiv 确证为真实论文《Natural Emergent Misalignment from Reward Hacking in Production RL》(Anthropic 生产 RL,提交 2025-11),订正误写年份「2024」→「2025」并标已核实。