G02 机制设计代际演化详解

机制设计不是一夜之间从博弈论里长出来的成熟工具，而是一部”逐步与不可能性定理讨价还价”的历史——这一节要解决的问题是：当我们说”用机制设计治理多 Agent”时，我们到底继承了哪一代的哪一份遗产、又同时继承了那一代的哪一道边界？ G01 制度经济学到 Agent 经济学代际谱系给出了一张鸟瞰地图（G1 奠基 → G2 拍卖与显示原理 → G3 不可能性边界 → G4 计算化/算法机制设计 → G5 LLM-Agent 机制设计），本节负责把每一代”拆到人物、著作、诺奖、核心洞察、对 multi-agent 的遗产”四件套，并刻意拒绝写成”一代更比一代强”的线性进步史——每一代解决一个问题的同时，都给下一代留下一个它解决不了的问题。

[!warning] 这一节的视角代际演化最容易写成”科技树升级”。但机制设计的真相恰恰相反：它的每一次”进步”都是在承认前一代某个不可能性结论之后，靠收窄假设换来的可解性。VCG 是在 Gibbard-Satterthwaite 独裁定理的废墟上、靠”准线性效用 + 货币转移”这块跳板逃逸出来的；算法机制设计是在”精确最优不可计算”的承认下、靠”近似”换来的工程可用。看不懂”每一代逃逸的是哪个不可能性”，就看不懂这一代 LLM-Agent 机制设计真正的边界在哪。

§0 为什么按”代际”而不是按”分支”切

读者脑中默认的框架可能是按主题分支切（拍卖理论 / 投票理论 / 匹配理论 / 合约理论），这是教科书目录的切法。本节刻意不用它，原因有二：

分支切法掩盖了”共同的逃逸动作”。 拍卖、投票、匹配看似三个领域，但它们的代际跃迁共享同一个母题——如何绕过不可能性定理。Gibbard-Satterthwaite 同时打击投票和一般社会选择；逃逸路径（限制偏好域、引入货币、放松到近似）在三个分支里是同构的。按代际切才能看见这条主线。
multi-agent 的继承是”按代”而不是”按分支”的。 当代 LLM-Agent 系统里，一个 Orchestrator 给 sub-agent 派活（这是 G4 的算法机制设计 + G1 的激励相容），同时它又撞上”agent 自我评估失准导致拍卖偏离最优”（这是 G3 不可能性在新载体上的复现）。它一次性继承了多个代际的遗产与债务。

所以本节的组织单位是”代”，每一代回答：它继承了什么 / 它新解决了什么 / 它留给下一代什么债务 / 它的洞察如何迁移到 multi-agent。

§1 G1 奠基代（1960s–1970s）：把”逆向博弈”立为一门学问

代表人物与里程碑（已核实）：

人物	生卒	关键贡献	著作/年份
Leonid Hurwicz	1917–2008	创立机制设计框架，首提激励相容	”On Informationally Decentralized Systems”（1972）
William Vickrey	1914–1996	第二价格密封拍卖（DSIC 的第一个干净实例）	1961
Allan Gibbard	1942–	Gibbard-Satterthwaite 定理（DSIC 版）	1973

核心洞察：机制设计 = 逆向博弈论。 传统博弈论给定规则求均衡；Hurwicz 把箭头反过来——先定下你想要的均衡结果，再反推出能诱导它的规则。这一步把”制度设计”从规范哲学变成了可数学求解的工程问题。Hurwicz 1972 年正式引入激励相容（Incentive Compatibility）：一个机制激励相容，当且仅当”说真话”是参与者的最优策略。这是整座大厦的地基。

G1 内部的反例（不能写成纯进步）： Hurwicz 早期结论其实是悲观的——在完全信息分散化系统中，激励相容与帕累托最优不能同时满足（对公共品尤甚）。换句话说，奠基代一出手就先证明了”很多你想要的目标根本设计不出来”。Vickrey 1961 的二价拍卖之所以重要，正是因为它是少数几个”既激励相容又有效率”的干净特例——它的存在反衬出一般情形的不可能。

[!note] G1 留给 multi-agent 的遗产 激励相容是 multi-agent 系统一切”信任 sub-agent 自报”机制的元前提。 当一个 Planner 让 worker agent 自报”我处理这个子任务需要多少 token / 我有多大把握成功”时，它隐含假设了 worker 会说真话。MarketBench（Fradkin & Krishnan, 2026, arXiv:2604.23897）的核心发现恰恰打在这里：6 个 LLM 对自身成功概率和 token 消耗存在严重误校准（miscalibration），基于自我报告构建的拍卖偏离全信息最优分配。这不是”agent 说谎”（那是激励问题），而是”agent 连真话都说不准”（这是能力问题）——G1 的激励相容框架默认了”真值是可知且可报告的”，这个前提在 LLM agent 身上部分失效了。这是把经典机制设计迁移到 multi-agent 时第一个被低估的边界。

§2 G2 形式化代（1971–1981）：显示原理与拍卖理论的黄金时代

代表人物与里程碑（已核实）：

人物	关键贡献	年份	诺奖
Edward Clarke	Clarke 机制（公共品多主体）	1971	—
Theodore Groves	Groves 机制（团队激励一般化）	1973	—
Roger Myerson	显示原理最一般化表述；最优拍卖设计	1979 ⚠️ / 1981	2007
Eric Maskin	实施理论；Maskin 单调性	1977（工作论文）/ 1999（正式发表）	2007

核心洞察一：显示原理（Revelation Principle）——把无穷搜索压缩成有限搜索。 Gibbard（1973）先提出 DSIC 版本，Myerson 将其推到最大一般性（BIC 版本）。命题是：任何能被某个复杂机制实现的结果，都能被一个”参与者直接报告类型且说真话”的直接激励相容机制实现。 它的力量在于：设计者不必遍历所有可能机制（一个无穷维空间），只需在”直接机制 + IC 约束”这个可管理集合里搜索。这是拍卖理论、监管理论能精确求解的数学钥匙。

核心洞察二：VCG 机制——“你付出你给别人造成的损害”。 Vickrey（1961）+ Clarke（1971）+ Groves（1973）合成 VCG：每个主体的支付等于其对他人产生的负外部性，于是真实报告成为主导策略，社会总福利最大化。这是”让自利行为产出全局最优”的最干净范本。

核心洞察三：Myerson 最优拍卖（1981）——从”有效率”转向”卖方收益最大”。 Myerson 在 “Optimal Auction Design”（Mathematics of Operations Research, 1981）引入虚拟估值 $\phi_i(v_i) = v_i - \frac{1-F_i(v_i)}{f_i(v_i)}$，证明最优拍卖 = 虚拟估值最高者获得物品（附最优保留价）。同时给出收益等价定理：满足”物品总给最高估值者 + 最低估值者期望收益为零”的所有标准拍卖格式（一价/二价/荷兰式/英式），期望收益相等。

G2 内部的边界（反进步叙事）： 显示原理的”压缩”是有代价的——它只在单委托人、单轮静态机制下成立。一旦进入动态机制（多轮拍卖、序贯合约）或多委托人问题，显示原理的简化力量大幅减弱，可行的直接机制空间急剧膨胀，解析求解往往不可行（来源：算法机制设计文献普遍承认这一点；具体到 multi-agent 动态场景的形式化仍是开放问题，〔待核实是否有统一结果〕）。这正是 multi-agent 系统的常态——sub-agent 之间是多轮、序贯、多委托的，显示原理在这里基本不能直接用。

[!note] G2 留给 multi-agent 的遗产 VCG 是 multi-agent 资源分配的”教科书答案”，但它在 LLM agent 上有三道坎。 第一，VCG 要求”真值可知”——见 §1 的 miscalibration 问题。第二，VCG 的支付计算需要知道每个 agent 的真实估值分布，而 LLM agent 的”估值”是涌现的、不稳定的。第三，VCG 在组合场景下计算复杂度爆炸（这正是 G4 要处理的债务）。所以当代 multi-agent 框架里几乎看不到纯 VCG——更多是 Principal-Agent 合约（arXiv:2407.18074，Ivanov, Dütting, Talgam-Cohen, Wang, Parkes, Harvard, 2024）用 MDP 中的支付合约引导 agent，这是 G2 思想的 G4 化改写。显示原理的遗产则更微妙：它告诉我们”如果你设计的 agent 协议不是激励相容的，那它一定等价于某个激励相容协议的劣化版”——这是评估任何 multi-agent 协调协议的隐形标尺。

§3 G3 不可能性代（1973–1983）：划定”什么设计不出来”的边界

如果说 G1–G2 是”我们能设计什么”，G3 就是”我们注定设计不出什么”——而这恰恰是机制设计最深刻的一代，因为知道边界在哪，才知道下一代该往哪逃。

代表人物与里程碑（已核实）：

定理	提出者	年份	内容
Gibbard-Satterthwaite 定理	Gibbard / Satterthwaite	1973 / 1975	三选项以上全域偏好下，任何 DSIC 且完备的社会选择函数都是独裁的
Myerson-Satterthwaite 定理	Myerson & Satterthwaite	1983	双边贸易中，效率/IC/个体理性/预算平衡四者不可兼得
Maskin 单调性（必要性）	Maskin	1977/1999	单调性是 Nash 实施的必要条件

核心洞察一：Gibbard-Satterthwaite——“诚实”与”非独裁”不可兼得。 对三个以上结果的全域偏好，任何主导策略激励相容且完备（onto）的社会选择函数必然是独裁的。这是整个领域试图”逃逸”的中心不可能结论：各分支的进展（限制偏好域、准线性效用、近似机制）本质上都是不同的逃逸路径。

核心洞察二：Myerson-Satterthwaite（1983）——信息租金导致的效率损失不是 bug，是物理定律。 在买卖双方各持私有估值、分布有交叠支撑的双边贸易中，不存在同时满足社会效率、激励相容、个体理性、预算平衡的机制。意义在于：薄市场（M&A、单一供应商采购）的低效不是设计水平不够，而是信息结构的根本约束——再聪明的机制设计师也消不掉它。

核心洞察三：Maskin 实施理论——给”哪些目标可实现”画出可行性边界。 Maskin（1977 工作论文，1999 正式发表于 “Nash Equilibrium and Welfare Optimality”）证明：若社会选择函数满足 Maskin 单调性 + 无否决权（三人以上），则可在 Nash 均衡下实施；且单调性是必要条件。这把”哪些社会目标可被机制实现”变成可判定的。

[!note] G3 留给 multi-agent 的遗产 G3 是 multi-agent 机制设计最该读、却最常被工程师跳过的一代。 它给出了一组”无论你的 agent 多聪明、prompt 多精巧，都过不去的墙”。最直接的迁移是 “Mechanism Design Is Not Enough”（Huang, Tharas, Marro et al., Schölkopf 组, 2026, arXiv:2605.08426）：基于不完全合约理论，当合约无法区分所有未来情境时，必然存在正的福利损失——这是 Myerson-Satterthwaite 精神在 agent 时代的直接延续。该论文的解法（设计内在”亲社会”的 agent，把他人福利纳入自身效用）本质上是放松”纯自利”假设来逃逸不可能性，与 G4 放松”精确最优”是同一种逃逸逻辑。这与强化学习里 reward shaping 的思路相通：当无法用外部支付诱导出全局最优时，就改造 agent 的内在目标函数。

[!warning] confirmation-bias 砍除写”用经济学机制治理 agent”时很容易只引正面案例（VCG 能激励相容、合约能引导行为）。G3 是必须的纠偏锚点：机制设计的主旋律是不可能性，不是万能性。 任何声称”用某机制就能让 multi-agent 自发产出全局最优”的说法，都应先问一句——它逃逸了哪个不可能性？逃逸的代价（收窄了哪个假设）是什么？在 agent 场景里那个假设还成立吗？

§4 G4 计算化代（1999–2010s）：从”是否存在”到”能否在多项式时间算出”

经济学的机制设计只关心”是否存在激励相容的最优机制”；当物品组合爆炸、参与者上百万（在线广告拍卖、组合拍卖），“存在但算不出来”等于”不存在”。G4 是计算机科学接管机制设计的一代。

代表人物与里程碑（已核实）：

里程碑	作者/编者	年份
Algorithmic Game Theory（领域奠基教科书）	Nisan, Roughgarden, Tardos, Vazirani（Cambridge UP）	2007
Multiagent Systems（MAS 对应参考）	Shoham & Leyton-Brown（Cambridge UP）	2008
近似机制设计 / 无价格博弈（PoA）等量化工具	多人	2000s

核心洞察一：算法机制设计——把”计算复杂度”加进设计约束。 Nisan 等把 VCG 等经典机制放到”能否在多项式时间内计算支付与分配”的显微镜下，发现很多激励相容机制在组合场景下 NP-hard。于是诞生了近似机制设计：放弃精确最优，换取”激励相容 + 多项式可计算 + 有近似比保证”。这是又一次”承认不可能、靠收窄换可解”的逃逸——这次收窄的是”最优性”。

核心洞察二：均衡低效的量化（Price of Anarchy）。 G4 不再满足于”均衡存在”，而是量化”自利均衡比全局最优差多少倍”。这把”自利行为离全局期望有多远”变成一个可测量、可优化的工程指标——直接对应 multi-agent 系统里”去中心化协调相对集中式调度损失了多少效率”。

G4 内部的边界（反进步叙事）： 近似的代价是确定性的福利损失，且近似比往往依赖问题结构，换个分布就退化。更关键的是，G4 的漂亮结果多数仍假设单维类型；多维私有信息（agent 同时有质量偏好、延迟容忍、风险态度）下，最优机制的完整刻画至今是开放问题（〔待核实是否已有一般性突破〕）。LLM agent 恰恰是高维、异质、类型不可观测的——G4 的工具迁移过来要打折扣。

[!note] G4 留给 multi-agent 的遗产 G4 是当代 multi-agent 机制设计在方法论上最直接的父辈。 “Open Problems in Differentiable Social Choice”（An & Du, 2026, arXiv:2602.03003）把投票规则、拍卖、资源分配统一为可微学习模型，让古典公理化结果变成优化约束——这是 G4”把设计变成计算”的极致版，提出 18 个开放问题。工程侧的 DAO-Agent（Xia, Wang, Xu, Zhang, 2025, arXiv:2512.20973）用链上 DAO 治理 + 零知识证明 + Shapley 贡献度量，把链上验证 gas 成本较朴素方案降低 99.9%（来源：该论文，单篇数据待独立复现），验证复杂度与联盟规模无关——这正是 G4”复杂度即约束”思维的产品化。Price of Anarchy 的精神则在 RoundTable（Cho, Shu et al., 2024, arXiv:2411.07161）里复现：多数投票因接受标准过严导致低效，全票通过比最优方法低 87% 初始绩效——这就是 agent 协调机制的”无政府代价”被实测出来。这一层与 m209 - 推理成本控制手册的成本约束直接咬合：算法机制设计教会我们”激励相容必须在算力预算内可计算”，否则就是纸上最优。

§5 G5 Agent 化代（2024– ）：经典机制在 LLM 新载体上的复现与变异

最后一代仍在剧烈成型中。它的特征不是发明了新的不可能性定理，而是把 G1–G4 的全部遗产与债务，一次性搬到一个全新的载体（LLM agent）上，并在那里发现哪些经典假设悄悄失效了。

代表里程碑（已核实，arXiv 编号经简报核验可解析）：

方向	代表工作	arXiv
把 MAS 重新框架为委托-代理问题	Rauba, Cepenas, van der Schaar, 2026	2601.23211
合约 + RL 编排 agent	Ivanov, Dütting, Talgam-Cohen, Wang, Parkes, 2024	2407.18074
agent 市场实验平台 Diagon	Liu, Shang, Jin (UCSD), 2026	2604.06688
LLM 作为市场参与者的能力基准	Fradkin & Krishnan, 2026	2604.23897
机制设计不够，需亲社会 agent	Huang, Tharas, Marro et al., 2026	2605.08426
Arrow 定理约束 LLM alignment	Conitzer, Freedman, Russell et al., ICML 2024	2404.10271

核心洞察一：MAS = Principal-Agent 问题的复现。 Rauba 等（arXiv:2601.23211）指出 multi-agent 系统存在两重固有缺陷——信息不对称（各 agent 上下文窗口不同，观察局部化）与激励错配，并把 LLM 的”谋划（scheming）“行为映射为经济学里的**隐藏行动（hidden action）**问题。这是 G1 激励相容、G3 委托-代理理论在 LLM 上的直接复现：经典的逆向选择/道德风险，换了个皮。

核心洞察二：经典假设的静默失效。 Diagon 实验（arXiv:2604.06688）给出反直觉结论：市场交换产生的财富是自给自足 agent 的 3.2 倍，但身份透明、强竞争筛选这类”改善”干预反而降低市场绩效，且制度选择存在路径锁定（数据来源：该论文，单篇结果待更大规模复现）。这动摇了”透明提升效率”这条朴素直觉。MarketBench（arXiv:2604.23897）则证明 G1 的”真值可报告”假设在 LLM 上失效。

核心洞察三：机制设计本身不够。 Huang 等（arXiv:2605.08426）基于不完全合约理论论证：任何现实机制都消不掉合约不完备带来的福利损失，必须给 agent 装上”亲社会”内核。这是承认 G3 不可能性后的新逃逸方向——不改规则，改 agent 的效用函数本身。

[!warning] G5 的 failure scenario（必须显式标注）

把”经济学有现成解”当成”问题已解决”。 Principal-Agent 框架告诉我们 scheming = hidden action，但经济学对 hidden action 的缓解（监控、激励合约）在 LLM 上的有效性尚未充分验证——Ivanov 等的合约-RL 方法在玩具博弈（组合硬币游戏）上严谨收敛于子博弈完美均衡，但对真实 LLM agent 的泛化性〔待核实〕。

把单篇实验数字当定律。 3.2x（Diagon）、87%（RoundTable）、99.9% gas（DAO-Agent）均来自单篇论文，引用时必须注明来源、不可当公认结论。

Arrow 定理的强约束被绕过的真实性存疑。 Conitzer 等（arXiv:2404.10271）把 RLHF 重构为偏好聚合，受 Arrow 不可能性约束；Qiu（2024, arXiv:2410.23953，NeurIPS 最佳论文 @ Pluralistic Alignment Workshop）主张用统计学习”绕过”严格不可能定理——但”绕过”是否真成立、代价是什么，是活跃理论争议，不应当成定论写。

§6 判断主轴：5 个 90% 的人会在代际继承上搞错的点

[!danger] 致命耦合点四件套（症状 → 为什么会错 → 正确做法 → 真实反例）

错位 1：把”机制设计能让自利 agent 产出全局最优”当普适真理。

症状：选型会上有人说”我们用拍卖机制让 sub-agent 竞标任务，激励相容保证最优分配”。
为什么会错：忽略了 G3——激励相容 + 效率 + 个体理性 + 预算平衡四者一般不可兼得（Myerson-Satterthwaite）；VCG 之所以能逃逸，是因为它假设了准线性效用 + 货币转移，而 agent 之间往往没有干净的”货币”。
正确做法：先问”我这个场景准线性效用成立吗？有可转移的支付媒介吗？“否则 VCG 不适用。
真实反例：Token Economics 综述（arXiv:2605.09104）把 token 同时当生产要素、交换媒介、计价单位——这恰恰是在人为构造”货币”以满足准线性假设，证明这个前提不是天然成立的。

错位 2：以为显示原理让”直接问 agent 估值”就够了。

症状：“我直接让每个 agent 报告它处理任务的成本和把握，按报告分配就行。”
为什么会错：显示原理只在单委托人、单轮静态下成立；multi-agent 是多轮、序贯、多委托的，且 agent 连真值都报不准（MarketBench 的 miscalibration）。
正确做法：把”自报”当噪声信号而非真值，引入历史能力校准（虽然 MarketBench 证明历史数据只能小幅改善），或用合约把支付与可验证结果挂钩而非与自报挂钩。
真实反例：MarketBench（arXiv:2604.23897）——加入历史能力数据仅小幅改善，自我评估是市场协调的关键瓶颈。

错位 3：把代际演化读成”新方法淘汰旧方法”。

症状：“VCG 太老了，现在都用 RL-based 合约。”
为什么会错：G4/G5 不是淘汰 G1–G3，而是在承认其不可能性结论后收窄假设得到的工程近似。每一代都背着前代的债务。
正确做法：把代际看成”逃逸链”——读任何新机制时追问”它逃逸了哪个不可能性、收窄了哪个假设、那个假设在我的场景成立吗”。
真实反例：“Mechanism Design Is Not Enough”（arXiv:2605.08426）标题本身就是对”新机制能解决一切”的反讽——它回到不完全合约的老问题，靠改 agent 内核而非改机制逃逸。

错位 4：忽略计算复杂度，把”理论最优”当”可部署”。

症状：“这个机制理论上激励相容且最优，上线吧。”
为什么会错：G4 的核心教训——组合场景下 VCG 计算 NP-hard，“存在但算不出”等于不存在；且每次 agent 调用都有 token/延迟成本。
正确做法：把激励相容、可计算性、算力预算放在同一张约束表里权衡，接受近似机制。
真实反例：DAO-Agent（arXiv:2512.20973）刻意把验证复杂度做成与联盟规模无关的常数时间，正是因为朴素方案的计算/gas 成本不可承受。

错位 5：把”有限理性”当成只属于人类的弱点。

症状：“agent 是程序，没有人类的认知偏差，可以假设完全理性。”
为什么会错：Williamson 的有限理性（源自 Simon 1957）在 LLM 上以新形态出现——上下文窗口有限（合约天然不完备）、自我评估失准、对长序列推理退化。这是 G5 最反直觉的发现。
正确做法：把 LLM agent 当新型有限理性主体建模，合约必须为不完备性留缓冲。
真实反例：RoundTable（arXiv:2411.07161）观测到消息长度增加 84%、与前一轮相似度升至 90% 的通信退化——agent 的”有限理性”以通信熵增的形式暴露。

§7 产品 PM 视角补盲

工程视角看代际演化是”算法谱系”，产品 PM 必须补三个非技术盲点：

商业模式盲点：谁来当”货币发行方”。 VCG/拍卖机制要落地，系统里必须有可转移的支付媒介（m209 - 推理成本控制手册里的 token 预算可以充当）。这意味着 multi-agent 平台的 PM 实际上在设计一个内部经济体——谁分配配额、配额能否跨 agent 转移、是否允许”借贷”。这是双边市场治理问题（见 §8 跨域呼应），不是纯技术问题。
用户心理盲点：透明未必增信任。 Diagon 实验显示身份透明反而降低市场绩效，这与产品直觉相悖。PM 若把”让用户看到每个 sub-agent 在做什么”当成默认正确的透明化设计，可能反而引入用户对 agent 互相博弈的焦虑。透明度是要设计的变量，不是越多越好。
合规盲点：责任在委托链上涌现。 Gabison & Xian（2025, arXiv:2504.03255）区分固有责任与涌现责任——当 Orchestrator 把任务委托给 sub-agent，法律责任不会自动跟着委托链清晰传递。机制设计可以分配激励，但分配不了法律责任，这是机制设计的盲区，PM 必须用 HITL（人工在环）兜底。

§8 跨域呼应：Rick 的双边市场治理经验 ↔ Agent 资源治理

[!note] 一手经验迁移：从滴滴/99 的双边市场到 agent 经济体 Rick 在滴滴/99 做的费用治理、降发生方法论、纠纷治理从裁判到管家，本质上都是机制设计在双边市场上的工程落地——而这正是把 G1–G5 迁移到 multi-agent 最具体的桥。

双边市场治理与 agent 资源治理共享同一组机制设计原语，迁移是显式且可操作的，不是类比装饰：

双边市场（Rick 一手经验）	Agent 经济体	共享的机制设计原语
司机/乘客信息不对称，乘客虚报、司机绕路	sub-agent 自报成本/把握失准（miscalibration）	G1 激励相容：自报真值的可信度问题
降发生方法论：用海恩法则在事前压低纠纷发生率	事前用合约约束 agent 的资源消耗上界	G3→G5：与其事后裁判，不如事前设计规则压低坏事件概率
纠纷治理从裁判到管家：从事后裁判转向事前体验设计	从事后 review agent 输出转向事前激励对齐	机制设计的母题：把治理点从均衡之后挪到规则之前
PDP现金支付纠纷治理：现金场景信息不可验证	agent 行为不可验证时的隐藏行动问题	G3 道德风险 / hidden action
平台用补贴/罚款调节双边激励	用 token 配额/优先级调节 agent 行为	G2 VCG 精神：用支付内化外部性

关键迁移洞察： Rick 在双边市场踩过的最深的坑——“信息透明化”是把双刃剑（见乘客信息透明化、PAX-Premium实名徽章）——在 agent 经济体里被 Diagon 实验从另一个方向证实（透明降低市场绩效）。双边市场的经验告诉我们：透明化要解决的是特定的信息不对称，盲目全透明会破坏另一些有益的信息隐藏（如平台对定价算法的保护）。这条经验直接迁移为 agent 系统的设计准则：不要默认全 context 共享，要按”哪个不对称真正有害”来选择性披露——这恰好回应了 Rauba 等指出的”各 agent 上下文窗口不同”既是缺陷也可能是有益的信息隔离。

这条呼应也接回经济学科节点 0133信息经济学（信息不对称、逆向选择、道德风险）与 0133博弈论（机制设计是博弈论的逆问题），把 agent 治理锚定在 Rick 已有的经济学训练上。

§9 对手框架回应：接受 + 边界

对手一：Elinor Ostrom（公共池塘自治治理，2009 诺奖）—— “不需要中央机制设计，社区自治就能避免公地悲剧”。

接受：Ostrom 用瑞士村庄、日本共有地等实证案例证明，自下而上的 8 条设计原则（清晰边界、分级制裁、低成本冲突解决、嵌套式治理等）能在小规模、长期重复、强社会嵌入的场景里避免公地悲剧，无需自上而下设计机制。这对”agent 共享 context/tool/quota 治理”是有力的替代范式——多中心治理（polycentric governance）可能比单一 Orchestrator 更鲁棒。
边界：Ostrom 自己承认设计原则的规模适用性存疑（Stern 2011、Araral 2014 都指出原则在大规模/全球公地需大幅修订）；其案例参与者从几十到几千人，且依赖强社会嵌入与重复博弈。当代 LLM agent 经济体可能是大规模、低社会嵌入、运行速度超出人类监督（Virtual Agent Economies, DeepMind, 2025, arXiv:2509.10147）——Ostrom 的自治原则在这里能否成立尚未验证。我赌的是：小规模、长期协作的 agent 团队（如固定 Orchestrator + 几个 worker）可借鉴 Ostrom 自治；但大规模开放 agent 市场仍需显式机制设计兜底。

对手二：Oliver Williamson（交易成本经济学，2009 诺奖）—— “何时拆多 agent，是 make-or-buy 决策，不是机制设计问题”。

接受：Williamson 的框架直接回答 A07 Multi-Agent Teams 的核心问题——多 agent 拆分的本质是”协调成本 vs 内部复杂度成本”的边界权衡。资产专用性越高、机会主义风险越大，越该垂直整合（单 agent）；任务模块化、可验证，才该外包（拆多 agent）。这比纯机制设计视角更早一步：先决定边界，再决定边界内用什么机制。
边界：Williamson 框架受过”同义反复”批评（Ghoshal & Moran, 1996，AMR：“Bad for Practice”）——事后总能解释任何已观察到的组织形式，难以证伪；且过度强调机会主义可能产生自我实现的负面效果。迁移到 agent：用交易成本决定 make-or-buy 是对的，但不能用它事后合理化任何 agent 架构。我的边界是：交易成本框架定边界（拆不拆），机制设计定边界内的激励——两者是上下游，不是替代。

[!note] Rick 未读对手框架引入（破 echo chamber） B. C. Smith 式的”机制 vs 判断”区分（移植自 0411 对 B.C. Smith 的引用）：机制设计假设”规则可以替代判断”——设计好规则，自利 agent 自动产出期望结果。但 Smith 会追问：当情境超出规则设计者的预见（合约不完备），机制就失灵，此时需要的是判断（judgment）而非计算。这正是 “Mechanism Design Is Not Enough” 的哲学根基——不完全合约下，纯机制不够，需要 agent 有内在的”亲社会判断”。这逼问本专题的盲点：我们能用机制设计治理 agent 到什么程度？超过那条线，就只能靠 alignment（改 agent 本身）而非 mechanism（改规则）。

§10 PM 决策启示

面试怎么用： 被问”如何让多个 agent 协作不内耗”时，不要只答”加个 Orchestrator”。用代际框架答：“这是机制设计问题。我会先用 Williamson 交易成本判断该不该拆（边界），再用激励相容判断 sub-agent 自报是否可信（G1），最后注意 LLM 的 miscalibration 让经典 VCG 失效（G5），所以实践中更可能用合约把支付挂在可验证结果上而非自报上。“——一句话穿过 G1/G3/G5 三代 + Williamson。
选型怎么用： 评估任何 multi-agent 框架的”协调机制”时，套用 §6 的 5 个错位做 checklist：它假设准线性效用吗？它信任 agent 自报吗？它考虑计算/token 成本吗？它为合约不完备留缓冲吗？
复现怎么用： 见 R03 Multi-Agent 模板·AutoGen CrewAI——动手搭 multi-agent 时，把 token 预算当”内部货币”显式设计（呼应 §7），用 m209 - 推理成本控制手册的成本模型给每个 agent 设配额上界，这就是 G4 算法机制设计”复杂度即约束”的最小落地。

§11 与已有节点的关系

对 G01 制度经济学到 Agent 经济学代际谱系：深化。 G01 给鸟瞰地图与代际边界，本节点把 G1–G5 拆到人物/著作/诺奖/遗产四件套并补足”逃逸链”叙事。不复述 G01 的谱系总图。
对 A07 Multi-Agent Teams：纠偏 + 升级对照。 A07 从概念辨析角度论证”multi-agent 必要性根源是上下文装不下而非单 agent 不够聪明”；本节点补上”拆分后如何用机制设计治理”的经济学维度——A07 回答”拆不拆”（接 Williamson），本节点回答”拆了之后怎么激励”。不复述 A07 的三架构辨析。
对 E03 Multi-Agent 框架·AutoGen & CrewAI & DeerFlow：升级对照。 E03 指出主流框架是”裸协作”、缺资源治理原语；本节点提供这些缺失原语背后的经济学理论谱系（为什么需要激励相容、为什么需要预算约束）。不复述 E03 的框架对比。
对 m208 - AI 基础设施与中间件选型：补缺。 m208 §2.5.2 讲编排框架选型（工程层）；本节点补”编排背后的机制设计理论”（理论层）。不复述 m208 的框架清单。
对 m209 - 推理成本控制手册：咬合。 m209 给 token 成本的工程控制；本节点给”为什么 token 配额可以当 agent 经济体的货币”的理论依据（G2 VCG + G4 复杂度约束）。
对 0133博弈论 / 0133信息经济学 / 0133新制度经济学：经济学锚点。 机制设计是博弈论逆问题（0133博弈论）、处理信息不对称（0133信息经济学）、Williamson 交易成本属新制度经济学（0133新制度经济学）。不复述这些学科节点的基础事实。

§12 关联节点

核心（必读）：

G01 制度经济学到 Agent 经济学代际谱系 —— 本节点的鸟瞰母图
A07 Multi-Agent Teams —— “拆不拆”的概念辨析
E03 Multi-Agent 框架·AutoGen & CrewAI & DeerFlow —— 缺失治理原语的实例
m209 - 推理成本控制手册 —— token 配额作为 agent 货币
0133博弈论 —— 机制设计 = 博弈论逆问题
0133信息经济学 —— 信息不对称/逆向选择/道德风险
费用治理 —— Rick 双边市场治理一手经验

延伸（可选）：

m208 - AI 基础设施与中间件选型 —— 编排框架工程选型
A06 Orchestrator 编排器 —— 中央调度 vs 多中心治理
R03 Multi-Agent 模板·AutoGen CrewAI —— 复现落地
强化学习 —— 合约-RL 编排、reward shaping
Function Calling —— agent 工具调用的资源消耗单元
0133新制度经济学 —— Williamson 交易成本框架
0134复杂经济学 —— 涌现的 agent 经济体
降发生方法论 / 纠纷治理从裁判到管家 / 乘客信息透明化 —— 双边市场治理迁移
AI概念滥用反思 —— “用机制治理 agent”的 hype 警惕
AI PM 知识图谱·总索引 —— 总入口

修订日志

R1（2026-06-07，起草）： 按 SHARED_CONTEXT §4 骨架完成首稿。五代谱系（G1 奠基 / G2 形式化 / G3 不可能性 / G4 计算化 / G5 Agent 化）逐代四件套（人物/著作/诺奖/遗产）；每代显式标注”逃逸了哪个不可能性、留给下一代什么债务”以拒绝线性进步史。判断主轴 5 个错位四件套齐备；对手框架接入 Ostrom（公共池塘）+ Williamson（交易成本）“接受+边界”，引入 B.C. Smith”机制 vs 判断”作为 Rick 未读对手框架；跨域呼应将 Rick 滴滴/99 双边市场治理（费用治理/降发生/纠纷治理/信息透明化）显式迁移为 agent 资源治理映射表。与 G01/A07/E03/m208/m209 显式升级对照（不复述）。arXiv 编号沿用接地简报已核验项；单篇数据（3.2x/87%/99.9%）标注来源、Myerson 显示原理 1979 年份标 ⚠️、合约-RL 泛化性与多维类型最优机制标〔待核实〕。
2026-06-12 内审·arXiv 联网核实:本节点 §149「合约-RL（Ivanov 等）真实 LLM 泛化性〔待核实〕」对应 arXiv:2407.18074,WebFetch 重核论文身份(标题 Principal-Agent RL / 作者 Ivanov 等 / 2024 年份)与引述一致,身份已核(0 存疑)。§71/§120 的「多维类型最优机制 / 动态机制形式化是否有突破〔待核实〕」属开放研究问题、非 arXiv 身份核实,不动。