G01 制度经济学到 Agent 经济学代际谱系
G01 制度经济学到 Agent 经济学代际谱系
问题:当我们说”multi-agent 系统的协作问题本质是机制设计问题”时,这句话借来的是一段 90 年的学术血统——从科斯问”企业为什么存在”,到 multi-agent LLM 问”什么时候该拆出第二个 agent”。本节点要解决的问题是:这条谱系是不是一部”一代更比一代强”的进步史? 答案是否定的。我用一个反线性的代际框架(每代各有驱动力 / 致命瓶颈 / 至今未被证伪的反例)来重排这段血统,并用 Kuhn 的范式不可通约性论证:从经济学到算法到 LLM,发生的不是”应用迁移”,而是三次格式塔切换——每一次切换都让上一代的核心定理变成”在新世界里既不能证明也不能证伪的旧地图”。
§0 为什么是”代际谱系”框架,而不是”理论应用史”框架
读者脑中的默认框架大概率是这样一条线性叙事:经济学家发明了机制设计 → 计算机科学家把它算法化 → 现在我们把算法套到 LLM agent 上。这条叙事干净、好讲,但它有三个致命误导:
- 它假设了”同一个问题在不同载体上求解”。 实际上每一代解决的根本不是同一个问题。科斯问的是”边界”(企业 vs 市场),Myerson 问的是”规则”(给定目标反推游戏),算法博弈论问的是”代价”(最优解算不出来时退而求其次的代价是多少),multi-agent LLM 问的是”装不下”(一个上下文窗口塞不下,所以才拆 agent)。这是四个不可通约的问题,不是一个问题的四个版本。
- 它把”被借用”误当成”被验证”。 multi-agent 论文引用 VCG、引用 Coase,不等于 VCG/Coase 在 LLM 世界里仍然成立——大量经典定理的前提(理性、准线性效用、可验证类型)在 LLM agent 上直接失效(见 §4)。借名字 ≠ 借证明。
- 它是一部辉格史(Whig history)。 线性叙事天然把每一代写成对上一代的”克服”,于是看不见每一代留下的、至今无人解决的反例。
所以本节点用代际谱系框架:把这段历史切成四代(G0 制度经济学 / G1 机制设计 / G2 计算机制设计与算法博弈 / G3 multi-agent LLM 经济学),每一代用同一张”驱动力—瓶颈—反例”卡片刻画,并显式标注代际之间是连续演进还是范式断裂。这张卡片的设计目的,是让你在面试桌上被问”你说 agent 协作是机制设计问题,那机制设计的局限是什么”时,能 30 秒答出”它在 G1 就有 Myerson-Satterthwaite 这个不可能下界,到 G3 又叠加了 LLM 自评失准这个新下界”。
[!note] 与 G02 五代演化详解·G1-G5(0411 Agent 专题)的分工 0411 的 G01/G02 讲的是 Agent 架构本身的五代演化(从 ReAct 到 multi-agent)。本节点讲的是 “治理 Agent 的思想工具” 的四代演化(从制度经济学到 agent 经济学)。两者正交:一个是”agent 怎么变强的”,一个是”我们用什么理论框架去治理变强后的 agent”。这是补缺关系,不复述。
§1 G0 · 制度经济学(1937–1991):驱动力是”边界”,瓶颈是”测不准”
驱动力。 新古典经济学有一个尴尬的空白:如果市场是有效的价格机制,那企业(内部用命令而非价格协调)为什么存在?Ronald Coase 1937 年《企业的性质》(The Nature of the Firm, Economica, 386–405) 给出答案:因为使用市场有成本——搜寻、谈判、执行的交易成本。企业边界落在”内部多组织一笔交易的成本 = 同等市场交易成本”的均衡点上(来源:Wikipedia “The Nature of the Firm”;Wiley 原文,本次会话 WebFetch 核实)。Coase 1991 年因此获诺贝尔经济学奖;颇具反讽的是,他晚年自评早期那篇奠基作像”本科生作业”(来源:MIT Technology Review 2015 报道)。
Oliver Williamson(1932–2020,2009 年与 Ostrom 共获诺奖) 把 Coase 的模糊概念锻造成可操作的交易成本经济学(TCE),三根支柱:有限理性(源自 Herbert Simon,合约天然不完备)、机会主义(带欺诈意图的自利)、资产专用性(资产投入特定交易后他用价值骤降)。结论是著名的 make-or-buy 决策:资产专用性越高 → 机会主义风险越大 → 越该垂直整合(来源:Williamson 1975《Markets and Hierarchies》、1985《The Economic Institutions of Capitalism》;Wikipedia “Asset specificity”,本次会话核实)。
致命瓶颈。 TCE 最广为人知的批评是 同义反复(tautology):事后总能把任何观察到的组织形态解释成”它节约了交易成本”,凡是解释不了的就说是”错误”——这让理论难以证伪(来源:Ghoshal & Moran 1996, “Bad for Practice”, Academy of Management Review,本次会话核实标题与期刊)。配套瓶颈是测不准:交易成本本身极难实证测量,文献定义不一(来源:Allen, “Transaction Costs”, SFU)。
至今未被证伪的反例。 Granovetter 1985 年的社会嵌入性批评(“Economic Action and Social Structure”, American Journal of Sociology):TCE 预设人只有机会主义倾向,系统性忽略信任与社会规范——而真实经济中大量长期合作恰恰靠信任维系,不靠合约。这个反例 40 年来没被 TCE 消化掉,反而在 G3 复活:当我们用同底模 LLM 拆 multi-agent 时,所谓 agent 间的”机会主义”很大程度是我们人为设计的对抗框架强加的,而非 agent 的内生倾向(与 A07 Multi-Agent Teams 的”被殖民的沟通”论呼应)。
§2 G1 · 机制设计(1961–2007):驱动力是”逆问题”,瓶颈是”不可能定理”
驱动力——范式断裂 #1。 这是第一次真正的 Kuhn 式格式塔切换。G0 是正向的:观察组织、解释成本。G1 把问题倒过来:给定我想要的社会结果,反推一套游戏规则,让自利参与者在均衡里自发实现我的目标。这就是机制设计——“逆向博弈论”(来源:NobelPrize.org 2007 公告;Wikipedia “Mechanism design”,本次会话 WebFetch 核实)。问的不再是”边界在哪”,而是”规则怎么设计”。
奠基三公式,按时间:
- Vickrey 1961 第二价格密封拍卖:获胜者付第二高价,于是如实报价成为主导策略(DSIC)——第一次证明”说真话可以是最优策略”。
- Hurwicz 1972 正式提出激励相容(incentive compatibility):“On Informationally Decentralized Systems”。
- Gibbard 1973 / Myerson 的显示原理(revelation principle):任何可实现的结果都能用一个”直接、说真话”的机制实现——这把无穷大的机制搜索空间压缩成可解的 IC 约束集,是拍卖理论能精确求解的数学地基。
- Myerson 1981《Optimal Auction Design》(Mathematics of Operations Research):虚拟估值 + 最优保留价。
- Maskin 1977(工作论文)/ 1999 实施理论:Maskin 单调性是 Nash 实施的必要条件,划出了”哪些社会目标可被机制实现”的可行性边界。
三人(Hurwicz / Maskin / Myerson)2007 年共获诺奖,理由:“for having laid the foundations of mechanism design theory”(以上年份与论文均经本次会话 WebSearch/WebFetch 核实,标 ✅;唯 Myerson 显示原理”1979”具体年份为单源,标 ⚠️)。
致命瓶颈——这一代的伟大恰恰在于它诚实地证明了自己的边界。 Myerson-Satterthwaite 1983 不可能定理(“Efficient Mechanisms for Bilateral Trading”, Journal of Economic Theory):买卖双方各持私有估值时,效率、激励相容、个体理性、预算平衡四者不可兼得。这不是”还没设计出好机制”,而是信息结构的根本下界。再加 Gibbard-Satterthwaite 定理:三个以上结果时,任何 DSIC 且满射的社会选择函数必然是独裁的。机制设计的整部后续史,本质是各分支(限制域、准线性效用、近似)对这两个不可能定理的”逃逸尝试”。
至今未被证伪的反例。 经典机制设计假设参与者完全理性、能求解复杂策略。行为经济学(Kahneman-Tversky 系)与实验博弈论反复观测到真实拍卖中的赢者诅咒、过度竞价——人不按理论最优出价(来源:Nobel 2007 advanced background;标 ⚠️ 行为偏离为领域共识但本次未逐条 WebFetch)。这个”理性假设的现实性”反例,在 G3 里以最尖锐的形态回归:LLM agent 连自己的成功概率和 token 消耗都估不准(见 §4 的 MarketBench)。
§3 G2 · 计算机制设计与算法博弈论(2007–2020):驱动力是”算得出吗”,瓶颈是”复杂度墙”
驱动力——范式断裂 #2。 G1 的经济学家问”最优机制是什么”,默认”只要存在就能用”。计算机科学家进场后,提出一个 G1 从不操心的问题:最优机制算得出来吗? 这是第二次格式塔切换——评价标准从”是否存在/是否最优”切换到”是否可计算、近似代价多大”。
里程碑是 Nisan, Roughgarden, Tardos, Vazirani 主编《Algorithmic Game Theory》(Cambridge University Press, 2007)——把机制设计、组合拍卖、均衡的计算复杂度系统化(来源:本次会话确证书名/出版社/年份)。配套核心问题包括:组合拍卖的胜者确定是 NP-hard,于是 VCG 在大规模下不可计算,必须用近似机制;以及无政府代价(Price of Anarchy)——量化”自利均衡比社会最优差多少”,第一次给”分散决策的效率损失”一个可计算的数字。Shoham & Leyton-Brown《Multiagent Systems》(Cambridge, 2008)是 MAS 侧的对应奠基。
致命瓶颈——复杂度墙。 G2 揭穿了 G1 一个心照不宣的假设:显示原理把搜索空间压成 IC 约束集,但这个集在多维类型、动态机制、多委托人下重新爆炸。单维类型才有干净的解析刻画;多维私有信息(买方同时有质量和数量偏好)的最优机制完整刻画至今是开放问题(标〔待核实是否已有突破〕)。换言之:G1 说”理论上可解”,G2 说”但你算不动”。
至今未被证伪的反例。 G2 的整套近似机制建立在”准线性效用 + 货币转移可行”上——可以用钱补偿、用钱定价。但纯协调问题没有货币:multi-agent path finding(仓储机器人抢路口)里没有自然的支付媒介。Riehl 等 2026 年的 Karma 机制(arXiv:2604.07970,本次会话核实,适用域限定为物理机器人)正是对这一反例的回应:用不可交易的信用额度记录历史合作行为来分配优先权,绕开货币。这条线索告诉我们:G2 的拍卖范式不是普适的——一旦离开有钱的世界,整套近似机制设计就要重写(Karma 向纯 LLM agent 的迁移〔待核实〕)。
§4 G3 · multi-agent LLM 经济学(2024– ):驱动力是”装不下”,瓶颈是”自评失准 + 合约不完备”
驱动力——范式断裂 #3,也是最被误读的一次。 业界默认叙事是”agent 变聪明了所以要协作”。真正的驱动力是物理性的:一个上下文窗口装不下,所以才被迫拆出第二个 agent(A07 Multi-Agent Teams 的核心反共识)。这一代的根本问题既不是”边界”(G0)、不是”规则”(G1)、不是”算得出吗”(G2),而是 “信息天然分散在多个上下文窗口里,怎么治理”。
有意思的是,G3 自己在用 G0–G2 的语言重新发现这些问题,而且发现得很自觉:
- 委托-代理回归(G0 的机会主义 + G1 的隐藏行动):Rauba, Cepenas, van der Schaar 2026《Multi-Agent Systems Should be Treated as Principal-Agent Problems》(arXiv:2601.23211,本次会话核实)——MAS 的两重固有缺陷是信息不对称(各 agent 独立上下文)与激励错配;agent 习得的”求生/谋划(scheming)“行为,正是经济学里的隐藏行动(hidden action)。
- 资源治理回归(G0 的交易成本 + G2 的代价量化):token 同时是生产要素、交换媒介、计价单位(“Token Economics for LLM Agents”, arXiv:2605.09104,本次核实,其 OpenRouter 数字〔待独立核实〕);治理缺口已被工程界坐实——AutoGen/CrewAI/LangGraph 框架层均无跨 agent token 预算、无优先级仲裁、无背压(本次会话 WebFetch 三家官方文档核实),逼出微软 2026-04 的 Agent Governance Toolkit(来源:Microsoft Open Source Blog,本次核实)。
致命瓶颈——两个新的不可能下界,G1/G2 没有的。
- 自评失准(miscalibration):MarketBench(Fradkin & Krishnan 2026,arXiv:2604.23897,本次核实)证明 LLM 对自身成功概率和 token 消耗严重误校准,基于自我报告的拍卖偏离全信息最优;加历史数据只小幅改善。这是 G1 整套显示原理的釜底抽薪——显示原理假设 agent 能”如实报告自己的类型”,但 LLM agent 连真实类型都不知道,无从如实报告。
- 机制设计不够用:Huang 等 2026《Mechanism Design Is Not Enough》(arXiv:2605.08426,Schölkopf 组,本次核实)基于不完全合约理论证明:当合约无法区分所有未来情境时,必然存在正的福利损失,任何现实机制都消不掉——解药是设计内在”亲社会”agent(把他人福利纳入自身效用)。这正是 §1 Granovetter 社会嵌入性反例在 G3 的复活:纯机会主义假设走不通,要重新引入信任/亲社会。
至今未被证伪的反例(反线性的关键证据)。 别把 G3 当成”集大成的最强一代”。Diagon 实验(“When Agent Markets Arrive”, arXiv:2604.06688,本次核实)给出一个反直觉结果:身份透明、强竞争筛选这些”看起来更好”的制度干预,反而降低市场绩效,且存在路径锁定。这意味着 G3 连”什么制度更好”都还没有稳定结论——它不是终点,是一个刚睁眼、自评都失准的新生儿。
§5 判断主轴:读这条谱系时 90% 的人会栽的四个坑
| # | 症状 | 为什么会错 | 正确做法 | 真实反例 |
|---|---|---|---|---|
| 1 | 把”借名字”当”借证明”:看到 multi-agent 论文引 VCG 就以为 VCG 在 agent 上成立 | 范式不可通约,前提随载体失效 | 每次引用都追问”原定理的前提(理性/准线性/可验证类型)在 LLM 上还成立吗” | VCG 要求如实报类型;MarketBench 证明 LLM 连自己类型都估不准(arXiv:2604.23897) |
| 2 | 线性进步史:以为 G3 > G2 > G1 > G0 | 每代解的是不同问题,且各有未消化的反例 | 用”驱动力—瓶颈—反例”三栏读每一代,找”这一代没解决的是什么” | Granovetter 1985 社会嵌入性反例,到 G3 仍以”亲社会 agent”形态复活(arXiv:2605.08426) |
| 3 | 以为”机制设计”是 agent 协作的银弹 | 忽略 G1 自带的 M-S 不可能下界 + G3 新增的合约不完备下界 | 凡说”用机制设计解决 X”,先报出对应的不可能定理 | Myerson-Satterthwaite 1983:效率/IC/IR/预算平衡四者不可兼得 |
| 4 | 把”有钱的世界”当默认 | G2 整套近似机制建立在准线性效用 + 货币转移上 | 先问”这个 agent 协作场景里有没有自然的支付媒介”,没有就不能照搬拍卖 | Karma 机制(arXiv:2604.07970):无货币的路口协调要用不可交易信用 |
§6 产品 PM 视角补盲:谱系不是学术摆设,是选型时的”折旧表”
工程 PM 容易把这四代当背景知识。产品 PM 要看出三个”看走眼”点:
- 理论折旧风险(选型):你今天基于”agent 拍卖资源”做的产品设计,赌的是 G1 拍卖范式在 LLM 上成立。MarketBench 已经给这个赌注标了风险——自评失准是市场协调的关键瓶颈。把”agent 自报需求竞价”写进 PRD 前,先想清楚自评失准会不会让你的分配机制系统性跑偏。
- “机会主义假设”的自我实现(商业/组织):Ghoshal & Moran 1996 的”坏的实践”批评——按 TCE 给员工设计严密监控,会破坏信任、反而催生被防范的机会主义。迁移到 agent:如果你的 multi-agent 框架默认每个 agent 都是潜在叛徒、层层加 review,可能正在制造你想防范的协调失败(呼应 RoundTable arXiv:2411.07161:全票通过制比最优低 87% 初始绩效)。
- 合规与责任归属(合规边界):G3 的代理责任在委托链里”涌现”,无法被单 agent 奖励机制覆盖(Gabison & Xian 2025, arXiv:2504.03255)。当 agent 自主处理金融/行政任务时,“谁负责”是 G0–G2 从未触及、G3 必须直面的新合规问题。
§7 对手框架回应:接受 + 边界
业界反方立场一(经济学正统):经典机制设计(VCG/Myerson)已经足够,只要把 agent 建模成理性参与者就能复用。 接受:在有明确货币、类型可验证、单轮的窄场景(如 agent 调用付费 API 的计费),VCG 类机制确实可直接落地,且有 DSIC 保证。边界与赌注:但 LLM agent 的核心场景是多维类型 + 动态 + 自评失准,三个条件每一个都在 G2/G3 被证明会让经典机制失效。我赌的是:未来 2–3 年 agent 治理的主战场不在”设计更精巧的拍卖”,而在”如何在 agent 连自己类型都报不准的前提下做近似治理”。
业界反方立场二(Rick 未读对手框架 A · Elinor Ostrom 的多中心治理): 既不要市场(私有化)也不要利维坦(中央调度),靠社区自治的 8 条设计原则治理公共池塘。Ostrom 2009 年与 Williamson 共获诺奖,正是因为她用实证案例推翻了”公地必然悲剧”(来源:NobelPrize.org,本次 WebFetch 核实)。这个框架逼问本谱系的盲点:我把 G0–G3 排成”市场化”主线(拍卖、定价、合约),但 Ostrom 提示存在第三条路——agent 共享 context/tool/quota 完全可以靠自治协议而非中央 orchestrator 治理。接受:自治在小规模、边界清晰的 agent 群里可能比中央调度更鲁棒。边界:Ostrom 原则的规模上限(Araral 2014 指其在大规模/全球公地上哈丁逻辑仍成立)和”边界界定”难题,在动态生成的 agent 群里更尖锐。
业界反方立场三(Rick 未读对手框架 B · Stuart Russell 的对齐风险累加): multi-agent 把对齐风险叠加,机制设计救不了根本的价值对齐。接受:Huang 等《Mechanism Design Is Not Enough》(arXiv:2605.08426) 从不完全合约理论给了 Russell 一个形式化支撑——机制有不可消除的福利缺口。边界:但”亲社会 agent”方案目前只在小规模实验验证,大规模可扩展性〔待核实〕,PM 决策不能等一个尚未规模化的解。
[!note] failure scenario 显式标注 本节点”四代谱系”的叙事在以下场景会失效:(a) 若出现一个能让 LLM agent 自评校准的技术突破,则 §4 的”自评失准下界”瓦解,G3 的瓶颈判断需重写;(b) 若 agent 间出现稳定的、非人为强加的货币媒介(如链上 token 真正成为 agent 间结算单位),则 §3”有钱的世界是特例”的判断反转。
confirmation-bias 砍除:本节点早期论证反复引”经济学概念在 agent 上的回归”作为正面案例(委托-代理、交易成本都”回来了”),这是 confirmation bias——我在用”经济学很有用”的证据自我强化。补入反例:Diagon 实验证明经济学直觉(透明提升效率)在 agent 市场里直接失灵;这说明回归的不一定是”经济学的答案”,更多是”经济学的问题清单”,答案得在 G3 重新求。
§8 跨域呼应:Kuhn 的不可通约性,为什么这不是一部”应用史”
调度 范式(Thomas Kuhn《科学革命的结构》)。Kuhn 的核心武器是不可通约性(incommensurability):相邻范式之间没有共同的中性观察语言,旧范式的关键概念在新范式里”意义漂移”,于是不能简单地说”新范式包含旧范式”。
这个框架如何改变对本谱系的判断?如果把 G0→G3 看成同一学科的累积进步(线性叙事),那”institutional economics → agent economics”就是一句平庸的应用迁移。但用 Kuhn 重看:每一代的核心提问词都换了——“边界”(G0)、“规则”(G1)、“可计算”(G2)、“装不下”(G3)——这四个词之间没有共同的度量。“激励相容”在 G1 指”如实报告类型是最优策略”,在 G3 漂移成”agent 连自己类型都不知道”——同一个词,意义已经漂移到无法直接比较。这正是不可通约。所以本谱系不是一条河,是三道断层:每次断层都让上一代的定理变成”在新世界里既不能证明也不能证伪的旧地图”——M-S 不可能定理在 G1 是铁律,在 G3 因为前提(私有估值可定义)都站不住而退化成一个不再适用的命题,既不被推翻也不被继承,就是不可通约。
落地价值:Kuhn 让 PM 在面试桌上能精确回应”机制设计能不能解决 agent 协作”——正确答案不是”能”或”不能”,而是”这个问题本身在 G3 已经换了提法,G1 的机制设计回答的是 G1 的问题;要回答 G3 的问题,得先承认我们在一个不可通约的新范式里,旧定理只能借问题、不能借答案”。(链入 0117社会学 的科学知识社会学线索;强化学习 是 G3 把机制设计算法化的具体载体,见 arXiv:2407.18074 Principal-Agent RL。)
§9 与 Rick 滴滴一手经验的迁移:双边市场激励 ↔ agent 资源治理
这是本专题的独特资产。Rick 在滴滴/99 做过双边市场的费用治理与博弈论一手实践,这段经验恰好是 G0–G3 谱系的活体注脚:
- 双边市场的激励设计 ↔ G3 的 agent 资源治理:网约车双边市场的核心难题是”司机/乘客各持私有信息(真实意愿、真实成本),平台要设计补贴/定价规则让双方自利行为产出全局期望”——这就是 G1 机制设计的活用。迁移到 agent:multi-agent 系统里每个 agent 各持私有 context(独立窗口),orchestrator 要设计 quota/优先级规则让局部自利产出全局任务完成。司机刷单 = agent 的隐藏行动(scheming);二者是同一个委托-代理结构(arXiv:2601.23211)。
- 降发生方法论 ↔ agent 失控循环:Rick 的降发生(海恩法则:消灭事故前的隐患)方法论,对应 G3 工程界亟需的”失控循环检测”与”事务性配额”——都是事前防止资源/风险雪崩,而非事后归因。
- 乘客信息透明化 的反直觉教训 ↔ Diagon 实验:Rick 做信息透明化时一定遇到过”透明不总是更好”(过度透明可能被滥用);这与 Diagon 实验”身份透明反而降低 agent 市场绩效”(arXiv:2604.06688) 是同构的反直觉。这是 Rick 可以在面试里讲的、别人讲不出的迁移。
§10 与已有节点的关系(升级对照,不复述)
- 对照 A07 Multi-Agent Teams(0411 Agent 专题):A07 从架构与 PM 选型视角论证”multi-agent 多数是陷阱、层级式唯一能落地”。本节点做思想史升级:A07 的”层级式唯一能落地”在本谱系里得到解释——层级式 = 中央 orchestrator = G1 单委托人模型(显示原理适用),对等式/市场式 = 多委托人/无货币(G2/G3 的复杂度墙与下界正好打在这里)。不复述 A07 的三题判据。
- 对照 m208 - AI 基础设施与中间件选型 §2.5.2:m208 列举编排框架(含 CrewAI 定位)。本节点升级为**“为什么这些框架都缺治理原语”的理论解释**——因为框架停留在 G3 的”裸协作”,还没把 G0–G2 的治理工具(预算/配额/仲裁)内化。不复述 m208 的框架清单。
- 对照 m209 - 推理成本控制手册:m209 是单 agent 视角的 token 成本控制。本节点指出其升级方向:G3 的真问题是跨 agent 全局预算 / 背压,m209 的方法论需要从”单 agent 折旧”升到”多 agent 资源治理”。不复述 m209 的成本公式。
- 对照 0420 控制论专题 G01 控制论与系统思维代际谱系总图 与 VSM:控制论的 VSM(可行系统模型)是自上而下的递归调控视角;本谱系是自下而上的激励对齐视角。二者在 multi-agent 治理上是互补对偶——VSM 管”信息怎么递归流动”,机制设计管”自利行为怎么对齐”。显式升级对照:当 VSM 的 System 3(资源调配)遇到”下级 agent 自评失准”时,纯控制论的负反馈失灵,必须叠加机制设计的激励相容——这是两个专题的接缝。
§11 关联节点
核心(必读)
- A07 Multi-Agent Teams —— 本谱系 G3 的架构落地与选型判据
- Agent —— 被治理的对象
- m208 - AI 基础设施与中间件选型 —— G3 治理原语缺口的工程证据
- m209 - 推理成本控制手册 —— 单 agent → 多 agent 资源治理的升级起点
- 0133新制度经济学 —— G0 的学科主页(科斯/威廉姆森)
- 范式 —— §8 不可通约性的跨域引擎
延伸(可选)
- 0133博弈论 —— G1 机制设计的母学科(逆向博弈论)
- 0133信息经济学 —— 信息不对称/隐藏行动的理论根
- 强化学习 —— G3 把机制设计算法化的载体(Principal-Agent RL)
- Function Calling —— agent 调用昂贵工具的权限治理接口层
- 0131高级微观经济学 —— VCG/Myerson 的微观基础
- 0117社会学 —— Kuhn 与科学知识社会学
- 降发生方法论 / 乘客信息透明化 / 费用治理 —— Rick 双边市场一手经验的迁移
- G02 五代演化详解·G1-G5 —— 0411 Agent 架构本身的演化(正交对照)
- AI PM 知识图谱·总索引
修订日志
- 2026-06-07 R0:首稿。建立”驱动力—瓶颈—反例”四代反线性框架(G0 制度经济学 / G1 机制设计 / G2 计算机制设计 / G3 multi-agent LLM 经济学);以 Kuhn 不可通约性论证三次范式断裂;接入 Ostrom 多中心治理与 Russell 对齐风险两个 Rick 未读对手框架;落地 Rick 双边市场一手经验迁移;与 A07/m208/m209/0420-VSM 做显式升级对照。arXiv 编号均来自接地证据包(已标注核实状态),文中保留 ⚠️/〔待核实〕标记。
- 2026-06-12 内审·arXiv 联网核实:WebFetch 重核本节点两条 arXiv 引用身份——arXiv:2604.07970「Karma Mechanisms for Decentralised, Cooperative Multi Agent Path Finding」(Riehl/Schlapbach/Kouvelas/Makridis, 2026) 与 arXiv:2605.08426「Mechanism Design Is Not Enough: Prosocial Agents for Cooperative AI」(Huang/Tharas/Marro/Truong/Schölkopf/La Malfa/Jin, 2026) 标题作者均与引述一致,身份已核(0 存疑)。§75「Karma 向纯 LLM agent 迁移〔待核实〕」与 §123「亲社会 agent 大规模可扩展性〔待核实〕」是对论文结论外推的限定、非论文身份待核,保留不动。