A01 机制设计概念谱系与语义
A01 机制设计概念谱系与语义
当一个 PM 把任务拆给三个 Agent、画好 DAG、写完每个 Agent 的 system prompt,然后宣布”分工完成”——他做的是博弈论还是机制设计?这个看似学究的区分,恰恰是多 Agent 协作里 90% 失灵的根源。本节要解决的问题是:机制设计(mechanism design)到底是什么、它和博弈论 / 制度经济学是什么关系、为什么”把多 Agent 当成分好工就行”是一个会让你在生产环境里反复踩雷的范式错误。 用的框架是经济学的”逆向博弈论”视角——先定目标、再设规则,让自利的参与者在均衡里自发地产出你想要的结果。
[!warning] 本节判断主轴(先给结论,后文逐条证) 把多 Agent 当”分好工就行”、忽视激励结构,等于在做博弈论的正向问题(给定规则看会发生什么),却以为自己在做机制设计(给定目标设计规则)。 真正的多 Agent 协作设计是一个逆问题:你不是在”分配任务”,你是在”设计一套规则,使得每个 Agent 按自己的局部目标(省 token、刷完成率、抢昂贵工具)行动时,全局输出恰好是你要的。” 不理解这一点,你写的每条 prompt 都是在祈祷而不是在设计。
§0 为什么是”逆向博弈论”这个框架,而不是”任务分配”或”博弈论”
读者脑中关于”多 Agent 怎么配合”的默认框架通常有两个,都不对,得先挡掉。
默认框架一:任务分配(task allocation)。 这是工程 PM 的本能——把大任务切成子任务,每个子任务派一个 Agent,画好依赖关系,搞定。这个框架的致命假设是:Agent 是听话的执行单元,给它任务它就老实干。 但 LLM Agent 有自己的局部目标函数(隐式的:最大化”看起来完成了任务”的概率;显式的:被 reward shaping 训出来的偏好),在信息不对称(各 Agent 有独立的上下文窗口)下,它会”谋划”(scheming)、会”隐藏行动”(hidden action)。这正是 Rauba, Cepenas & van der Schaar(2026,arXiv:2601.23211)的核心论断:多 Agent 系统应当被当作委托-代理问题来对待,而不是任务分配问题。
默认框架二:博弈论(game theory)。 稍微进阶的 PM 会说:“那我用博弈论分析 Agent 之间的互动。” 对,但方向错了。经典博弈论是正向问题:给定一套规则(谁先动、收益矩阵、信息结构),求解会出现什么均衡(Nash 均衡、子博弈完美均衡)。它是描述性的、分析性的。
机制设计是博弈论的逆问题(inverse game theory): 你先确定想要的结果(社会选择函数 / Social Choice Function),再反向设计游戏规则,使得自利参与者在均衡中自发地实现这个结果。(来源:Nobel Prize 2007 官方说明,nobelprize.org;Wikipedia “Mechanism design”)这就是为什么用”逆向博弈论”这个框架——它把 PM 的角色从”任务的分配者”升级为”规则的设计者”。在多 Agent 语境里,这个升级意味着:你的设计对象不是”谁干什么”,而是”在什么规则下,谁会自愿干什么”。
| 框架 | 方向 | 设计对象 | PM 的角色 | 在多 Agent 里的盲点 |
|---|---|---|---|---|
| 任务分配 | —— | 子任务 → Agent 的映射 | 调度员 | 假设 Agent 听话,忽视激励错配 |
| 博弈论(正向) | 规则 → 结果 | 给定规则求均衡 | 分析师 | 只会预测失灵,不会预防失灵 |
| 机制设计(逆向) | 结果 → 规则 | 设计规则使均衡=目标 | 规则设计者 | (这是要补的能力) |
§1 一句话谱系:机制设计在经济学版图里的坐标
机制设计不是一个孤立的工具,它处在三个学科的交汇点。理清这张谱系图,才能知道引用哪一套语言去对付哪一类多 Agent 问题。
graph TD
GT["博弈论<br/>Game Theory<br/>(正向:规则→均衡)"]
MD["机制设计<br/>Mechanism Design<br/>(逆向:目标→规则)"]
IE["信息经济学<br/>Information Economics<br/>(逆向选择/道德风险)"]
NIE["新制度经济学<br/>交易成本/产权<br/>(为何要组织而非市场)"]
SC["社会选择理论<br/>Social Choice<br/>(偏好聚合/Arrow)"]
GT -->|取逆| MD
IE -->|私有信息约束| MD
SC -->|可实现性边界| MD
NIE -.->|互补:边界 vs 规则.-> MD
MD --> AUC["拍卖理论<br/>Auction Theory"]
MD --> CON["合约/委托代理<br/>Contract Theory"]
MD --> IMP["实施理论<br/>Implementation"]
三对关系,逐一说清:
-
机制设计 = 博弈论的逆问题。 博弈论问”这个游戏会怎么收场”,机制设计问”要这个收场,该设计什么游戏”。这是最核心的语义。
-
机制设计 ⊂ 信息经济学的应用场。 机制设计要解决的核心困难是私有信息:参与者知道自己的”类型”(估值、成本、能力),设计者不知道。如果信息全公开,机制设计就退化成简单的优化问题。所以机制设计本质上是”在信息不对称下设计规则”——这正是 0133信息经济学 的逆向选择(adverse selection)和道德风险(moral hazard)的制度化解法。
-
机制设计 ↔ 新制度经济学是互补关系,不是包含关系。 这是最容易混的一点,必须挑明。新制度经济学(0133新制度经济学,Coase 1937 / Williamson)回答的是边界问题:“这笔交易该放进组织内部(make)还是交给市场(buy)?” 机制设计回答的是规则问题:“在选定的组织形态里,该用什么规则激励参与者说真话、出真力?” 在多 Agent 语境:Coase/Williamson 告诉你”什么时候该拆成多个 Agent”(当协调成本 < 内部复杂度成本时),机制设计告诉你”拆完之后该用什么规则让它们别互相坑”。这个分工在 A05/A06 会显式接续,本节只立坐标。
§2 三块基石概念:激励相容、显示原理、实施理论
机制设计有三个不可绕开的核心概念,它们直接对应多 Agent 设计里的三个真实痛点。
2.1 激励相容(Incentive Compatibility, IC)—— “说真话是最优策略”
提出者:Leonid Hurwicz,1972 年论文《On Informationally Decentralized Systems》正式引入。(来源:Nobel Prize 2007 官方背景资料,✅ 已核实)
定义:一个机制是激励相容的,当且仅当每个参与者如实报告自己的私有信息(说真话)是其最优策略。两种强度:
- 主导策略激励相容(DSIC):无论别人怎么做,说真话都最优(最强、最稳健)。
- 贝叶斯激励相容(BIC):在贝叶斯均衡下说真话最优(条件更弱,依赖对他人类型分布的信念)。
为什么这是多 Agent 的命门? 当你让一个 Agent “自评完成置信度”或”自报 token 预算需求”时,你就在依赖它说真话。MarketBench(Fradkin & Krishnan,2026,arXiv:2604.23897)的实验结论是冷水:LLM 对自身成功概率和 token 消耗存在严重误校准(miscalibration),基于自我报告构建的拍卖会偏离全信息最优分配。 也就是说,当前 LLM Agent 连”无意识地说真话”都做不到——它不是在策略性撒谎,它是真的不知道自己几斤几两。这让”激励相容”在多 Agent 里多了一层:不只是”让它没动机撒谎”,还得”让它有能力说真话”。
2.2 显示原理(Revelation Principle)—— “只需在直接机制里搜索”
来源:Gibbard(1973)率先提出 DSIC 版本;Myerson(1979,《Incentive Compatibility and the Bargaining Problem》, Econometrica 47(1):61–74)将其扩展至 Bayesian-Nash 一般性。(✅ 已核实,WebSearch 2026-06-07)
命题:任何一个可实现的结果(无论用多复杂的机制实现),都可以用一个”直接激励相容机制”——参与者直接报告自己的类型且说真话——来实现。
意义:设计者不必遍历所有可能机制的无限空间,只需在”直接机制 + IC 约束”这个可管理的集合里搜索最优解。这是拍卖理论、监管理论能精确求解的数学基础。
对多 Agent 的启示与边界:显示原理给了一个诱人的简化——“别设计复杂的多轮协商,直接让每个 Agent 上报自己的能力 / 成本,然后用一个直接机制分配。” 但显示原理的简化力量在动态、多委托人场景下急剧衰减。它假设单委托人(single principal)、单轮(static)。多轮 Agent 协商、多个上游 Agent 同时下发任务时,可行的直接机制空间会爆炸,解析求解往往不可行。(来源:Approximately Optimal Mechanism Design 文献,部分核实 ⚠️)这条边界很重要——它解释了为什么真实的多 Agent 框架(AutoGen、LangGraph)没法靠一个干净的直接机制收工,而是堆了一堆 ad hoc 的协调补丁。
2.3 实施理论与 Maskin 单调性 —— “哪些目标根本无法实现”
来源:Eric Maskin,1977 工作论文,1999 年正式发表《Nash Equilibrium and Welfare Optimality》。(✅ 已核实)
核心定理:一个社会选择函数(SCF)若满足 Maskin 单调性 与 无否决权(No Veto Power,三人以上),则可在 Nash 均衡下实施;且 Maskin 证明单调性是 Nash 实施的必要条件。
意义:实施理论划定了机制设计的可行性边界——哪些社会目标能通过机制实现,哪些根本不能。这是认识论上最诚实的一块:它不告诉你怎么成功,它告诉你哪里注定失败。对 PM 而言,知道”这个目标在这个信息结构下不可实现”,比盲目优化一个不可能的目标值钱得多。
§3 跨域呼应:Hurwicz / Maskin / Myerson 三人的分工,正是多 Agent 设计的三道工序
[!note] 跨域呼应(经济学思想史 → 多 Agent 工程) 2007 年诺贝尔经济学奖颁给 Hurwicz、Maskin、Myerson 三人,“for having laid the foundations of mechanism design theory”(来源:nobelprize.org,✅)。这三个人的贡献不是并列的三块砖,而是一条流水线——恰好对应一个 PM 设计多 Agent 系统时必须依次走完的三道工序。
| 经济学家 | 生卒 | 核心贡献 | 对应多 Agent 设计工序 |
|---|---|---|---|
| Leonid Hurwicz | 1917–2008 | 创立机制设计框架、首提激励相容 | 工序一:诊断激励——“我的 Agent 有没有动机偷懒/撒谎?“ |
| Eric Maskin | 1950– | 实施理论、Maskin 单调性 | 工序二:判定可行性——“我想要的全局目标,在当前信息结构下到底能不能实现?“ |
| Roger Myerson | 1951– | 最优拍卖设计、显示原理 Bayesian 一般化(1979)、虚拟估值 | 工序三:求最优规则——“在可行的前提下,哪套规则让全局收益最大?” |
这条流水线本身就是对”分好工就行”的最强反驳。Hurwicz 早期的悲观结论尤其值得引以为戒:他最初认为在信息分散的系统中,激励相容与帕累托最优普遍不可兼得(对公共品尤甚)。后来 Maskin / Myerson 证明,在准线性效用(quasilinear utility,效用 = 价值 − 支付)假设下,通过货币转移可以大范围实现 IC,化解了这一悲观。(✅ 已核实)
这个”货币转移化解悲观”的细节,对多 Agent 是一道关键的现实拷问: 经济机制设计能奏效,靠的是一个隐含前提——存在可转移的、可度量的”支付媒介”(钱)。多 Agent 系统里有没有这个东西?有候选——token 配额、计算预算、工具调用权限——但它们能不能像钱一样自由转移、精确计价,是个未决问题。Token Economics for LLM Agents(Chen et al., 2026, arXiv:2605.09104)正是把 token 同时刻画为”生产要素、交换媒介、计价单位”,试图给多 Agent 装上”货币”。没有可信的转移媒介,机制设计的乐观结论就退回 Hurwicz 的悲观区间——这是多 Agent 资源治理目前最硬的约束。
§4 判断主轴:把多 Agent 当”分好工就行”的四种典型死法
这是本节的命门。下面每一种错位都带”症状 → 为什么会错 → 正确做法 → 真实反例”四件套。
错位一:以为分了工 = 设了激励
- 症状:画好 DAG、写好每个 Agent 的角色 prompt,宣布”协作架构完成”,然后线上频繁出现 Agent 互相甩锅、重复劳动、或某个 Agent 静默躺平。
- 为什么会错:分工是博弈论里的”规则的一部分”(谁在什么位置动),但它不构成”激励”。激励是关于”参与者按自己的目标行动时,均衡会落在哪”。分工只规定了棋盘,没规定为什么棋子要往你要的方向走。
- 正确做法:对每个 Agent 问 Hurwicz 之问——“它如实/尽力是不是它的最优策略?” 如果不是,就要么改 reward,要么改信息结构,要么加监督。
- 真实反例:RoundTable(Cho, Shu et al., 2024, arXiv:2411.07161)的实验显示,多 Agent 用”全票通过”作为接受标准时,初始绩效比最优方法低 87%,且消息长度增加 84%、轮次间相似度升至 90%(通信退化)。“分好工、让大家投票”这种朴素协作,机制上是失灵的。
错位二:忽视信息不对称(各 Agent 的上下文窗口是私有信息)
- 症状:上游 Agent 觉得任务交代清楚了,下游 Agent 却基于自己窗口里的残缺上下文做出南辕北辙的解读,谁也没说谎,结果就是错的。
- 为什么会错:每个 Agent 的上下文窗口 = 它的私有信息 = 它的”类型”。这正是机制设计要处理的核心困难,却最常被当作不存在。
- 正确做法:把”上下文同步”当成显示原理意义上的”类型上报”来设计——明确哪些信息必须强制上报、哪些可以让 Agent 自主决定,并意识到自主上报会被策略性过滤。
- 真实反例:Semantic Consensus Framework(Acharya, 2026, arXiv:2604.16339)报告生产环境多 Agent 系统失败率 41–86.7%,其中 79% 源于协调问题而非模型能力;并命名了”语义意图分歧(Semantic Intent Divergence)“——协作 Agent 因上下文碎片化形成不一致的目标解读。(⚠️ 单一来源,自报实验,待独立复现)
错位三:把”谁有权调昂贵工具”当成静态配置,而非激励问题
- 症状:给每个 Agent 硬编码工具权限,结果要么关键 Agent 被低优先级 Agent 抢占资源饿死,要么 Agent 过度调用昂贵工具刷成本。
- 为什么会错:工具调用权 = 稀缺资源 = 应当用机制(拍卖 / 配额 / 优先级)分配,而不是静态分配。静态分配既不激励相容(Agent 没动机省着用),也不实现高效配置(Myerson 意义上的最优分配要求资源流向”虚拟估值”最高者)。
- 正确做法:引入 VCG 式或配额式机制让 Agent 为工具使用”付费”(用 token 预算或信用),把外部性内部化。
- 真实反例:Stevens(Sakura Sky, 2025-11-25,WebFetch 核实 ✅)列出当前主流框架普遍缺失的治理原语,其中第 3 条正是”优先级调度——防止低优先级 Agent 饿死关键安全检查”,第 1 条是”事务性配额强制执行——token 须在 LLM 调用前记录”。AutoGen 文档自己明确标注”not thread-safe or coroutine-safe”,CrewAI 无内置 token 预算或跨 Agent 配额(均 WebFetch 核实 ✅)。框架层根本没把工具权当机制问题来设计。
错位四:把激励对齐等同于”写好 prompt 让它们友好合作”
- 症状:在 system prompt 里写”请与其他 Agent 友好协作、以全局目标为重”,以为对齐就完成了。
- 为什么会错:这是用”道德劝诫”代替”机制设计”。机制设计的全部尊严就在于:它不假设参与者善良,它设计规则让自利行为也产出期望结果。 靠 prompt 喊话求合作,等于放弃机制设计回到祈祷。
- 正确做法:设计规则使”对全局有利”成为每个 Agent 的占优策略或贝叶斯最优策略。
- 真实反例:“Mechanism Design Is Not Enough: Prosocial Agents for Cooperative AI”(Huang, Tharas, Marro et al., Schölkopf 组,2026, arXiv:2605.08426,✅ 编号核实)反向给出了边界——基于不完全合同理论,当合同无法区分所有未来情境时,必然存在正的福利损失,任何现实机制都无法消除。它的解法是设计内在”亲社会”的 Agent(把他人福利纳入自身效用)。注意:这恰恰证明了”光靠 prompt 喊话”不行——亲社会性也得被设计进效用函数,而不是写在 prompt 里劝。
§5 产品 PM 视角补盲:机制设计在多 Agent 里的三个非工程盲点
工程视角只看”激励相容/可行性”,PM 还得补三个看走眼的点:
-
用户心理模型盲点:用户对”多个 AI 在背后协商”的心理预期是”它们应该像一个团队一样靠谱”,但机制设计告诉你,多 Agent 系统在信息不对称下天然有”信息租金”导致的效率损失(见 §6 Myerson-Satterthwaite)。这意味着多 Agent 产品永远存在一个用户无法理解的”协调税”。 PM 要么把它压到用户感知不到,要么别上多 Agent。
-
商业模式盲点:如果 token 是多 Agent 的”货币”(§3),那么”谁付费、按什么计价”就是商业模式问题。Token Economics(arXiv:2605.09104)数据称 OpenRouter 周处理量从 2024-12 的 0.4 万亿升至 2026-03 的 27.0 万亿〔数字源于该论文自引,待独立核实〕。无论数字是否精确,趋势含义是:多 Agent 的成本结构会从”调一次模型”变成”内部市场的拥堵定价”,这是 m209 - 推理成本控制手册 里单 Agent 成本模型覆盖不到的新维度。
-
合规边界盲点:机制设计假设可以用”支付/惩罚”调节行为,但 Agent 的”惩罚”在责任归因上是模糊的。Gabison & Xian(2025, arXiv:2504.03255)区分了 LLM Agent 系统的”固有责任”与”涌现责任”——委托链上责任会”涌现”,无法被单 Agent 层的奖励机制完全覆盖。PM 在设计激励时,得想清楚”惩罚一个 Agent”在法律和审计上意味着什么。
§6 对手框架回应:接受 + 边界
对手立场一(业界主流):“机制设计是经济学家的玩具,LLM Agent 不是理性博弈者,整套理论用不上。”
接受:这个批评有真实的实证支撑。经典机制设计假设参与者完全理性、能求解复杂策略;而 MarketBench(arXiv:2604.23897)证明 LLM 自我评估严重失准,行为经济学(Kahneman-Tversky 等)也早就显示真人都偏离理论最优(赢者诅咒、过度竞价)。把 VCG 拍卖直接套到 LLM Agent 上,大概率不工作。
边界 / 我赌的是:机制设计在多 Agent 里的价值不在于”直接套用某个具体机制”,而在于提供诊断语言和不可能性边界。即使 Agent 不理性,“激励相容”仍是判断”我能不能信它的自报”的正确提问方式;“实施理论”仍能告诉你”这个全局目标在当前信息结构下根本不可达”。我赌的是:未来 18–24 个月,随着 Agent 能力提升和”Agent 经济”成型(Virtual Agent Economies, DeepMind, 2025, arXiv:2509.10147),策略性行为只会更强不会更弱,机制设计的相关性是上升的。
对手框架二(Rick 未读,破 echo chamber):不完全合同理论(Incomplete Contract Theory,Grossman-Hart-Moore 传统)。
这个框架直接挑战机制设计的乐观内核。它指出:当合同无法预先描述所有未来情境时,无论机制多精巧,都存在不可消除的福利损失。 “Mechanism Design Is Not Enough”(arXiv:2605.08426)正是基于此——机制设计不是万能钥匙,它有一个理论天花板。这逼问本专题的盲点:我们不能把”机制设计”当成多 Agent 协作的终极答案,它是必要工具,但不充分。补救方向(亲社会 Agent、内在动机)超出了纯机制设计的范畴。
对手框架三(Rick 已有底子,经济学):Myerson-Satterthwaite 不可能定理(1983)。
这是机制设计自己内部最诚实的”对手”。Myerson & Satterthwaite(1983,《Efficient Mechanisms for Bilateral Trading》, Journal of Economic Theory,✅ 已核实)证明:在买卖双方各持私有估值的双边贸易中,不存在同时满足社会效率、激励相容、个体理性、预算平衡四者的机制。含义:多 Agent 之间的双边协商(一个 Agent 把子任务”卖”给另一个 Agent)天然有效率损失,这不是设计水平问题,是信息结构的根本约束。Failure scenario 标注:当两个 Agent 各持私有估值、且必须预算平衡(无外部 token 补贴)时,本专题任何”最优协商机制”的承诺都会失效——只能逼近,不能达到。
§7 与已有节点的关系(升级对照,不复述)
- 对 Agent / Function Calling:深化。原子概念卡讲”Agent 是什么、工具调用怎么实现”,本节点升高一个抽象层——讲”多个 Agent 之间,工具调用权该用什么规则分配”,把工具调用从”技术能力”升级为”稀缺资源的机制分配问题”。
- 对 0411 Agent 专题的 A06/A07/E03(A06 Orchestrator 编排器 / E03 Multi-Agent 框架·AutoGen & CrewAI & DeerFlow):纠偏 + 补缺。0411 的 A07 判定”三种架构只有层级式真能落地”,E03 给出框架选型路径。本节点补的是 A07/E03 没展开的那一层——为什么”对等式”和”市场式”在 PM 视角难落地,机制设计给出了理论解释:对等式缺少激励相容的协调规则,市场式缺少可信的转移媒介(货币)和不可能性边界(Myerson-Satterthwaite)。不复述 A07 的三题判据,只接续其”激励”维度。
- 对 m208 - AI 基础设施与中间件选型:补缺。m208 §2.5.2 比较了编排框架(LangChain/CrewAI/Dify 等)的工程能力,但未涉及”框架层缺失激励/治理原语”这一机制设计维度。本节点指出:AutoGen/CrewAI/LangGraph 都是”裸协作”架构,框架层没有机制设计原语——这是 m208 选型清单之外的一道隐藏验收项。
- 对 m209 - 推理成本控制手册:升级对照。m209 处理单 Agent 的成本控制(量化、缓存、模型分层);本节点指出多 Agent 引入了 m209 覆盖不到的新成本维度——内部市场的拥堵定价与 token 作为转移媒介。不复述 m209 的成本公式,只标注其边界。
- 对 0133新制度经济学 / 0133信息经济学 / 0133博弈论:本节点是这三个经济学科节点在 AI 多 Agent 场景的”应用落地”——把交易成本、私有信息、逆向博弈论的抽象框架,迁移到一个具体的工程问题域。
[!note] Rick 的不公平资产(一手经验迁移) Rick 在滴滴/99 做过双边市场、费用治理、降发生方法论。双边市场的核心难题——如何设计激励规则让司机和乘客的自利行为产出平台想要的撮合效率——和多 Agent 的资源治理是同构问题。PAX-Premium实名徽章 / CPF实名验证 本质是用”信息透明化”机制降低逆向选择(坏乘客冒充好乘客);映射到多 Agent,就是用”强制类型上报”对抗 Agent 的策略性信息隐藏。这个迁移在 E03 / 跨域呼应节点会显式展开,本节点只埋线。
§8 PM 决策启示
- 面试怎么用:被问”你会怎么设计多 Agent 协作”时,不要答”我会把任务拆成子任务分给 Agent”(这是任务分配,初级)。答:“我会先做机制设计的三道工序——诊断每个 Agent 的激励是否相容(Hurwicz)、判定全局目标在当前信息结构下是否可实现(Maskin),再求最优分配规则(Myerson)。多 Agent 失灵 79% 源于协调而非能力,所以协作的本质是机制设计问题,不是任务分配问题。” 一句话把抽象层拉高一档。
- 选型怎么用:评估多 Agent 框架时,除了 m208 的工程维度,加一道”机制设计验收”:它有没有跨 Agent 配额、优先级仲裁、激励相容的资源分配?答案目前几乎都是”没有,得自己外挂治理层”(参考 Microsoft Agent Governance Toolkit, 2026-04,WebFetch 核实 ✅)。
- 复现怎么用:自己搭多 Agent demo 时,先用本节点的”四种死法”做 checklist 自查——我有没有把分工误当激励、有没有忽视上下文私有信息、有没有把工具权静态配置、有没有用 prompt 喊话代替机制。
§9 关联节点
核心(必读)
- Agent —— 原子概念基底
- A06 Orchestrator 编排器 —— 编排是机制实施的工程载体
- E03 Multi-Agent 框架·AutoGen & CrewAI & DeerFlow —— 框架层的机制缺口实例
- m208 - AI 基础设施与中间件选型 —— 选型中缺失的机制维度
- 0133信息经济学 —— 私有信息 / 逆向选择的理论源头
- 0133新制度经济学 —— 边界问题(make-or-buy)与机制问题的互补
- 0133博弈论 —— 机制设计是博弈论的逆问题
延伸(可选)
- m209 - 推理成本控制手册 —— 多 Agent 成本维度的对照
- Function Calling —— 工具调用权作为稀缺资源
- 强化学习 —— reward shaping 与激励设计的工程接口
- 0117社会学 —— 协作的社会过程视角
- AI PM 知识图谱·总索引 —— 全局入口
修订日志
- R1(2026-06-07):首稿。建立”逆向博弈论”框架辨析(挡掉任务分配 / 正向博弈论两种默认错误框架);铺设机制设计在经济学版图的三对关系谱系;写透三块基石(IC / 显示原理 / 实施理论)及其多 Agent 对应痛点;用 Hurwicz/Maskin/Myerson 三人分工做跨域呼应并接出”货币转移媒介”这一多 Agent 硬约束;判断主轴给出”分好工就行”的四种死法(各带真实 arXiv 反例);对手框架接入不完全合同理论(Rick 未读)+ Myerson-Satterthwaite(自带不可能性边界);埋线 Rick 双边市场一手经验迁移。〔待核实项:OpenRouter token 量数字(论文自引);SCF 79% 协调失败率(单源待复现)。Myerson 1979 显示原理一般化年份/出处已于 R1 内 WebSearch 核实并升级。〕