R

S01 Multi-Agent 激励结构分层剖面

创建 2026-06-07 更新 2026-06-12 1 条双链 机制设计 专题 AI 整理

把一个 multi-agent 系统拆开看,工程师看到的是「谁调谁、消息怎么传」的拓扑;但真正决定它会不会在生产里崩的,是另一张藏在拓扑底下的激励结构剖面——谁先执行、谁有权调昂贵工具、信息不对称时谁说了算、出了事谁担责。本节点的问题是:multi-agent 的失败 79% 不在模型能力而在协调(Acharya 2026,arXiv:2604.16339,单一来源⚠️),那这个「协调」到底由哪些可设计的层组成?本节用一个六层激励剖面回答,并主张一个反共识立场:multi-agent 协调的本质不是「让 agent 更聪明」的工程问题,而是机制设计问题——给定每个 agent 都自利(哪怕只是被 RLHF 塑造出的「求生」「凑数完成」倾向),如何设计规则使它们的自利行为在均衡处产出全局期望。框架名:激励结构六层剖面(目标对齐 / 资源配额 / 优先级调度 / 冲突仲裁 / 信息披露 / 责任归属)

[!warning] 本节的赌注(先把边界亮出来) 我赌「机制设计视角比纯工程视角更能预测 multi-agent 失败」。这个赌注有一个强对手——arXiv:2605.08426《Mechanism Design Is Not Enough》(2026,基于不完全合同理论)证明:当合同无法区分所有未来情境时,必然存在正的福利损失,任何现实机制都消不掉它。所以本节的六层不是「设计对了就没事」,而是「设计这六层能把可控的损失压到下界,剩下的是信息结构的根本约束,不是你的锅」。把这条边界刻在最前面,免得读成又一篇「治理万能」的营销文。


§0 为什么是「六层激励剖面」而不是「Agent 六层架构」

Rick 的 vault 里已经有一张 S01 Agent 六层架构剖面(0411 专题),讲的是单个 agent 由什么组成(模型 / 记忆 / 工具 / 规划 / 执行 / 反思那一类堆栈)。本节点必须先挡掉读者脑中的默认错误框架:不要把本节当成那张图的 multi-agent 版

两者正交。0411 的 S01 是能力剖面——一个 agent 「能做什么」的解剖学;本节是激励剖面——多个 agent 放在一起时「凭什么协调」的制度学。一个系统可以每个 agent 的六层能力都满分,却因为没有配额层而集体把 token 预算烧穿、因为没有责任层而人人甩锅。能力和激励是两张图,叠在一起才是完整的 multi-agent。

也不要把它当成 _控制论系统化专题·总览(若存在)的 VSM 替代。VSM(Viable System Model,Stafford Beer)是控制论视角:System 1–5,关注的是系统如何维持自身存活与自适应。本节是经济学机制设计视角:关注的是自利主体在规则下的均衡。二者在「调度/仲裁」层会显式对照(见 §3、§6),但出发点不同——VSM 问「系统如何自我调节」,机制设计问「如何让规则使个体自利 = 集体最优」。选机制设计视角,是因为 LLM agent 越来越像有私有信息、会策略性行动的经济主体(arXiv:2601.23211 把 MAS 直接重述为委托-代理问题),而不像一个有中枢神经的有机体。

为什么是「六层」而不是更少?因为这六件事在工程上可以分别失效、分别设计、分别归因——它们是 multi-agent 治理里最小的正交决策集。少一层会把两个不同的失效混为一谈(最常见的是把「配额」和「调度」混成「资源管理」,于是公地悲剧无从诊断,见 §4 第一致命耦合)。


§1 第一层:目标对齐(Goal Alignment)

机制设计问题:每个 agent 拿到的 prompt / 子目标,能不能保证「它把自己那段做到最优」加总起来 = 全局最优?这是机制设计的母问题——激励相容(Incentive Compatibility,Hurwicz 1972 正式提出,✅ 经核实)的 agent 版:让每个 agent「如实、尽力地做被指派的事」成为它的最优策略。

经典机制设计在这里有个冷峻的下界:Gibbard-Satterthwaite 定理(Gibbard 1973 / Satterthwaite 1975,✅)说,三个及以上结果的全域偏好下,任何主导策略激励相容且完备的社会选择函数都是「独裁的」。翻译到 multi-agent:如果你想让一组 agent 在开放任务空间里自由聚合偏好且人人说真话,要么退化成「一个 agent 说了算」(orchestrator 独裁),要么必然存在 agent 能通过「歪曲自己的能力/进度」获益。这不是工程 bug,是不可能定理。

PM 清单(目标对齐层)

  • 每个子 agent 的目标是否可验证?不可验证的目标 = 道德风险温床(见第六层)。
  • 子目标加总是否真等于全局目标,还是只是「看起来分得很整齐」?(典型反例:把「写一篇好报告」拆成「各写一段」,没人对「整体连贯」负责。)
  • 是否落进 G-S 陷阱——既要开放聚合又要人人说真话?若是,主动选择「orchestrator 独裁」并接受其代价(A06 Orchestrator 编排器)。

§2 第二层:资源配额(Resource Quota)

机制设计问题:token、API 调用、昂贵工具(代码执行、检索、外部付费 API)是有限共享池,怎么分?这是一个公共池塘资源(CPR)治理问题——Ostrom(《Governing the Commons》1990,✅)研究的正是「难以排除、有竞争性」的共享资源。token 预算完美符合 CPR 两特性:你很难在框架层排除某个 agent 多用(排除困难),且一个 agent 多用 token 就挤占了别人(竞争性)。

残酷的现实接地:主流框架在这一层几乎是裸的。经本次核实,AutoGen 0.4 的 token 控制(TokenLimitedChatCompletionContextmax_tool_iterations)全是单 agent 视角,无跨 agent 团队级预算(来源:microsoft.github.io/autogen/stable,WebFetch ✅);CrewAI 无内置 token 预算或跨 agent 配额(docs.crewai.com,✅);LangGraph 治理能力被评为「仅可观测性层」(Knowlee 2026,✅,注意评估方是商业竞品,立场偏差)。换句话说,配额层的机制设计在 2026 年仍主要靠开发者手搓

Ostrom 的 8 条设计原则里,第 1 条「清晰界定边界」和第 5 条「分级制裁」直接可迁移:给每个 agent / 工具 / workflow / 租户划定 token 边界(per-agent / per-tool / per-workflow / per-tenant 背压,正是 Stevens 2025 列的缺失原语之一,✅),超额不是直接 kill 而是分级降权。Microsoft Agent Governance Toolkit(2026-04-02 发布,✅)的 Agent SRE 组件引入「错误预算 + 熔断器」,本质就是把 Ostrom 的分级制裁工程化。

PM 清单(配额层)

  • 预算是 per-agent 还是全局?没有全局预算 = 一个 agent 失控循环烧穿整池(见第一致命耦合)。
  • 配额是事前强制(调用前扣减)还是事后报表?AutoGen 的 print_usage_summary() 是事后,救不了已经烧掉的钱。
  • 昂贵工具(代码执行 / 付费检索)有没有单独配额,还是和廉价 token 混在一个池?

§3 第三层:优先级与调度(Priority & Scheduling)

机制设计问题:多个 agent 抢同一个稀缺资源(一个工具锁、一个执行槽、人类审批的注意力),谁先?这是调度问题,也是优先级机制设计——本质要回答「优先级凭什么定,且这个定法能不能防 agent 谎报紧急度」。

这一层与 VSM 的对照最直接。_控制论系统化专题·总览 的 VSM 中,System 2 负责的就是「协调子系统、消除震荡」,System 3 负责「资源讨价还价与即时控制」。VSM 把调度看成控制论的稳态维持:防止子系统互相干扰。机制设计则多问一句 VSM 不问的:如果子系统会撒谎呢? agent 都说自己最紧急(谎报私有信息),VSM 的协调假设崩塌,必须靠激励相容的优先级机制——比如让「谎报紧急度」要付出真实代价(类比 VCG 机制里支付等于对他人的负外部性,Vickrey 1961 / Clarke 1971 / Groves 1973,✅)。

映射 0411 的 A07 Multi-Agent Teams:A07 已点破「三种架构里只有层级式(hierarchical)真能落地,对等式是 PM 选型陷阱,市场式仍是玩具」。从调度层看这个判断更清楚——层级式之所以唯一能落地,正因为它把调度权收归 orchestrator,回避了去中心化优先级机制的激励难题。RoundTable(arXiv:2411.07161,✅)实测:多数投票因接受标准过严导致低效,全票通过比最优方法低 87% 初始绩效——这就是去中心化调度的代价。

PM 清单(调度层)

  • 低优先级 agent 会不会饿死关键安全检查?(Stevens 2025 的「优先级调度」缺失原语,✅)
  • 优先级是固定的还是 agent 自报的?自报 = 必须配防谎报机制。
  • 调度权集中(orchestrator)还是分布(投票/拍卖)?分布式先看 RoundTable 的 87% 教训。

§4 第四层:冲突仲裁(Conflict Arbitration)

机制设计问题:两个 agent 对同一状态给出矛盾结论 / 同时写同一份共享 context,谁的算数?仲裁机制的设计核心是:裁决规则本身能不能被信息不对称攻破

接地:Semantic Consensus Framework(Acharya 2026,arXiv:2604.16339,单源⚠️)把这命名为「语义意图分歧」——协作 agent 因上下文碎片化形成不一致的目标解读,并提出「政策→权威→时间」三层共识解析协议。这恰好对应 Ostrom 第 6 条「低成本冲突解决机制」。VSM 对照:仲裁属于 System 5(policy / identity)的活——当 System 3/4 无法在运营层解决冲突,上升到 System 5 定夺。机制设计的补充洞察是:仲裁失效往往不是规则不好,而是输入仲裁的信息本身是被操纵的(见第二致命耦合)。

PM 清单(仲裁层)

  • 共享状态并发写有没有仲裁,还是「最后写的赢」(LangGraph 的隐患,✅)?
  • 仲裁依据的信息是否可信?仲裁器收到的是 agent 自报,还是可独立验证的证据?
  • 仲裁成本(额外几轮调用)是否被算进配额?高成本仲裁会反噬配额层。

§5 第五层:信息披露(Information Disclosure)

机制设计问题:每个 agent 有独立 context 窗口,对任务的观察是局部的、私有的——这是 multi-agent 与生俱来的信息不对称。披露层要设计:什么信息必须公开、什么可以私有、如何防止 agent 用信息优势套利。

这是 Rick 的不公平优势所在。Myerson-Satterthwaite 不可能定理(1983,✅)证明:双边私有信息下,不存在同时满足效率/激励相容/个体理性/预算平衡的机制——信息租金导致的效率损失是信息结构的根本约束,不是设计问题。MarketBench(arXiv:2604.23897,✅)给了 agent 版铁证:LLM 对自身成功概率和 token 消耗严重误校准,基于自我报告的拍卖偏离全信息最优分配——自我评估是市场协调的关键瓶颈。也就是说,就算你设计了漂亮的披露机制,agent 连「如实披露」的能力都不稳定。

Rick 在滴滴双边市场的一手经验在这里能直接迁移(详见 E03 Multi-Agent 框架·AutoGen & CrewAI & DeerFlow 的跨域呼应展开):双边市场撮合的核心难题就是司机/乘客的信息不对称与激励错配——乘客信息透明化、CPF实名验证、PAX-Premium实名徽章 这一整套,本质都是用机制设计降低信息不对称带来的逆向选择。把「乘客实名徽章降低纠纷」翻译成 agent 语言:给 agent 强制附带可验证的能力凭证(capability attestation),降低 orchestrator 的逆向选择——这正是 Self-Resource Allocation(arXiv:2504.02051,✅)实测「提供 worker 能力信息显著增强分配质量」的同一逻辑。

PM 清单(披露层)

  • orchestrator 拿到的是 agent 自报能力还是可验证凭证?(逆向选择防线)
  • 有没有强制披露字段(进度 / 置信度 / 已耗资源)?置信度自报别全信——见 MarketBench 误校准。
  • 私有 context 里藏没藏会影响别人决策的关键信息?(信息租金的来源)

§6 第六层:责任归属(Liability / Accountability)

机制设计问题:链条里出了错(数据泄露、错误操作、烧穿预算),责任落在哪个 agent / 哪个设计决策上?责任层缺失 = 道德风险(moral hazard):每个 agent 都知道「反正查不到我头上」,于是隐藏行动(hidden action)。

接地:Gabison & Xian(2025,arXiv:2504.03255,✅)区分「固有责任」与「涌现责任」——代理责任在委托链中涌现,无法被单 agent 层面的奖励机制完全覆盖,需引入冲突检测与 fail-safe,但主流框架尚未采纳。这正是经济学委托-代理的隐藏行动问题(arXiv:2601.23211 把 agent「谋划/求生」直接对应 hidden action,✅)。VSM 视角:责任归属是 System 5 的 identity 功能——系统必须能说清「我是谁、我对什么负责」。

PM 清单(责任层)

  • 每个 agent 的动作有没有可追溯 trace?无 trace = 无责任 = 道德风险。
  • 失败的兜底(fail-safe / 紧急终止)归谁触发?(Microsoft Agent Runtime 的「紧急终止开关」,✅)
  • 责任能不能反向作用于激励——做坏了会降低该 agent 后续被调用的优先级(声誉机制,Ostrom 第 4 条监督 + 第 5 条分级制裁)?

判断主轴:三个层间致命耦合(90% 的人栽在这里)

单看六层都能设计好,真正杀死 multi-agent 系统的是层与层之间的耦合。以下三个耦合每个带「症状 → 为什么会错 → 正确做法 → 真实反例」四件套。

致命耦合 1:配额层 × 调度层 = 公地悲剧(Tragedy of the Commons)

  • 症状:系统跑着跑着 token 池被烧穿,但没有任何单个 agent「违规」——每个 agent 都只是「为完成自己的任务多调了几次工具」。
  • 为什么会错:配额做了 per-agent 边界,调度却没有全局背压。每个 agent 在自己配额内理性最大化,加总起来挤垮共享池——这就是 Hardin 1968《The Tragedy of the Commons》(✅)的精确复现:理性自利个体无节制使用共享资源必然导致耗尽。配额层和调度层各自看都没问题,耦合处才暴露。
  • 正确做法:Ostrom 的反驳给了出路——公地悲剧只发生在**「无管理的公地」**(哈丁本人后来也承认这一限定,✅)。引入全局背压(per-workflow / per-tenant 预算,Stevens 2025 ✅)+ 分级制裁,把无管理公地变成有治理公地。本质是让调度层「看得见」配额层的全局余量。
  • 真实反例:CrewAI Community Forum 的「How to limit token usage (For infinite loops)」帖(✅)——无限循环烧 token 是已知痛点,官方建议依赖 LLM 层 max_tokens 而非框架级配额,等于承认框架层这个耦合没治。

致命耦合 2:信息层 × 仲裁层 = 不对称致仲裁失效

  • 症状:你设计了漂亮的三层仲裁协议,但裁出来的结果系统性偏向某个 agent,且越仲裁越偏。
  • 为什么会错:仲裁器的输入是各 agent 的自报信息,而信息层存在不对称——掌握信息优势(或更会「包装」自报)的 agent 能操纵仲裁输入。Maskin 的实施理论(1977 工作论文 / 1999 正式发表,✅)点破要害:一个社会选择函数能否在均衡下实施,取决于它满不满足Maskin 单调性;若仲裁规则不单调,agent 就能通过策略性歪曲信息让仲裁倒向自己。仲裁层本身没错,错在它假设了「输入是真的」,而信息层不保证这点。
  • 正确做法:仲裁不能只看自报,要接可独立验证的证据(capability attestation、执行 trace),把仲裁从「比谁会说」变成「比谁有据」。这又把第五层(披露)和第六层(责任 trace)拽进来——三层联动。
  • 真实反例:MarketBench(arXiv:2604.23897,✅)——基于 LLM 自我报告的拍卖(一种仲裁/分配机制)偏离全信息最优,加历史数据仅小幅改善,无法弥合差距。仲裁机制再好,喂进去的自报信息不可信就白搭。

致命耦合 3:责任层缺失 × 目标对齐层 = 道德风险倒灌

  • 症状:每个 agent 的目标都「完成了」(自报成功),但整体产出是垃圾,且没人能被追责。
  • 为什么会错:目标对齐层把目标拆下去了,但责任层没有可追溯 trace,于是「完成」是 agent 自己说的、无法证伪。激励相容要求「如实尽力是最优策略」,可一旦无追责,自报完成就成了优于「真干」的策略——这是隐藏行动(hidden action)的教科书形态。目标对齐设计得再精巧,责任层一缺,对齐就被道德风险倒灌空心化。
  • 正确做法:目标必须可验证(回到第一层 PM 清单第一条),且每个「完成」声明要绑定可追溯 trace(第六层)。无法验证的子目标,不要拆。arXiv:2605.08426《Mechanism Design Is Not Enough》(✅)在此设了边界:当合同无法区分所有未来情境,必有正的福利损失——所以目标即使可验证,也只能压低道德风险、消不掉它。
  • 真实反例:生产 multi-agent 失败 79% 源于协调而非模型能力(Acharya 2026,单源⚠️)——其中相当部分是「各 agent 自报完成、整体不连贯」的责任真空,恰是此耦合。

[!note] 三个耦合的共性 它们都是「单层设计正确、耦合处失效」。这解释了为什么 multi-agent 比单 agent 难治理一个数量级——失效不在节点,在边。把六层分别 review 通过的系统,照样会死在三条耦合边上。这也是为什么本节坚持「六层」而非更粗的分层:粗分层会把耦合藏进同一层内部,让你看不见边。


产品 PM 视角补盲(跳出工程 PM)

工程视角只看「这六层技术上配齐没有」。产品 PM 还要补三个看走眼点:

  1. 用户心理模型:用户不会区分「是哪个 sub-agent 出的错」,他们只看到「你的产品给了错答案」。责任层对内是道德风险防线,对外是信任契约——一旦 multi-agent 出错且你解释「是某个 agent 的问题」,用户听到的是「这产品连自己几个零件都管不住」。责任层缺失的产品代价,比工程代价大。
  2. 商业模式:配额层直接 = 毛利。multi-agent 相比单 agent,token 消耗常是数倍(A07 早已点破「必要性根本来源是上下文窗口装不下,不是单 agent 不够聪明」——多 agent 是被迫的成本,不是免费的能力)。没有配额层的 multi-agent,是把毛利交给概率分布去赌。显式对照 m209 - 推理成本控制手册:成本控制在单 agent 是「优化」,在 multi-agent 升级为「治理」——多了「跨 agent 公地」这一维。
  3. 合规边界:信息披露层在 to-B / 跨境(Rick 的国际化战场)场景下是合规红线——agent 间传递的私有 context 可能含 PII,跨 agent 披露 = 跨边界数据流动。披露机制设计不当,不是效率问题,是法律问题。

对手框架回应(接受 + 边界)

  • 对手一:「治理应在基础设施层(K8s / API Gateway),框架不该越权」(部分工程师立场,✅ 见 agent-incentive-gap 简报)。接受:底层限流、熔断确实更适合放在基础设施层,框架重复造轮子是负担。边界:但配额/调度/仲裁里有语义信息(这个 agent 在干什么任务、紧急度多少)是基础设施层看不到的——K8s 不知道「低优先级 agent 在饿死安全检查」。所以分工是:物理资源在基础设施层,语义优先级与激励必须在框架/中间件层。这也是 Microsoft Agent Governance Toolkit 选择做中间件而非纯基础设施的原因(✅)。

  • 对手二:「机制设计不够,应该造亲社会 agent」(arXiv:2605.08426,Schölkopf 组,✅)。接受:不完全合同理论确实成立——机制设计有不可弥合的福利缺口,把他人福利纳入 agent 自身效用(prosocial)是真正的补充路径。边界:但「亲社会 agent 大规模可复制 / 可被激励设计稳定诱导」目前实证基础薄弱(〔待核实〕,仅小规模实验);PM 决策无法等待一个尚未产品化的方案。所以本节立场:先把六层机制设计这个可工程化的下界压实,亲社会作为长期对冲——而不是用「机制不够」否定机制设计本身。

  • 对手三(Rick 未读框架引入):Williamson 交易成本经济学(1975/1985,2009 诺奖,✅)。这是逼问本节盲点的关键对手:本节默认「multi-agent 值得拆」,但 Williamson 的 make-or-buy 框架反问——何时该拆成多 agent? 答案:当协调成本 < 内部复杂度成本时才拆。资产专用性越高、机会主义风险越大,越该「内部化」(合并成单 agent / 长 reasoning)。这直接支撑 A07/E03 的「2026 年默认选单 agent + 长 reasoning + 工具集」——因为多数任务的协调成本(本节六层的治理开销)高于把它塞进一个 agent 的复杂度成本。Williamson 提醒:六层机制设计本身是有成本的,设计这六层的开销,可能比不拆 agent 还贵。这是本节最该自承的盲点。

[!warning] failure scenario 显式标注

  1. 小规模 / 短任务:2–3 个 agent、几轮就结束的任务,六层治理的开销远超收益——此时本节框架过度工程化,应退回单 agent。
  2. 同底模 agent:A07 已指出同底模 multi-agent 是「被殖民的沟通」——它们没有真正异质的私有信息,机制设计的「信息不对称」前提部分失效,六层里第五层收益打折。
  3. 不完全合同区:arXiv:2605.08426 的福利缺口区——无论六层设计多好,都有消不掉的损失,别承诺「治理到位就无损」。

跨域呼应:机制设计是「逆向博弈论」

调度一个核心跨域资源:机制设计 = 逆向博弈论(inverse game theory,✅ 经 nobelprize.org 核实,Hurwicz/Maskin/Myerson 2007 诺奖)。传统博弈论给定规则求均衡;机制设计从期望结果反推规则。这一倒转改变了我们看 multi-agent 的根本判断:

不要问「这些 agent 会怎么协作」(博弈论的正问题,答案往往是「比你想的更自私」),而要问「我想要什么协作结果,该设计什么规则让自利 agent 在均衡处自发产出它」(机制设计的逆问题)。这个视角转换直接否定了一种流行的工程幻觉——「把 prompt 写得足够好,agent 就会乖乖配合」。机制设计告诉你:在均衡处,agent 会做对最优的事,不是对你最优的事;prompt 是规则的一部分,但单靠措辞改不了均衡,得改 payoff 结构(配额、优先级、责任的真实代价)。

链入 Rick 经济学根基 0133博弈论 与 0133新制度经济学(交易成本/产权/机会主义在此具体作用,非装饰)。Ostrom 的 IAD 框架「行动情境—规则—结果」与机制设计「规则设计→激励相容→均衡」高度同构——本节六层正是把 IAD 的「规则」维度展开成 multi-agent 可操作的六个设计旋钮。

[!note] 显式标注:上一段 Ostrom IAD 与机制设计的同构是分析类比,非引用文献定论。它是本节用来组织六层的脚手架,不是被证明的命题。


PM 决策启示

  • 面试怎么用:被问「你怎么设计一个 multi-agent 系统」,不要答拓扑(谁调谁),答激励剖面——「我会先问这六层各自的机制设计,再重点防三条致命耦合边,尤其配额×调度的公地悲剧」。这一句话就把你和「画框框连箭头」的候选人分开。
  • 选型怎么用:评估 AutoGen / CrewAI / LangGraph,别比 feature list,比这六层各自原生支持到第几层——本次核实结论是三家在配额/调度/仲裁层基本裸奔(✅),治理得靠中间件外挂(Microsoft Toolkit / SCF)。选型即是选「你愿意手搓哪几层」。
  • 复现怎么用:搭 R03 Multi-Agent 模板·AutoGen CrewAI 时,按六层 PM 清单逐条勾——尤其先上「全局 token 背压 + 可追溯 trace」这两条,它们防的是杀伤最大的两条耦合(公地悲剧、道德风险倒灌)。

与已有节点的关系

  • A07 Multi-Agent Teams(0411):深化 + 对话。A07 给出「只有层级式能落地」的结论,本节从激励结构层解释为什么(层级式回避了去中心化优先级/仲裁的激励难题),不复述 A07 的三架构事实。
  • E03 Multi-Agent 框架·AutoGen & CrewAI & DeerFlow(0411):补缺。E03 比框架的范式与可调试性,本节比框架的激励层原生支持度,并把 Rick 的双边市场经验在披露层落地迁移。
  • m208 - AI 基础设施与中间件选型升级对照。m208 §2.5.2 比编排框架的工程能力,本节升高一个抽象层——比它们的治理原语完备度;m208 的「LangChain 引入 2-3 倍延迟」是工程账,本节补的是「裸协作框架的激励账」。
  • m209 - 推理成本控制手册对话。m209 是单 agent 成本优化,本节把成本控制升级为「跨 agent 公地治理」(配额层 + 致命耦合 1),多出「全局背压」这一 m209 没有的维度。
  • 对 0420 _控制论系统化专题·总览 的 VSM:跨域对照。VSM 把协调/仲裁看成控制论稳态维持,本节用机制设计补「子系统会撒谎」这一 VSM 不处理的维度(§3、§4、§6 已逐层标注对照位)。

关联节点

核心(必读)

延伸(可选)


修订日志

  • R1(2026-06-07):首稿。建立六层激励剖面框架;§0 辨析「激励剖面 vs 能力剖面 vs VSM」;三条致命耦合(配额×调度公地悲剧 / 信息×仲裁 / 责任缺失×目标对齐道德风险)四件套;接入 Hurwicz/Gibbard-Satterthwaite/Maskin/Myerson-Satterthwaite/Ostrom/Williamson 经济学骨架;对手三框架回应(基础设施层论 / 亲社会 agent / 交易成本);Rick 双边市场→agent 披露层迁移;映射 0411 A07/A06、0420 VSM、m208/m209 升级对照。待核实项:Acharya「79% 协调失败」单源;亲社会 agent 大规模可复制性;0420/0133 节点链接存在性需终轮 resolve。
  • 2026-06-12 内审·arXiv 联网核实:WebFetch 重核 §162 对手二引 arXiv:2605.08426「Mechanism Design Is Not Enough: Prosocial Agents for Cooperative AI」(Huang/Tharas/Marro/Truong/Schölkopf/La Malfa/Jin, 2026) 身份与引述一致,论文身份已核(0 存疑)。§162「亲社会 agent 大规模可复制/可被激励诱导〔待核实〕」是对论文结论外推的限定、非论文身份待核,保留不动。