S02 AI 治理模式对照矩阵 · 知识库

当一家 AI 公司发布一份 model spec、一个国家通过 AI 法案、一个跨国论坛签下自愿承诺时，它们其实都在回答同一个被掩盖的问题——“谁有权为这个新出现的权力空间立法、执法、问责？” 本节点要解决的不是”哪种治理在道德上更好”，而是一个 PM/Policy 在选型会上真正要拍板的工程化问题：给定一类 AI 风险，该把治理职能放到哪个层级、哪种制度形态上，才能让合法性、执行力、问责、俘获风险这四个变量同时不崩。 用的框架是把治理拆成五种理想型制度形态（self-regulation / 平台自治 / 国家监管 / 国际治理 / 多利益相关方）× 四个制度维度的对照矩阵——不是”工具箱清单”,而是一张带权衡代价的决策表。

§0 为什么是”制度形态 × 制度维度”矩阵,而不是”硬法 vs 软法”二分

读者脑中最容易冒出的默认框架,是法学界惯用的 “硬法 vs 软法”(hard law / soft law) 二分:有强制力的算硬法,自愿的算软法。这个框架对 PM 决策是有害的简化,要先挡掉:

它把”形态”和”约束力”混为一谈。 国家监管也可以是软的(执法羸弱的法条),平台自治也可以是硬的(Meta 对账号的封禁就是即时生效、不可上诉的”硬”权力)。软硬是结果,不是形态。
它遮蔽了”谁来执法”这个最关键的制度变量。 EU AI Act 是硬法,但它的 GPAI 实践守则(Code of Practice)在技术上自愿、却提供”合规推定”(presumption of conformity,来源:Latham & Watkins 对 AI Act 的合规分析)——这是一个披着软法外衣的委托监管,二分法完全无法描述。
它没有问责维度。 一条没人能挑战的硬法,和一个有申诉机制的自治体系,在”问责”上的差异,二分法看不见。

所以本节点的框架是两维交叉:行(制度形态)回答”权力坐落在哪个主体”,列(制度维度)回答”这个主体在四个治理质量指标上各值几分”。这一拆法对标的是 §1 政治学的合法性—执行力—问责经典三角,再补上 AI 时代特有的第四维俘获风险(regulatory/discursive capture)——因为 AI 治理最致命的失败不是”管不住”,而是”被管的人写了管自己的规则”。

[!note] 跨域呼应预告这张矩阵的四个维度,直接对应政治学对”何为正当统治”的经典追问。把 AI 公司当成准国家行为体(quasi-sovereign actor)来评估,而不是当成”需要合规的企业”,是本专题(dim-institutional)与一般 AI 治理综述的根本分野。详见 §6。

§1 五种制度形态的理想型定义

先把五行说清楚——它们是 Max Weber 意义上的理想型(ideal type),现实中总是混合态,但纯化定义能让对照变锋利。

形态	谁立法	谁执法	谁问责	AI 领域的真实实例
① 自我监管 Self-Regulation	单个公司	同一公司	同一公司	Anthropic RSP / OpenAI Model Spec / Google AI Principles
② 平台自治 Platform Governance	平台 + 半独立机构	平台	半独立申诉机构	Meta Oversight Board;App Store / API policy
③ 国家监管 State Regulation	立法机关	行政监管机构	法院 / 议会	EU AI Act + AI Office;美国 EO 14179 后的去监管
④ 国际治理 International Governance	多边条约 / 国际组织	成员国	无强制问责(声誉)	OpenAI 倡议的”IAEA for AI”;Seoul Frontier Safety 承诺
⑤ 多利益相关方 Multistakeholder	公司+政府+学界+公民社会共商	混合	混合	EU GPAI Code of Practice 起草过程;白宫自愿承诺谈判

关键洞察:这五种不是按”强度”排成一条线(那又掉回软硬二分)。它们是按权力坐落点展开的光谱——从①完全私有,到③完全公共,②④⑤是三种不同的”中间态”。而 AI 公司当下真正在做的,是把治理职能主动锚定在①②④⑤(它们能影响的),系统性绕开③(它们最难控制的)。这本身就是一个准主权策略:不是逃避治理,而是抢占治理形态的定义权。

§2 四个维度的评分逻辑(矩阵怎么读)

维度	它问什么	高分长什么样	低分长什么样
合法性 Legitimacy	凭什么这套规则对所有人有效?	民主授权 / 受影响者参与 / 程序公开	公司自封 / 无被治理者同意
执行力 Enforcement	违规真的会有后果吗?	可强制、有罚则、有技术核查能力	”承诺备忘录”、无核查手段
问责 Accountability	决策错了,谁负责、能否纠正?	横向制衡 + 独立申诉 + 可诉	自评自纠、最终解释权归己
俘获风险 Capture Risk	规则制定有多大可能被被管者操纵?	利益隔离、旋转门受限	起草被业界主导、话语俘获

[!warning] 评分是序数不是基数下表的”★“是相对序数比较(谁比谁强),不是”客观打分”。同一形态在不同议题上分值会变(见 §4 决策表)。把 ★ 当成精确测量 = 误用本矩阵。这是本节点最大的 failure scenario,先标在前面。

§3 主矩阵:五形态 × 四维度

形态 ╲ 维度	合法性	执行力	问责	俘获风险(★越多=俘获越严重,越差)
① 自我监管	★☆☆☆☆	★★★☆☆	★☆☆☆☆	★★★★★
② 平台自治	★★☆☆☆	★★★★☆	★★★☆☆	★★★★☆
③ 国家监管	★★★★★	★★★☆☆	★★★★★	★★★☆☆
④ 国际治理	★★★☆☆	★☆☆☆☆	★★☆☆☆	★★★☆☆
⑤ 多利益相关方	★★★★☆	★★☆☆☆	★★★☆☆	★★★★☆

逐行的接地说明(这是矩阵的命门,每一格都要有证据,不能臆测):

① 自我监管——执行力意外地不低,合法性与问责双崩。 合法性给一星,因为规则由公司自写、自实施、自评估——Orozco y Villa & Menendez(2025,DigiCon)对 Constitutional AI 的核心批评正是”宪法”类比在规范上过于单薄(normatively too thin):公司既是立法者又是法官。执行力反而给到三星——因为公司对自己的模型有完全的技术控制力,RSP/Model Spec 一旦写进训练流程,执行是即时的(这是它相对国家监管的真实优势:国家没有计算资源和技术专长独立核查专有模型,来源:Chatham House 2026 类分析 + arXiv:2407.01557 对 Claude 治理的核查发现”无外部机构可核实 Claude 行为是否符合宪法目标”)。俘获风险拉满五星——这不是”被俘获”,这是定义上的俘获:被管者就是立法者。

② 平台自治——Meta Oversight Board 是这一格的最佳实证。 合法性两星:Oversight Board 引入了半独立的外部裁决,其决定被收录进 Westlaw / Lexis+ 法律数据库,联合国人权高专办与以色列最高法院曾正面引用(来源:Platformer 五周年回顾)——这比纯自我监管多了一层程序正当性。但执行力其实四星:平台对账号、内容、API 的处置是即时且事实上不可上诉的(Klonick 称之为”私法体系”)。问责三星:有申诉机制,但 Klonick 本人给 Oversight Board 综合评分仅 “勉强及格(C)“(来源:Platformer),且 Meta 保留政策最终解释权——2021 年 Trump 停权案中,Board 提的 19 条建议 Meta 仅承诺完全执行 15 条(约 79%),明确拒绝 1 条(来源:Oversight Board 决定原文 FB-691QAMHJ + TechCrunch 2022)。俘获四星:机构由 Meta 出资,Meta 已通知可能在 2028 年后停止资助(来源:TechBrew 2026)——金主即被监管者,结构性俘获。

③ 国家监管——唯一在合法性与问责上双满分的形态,但执行力被高估。 合法性五星、问责五星:有民主授权、有法院可诉、有议会问责,这是国家形态不可替代的优势。但执行力只给三星——这是反共识判断:EU AI Act 的执行力比想象中弱。 Sandra Wachter(Yale Journal of Law & Technology 26:3)指出 AI Act 三大结构性漏洞:过度依赖自我认证、执法机制软弱、对公私部门均设宽泛豁免(来源:yjolt.org)。EU AI Office 人手严重不足:当前约 125 人,MEP Axel Voss(2025 年 12 月)主张仅合规与安全单元就该有 ≥200 人,智库 Pour Demain 建议 GPAI 监管能力到 2030 年至少 160 人;且安全单元负责人、首席科学顾问等关键岗位至今空缺(来源:Lawfare “How Much Power Does the EU AI Office Actually Have”+Transformer News 2025)。俘获三星:不是最低,因为国家至少有利益隔离的形式;但科技业在布鲁塞尔年游说 €1.51 亿(较 2021 增 55%),Meta 单家年投 €1000 万为欧盟最大单一游说者,委员会高层 AI 议题 86% 会面对象是业界(来源:Corporate Europe Observatory),导致 GPAI 最初获豁免、基本权利审查条款被删——俘获真实发生。

④ 国际治理——合法性中等,但执行力是五形态最低。 合法性三星:多边性赋予一定正当性。但执行力一星——这是它的死穴。Seoul Frontier Safety Commitments(2024)、白宫自愿承诺都是无法律强制力的自愿协议;OpenAI 三位创始人(Altman / Brockman / Sutskever)2023 年 5 月 22 日博文倡议的”IAEA for AI”(对超过算力/能力阈值的项目设国际稽查机构,来源:TechCrunch 2023-05-22 + OpenAI “Governance of superintelligence”)至今仍是倡议而非机构。问责两星:只有声誉机制。这一行是 §4 决策表里”看起来美好、实则最不可依赖”的陷阱选项。

⑤ 多利益相关方——合法性高、执行力低,且俘获以”话语俘获”形态隐蔽发生。 合法性四星:公司+政府+学界+公民社会共商,程序上最具包容性。执行力两星:共识机制天然慢、易被否决权拖死。俘获四星:这里的俘获最隐蔽——Birhane 等(2026,arXiv:2605.06806,FAccT 2026 录用)在 100 篇报道中识别 249 项俘获实例,最主流叙事是”监管扼杀创新”(占 16%),“旋转门”出现在 24% 的高知名度案例;他们的核心发现是话语俘获先于制度俘获——业界通过资助研究、定义术语、主导专家咨询,在正式规则出台前已塑造了”可能性空间”。EU GPAI Code of Practice 起草中企业主导,正是这一格的实证。

§4 判断主轴:90% 的人在这张矩阵上会犯的 4 个错

这一节是本节点与”治理模式综述”的分水岭。每个错给出症状 → 为什么会错 → 正确做法 → 真实反例。

错误一:把”合法性高”当成”该选它”。

症状:看到国家监管合法性五星,就主张”AI 该交给政府管”。
为什么会错:合法性是正当性,不是有效性。AI Act 合法性满分,但执行力被自我认证漏洞掏空(Wachter)。一个合法但执行不了的规则,在前沿模型 6 个月迭代一次的速度下,等于没有规则。
正确做法:先看议题的时间常数。能力突现类风险(frontier risk)迭代快,只有①②(公司/平台,技术控制力强)能即时响应;权利侵害类风险(歧视、隐私)迭代慢、需可诉性,才适合③。
真实反例:GDPR 是合法性满分的国家监管,但对算法歧视的实际执法案例寥寥;反观 Anthropic RSP 虽合法性一星,却真的卡住了 ASL 阈值的模型发布(来源:RSP v2.0 PDF,assets.anthropic.com)。

错误二:把自愿承诺(①④)的”执行力”等同于”承诺的诚意”。

症状:OpenAI 签了 Seoul 承诺、Anthropic 发了 RSP,就认为”行业在自律,可以放心”。
为什么会错:Campos(2023,via ailabwatch)指出 RSP 是”风险管理做错了方向”——把举证责任从能力研发者转移到安全关切者:高危行业惯例是”不证明安全不得上市”,RSP 却默认放行直到触发阈值。竞争压力下,实验室有激励重新解释阈值定义。
正确做法:对自愿承诺,只信绑定了外部核查的部分。RSP v3.0 引入”潜在外部审查”是进步,但目前仍无实质独立审计机制(arXiv:2407.01557)。
真实反例:Facebook 广告透明承诺、烟草业自我监管的历史都显示,无约束力的自愿标准在竞争强化期系统性退化。

错误三:以为”多利益相关方=没有俘获”。

症状:看到 GPAI Code of Practice 由”独立专家组”起草,就认为程序中立。
为什么会错:多利益相关方恰恰是话语俘获的温床(Birhane 等 2026)。“独立”不等于”利益隔离”——起草者可能来自业界资助的机构,或已内化了业界框架。俘获不需要贿赂,只需要让”监管扼杀创新”成为房间里的默认共识。
正确做法:评估多方机制时,查起草者的资金来源和否决权分布,而非看”参与方数量”。
真实反例:EU GPAI Code 起草过程被指企业主导(来源:Birhane 等对俘获机制的分类)。

错误四:把五种形态当成”四选一”,而不是”分层组合”。

症状:在选型会上问”我们该走自律还是该等监管?”——这是个伪二选一。
为什么会错:成熟的治理是栈式组合:用①的技术执行力做即时拦截,用②的申诉机制补问责,用③的可诉性兜底权利,用⑤的协商补合法性。单一形态在四维上必有短板(见主矩阵,没有一行四维全满)。
正确做法:按议题把治理职能拆解后分配到不同形态——这正是 §5 决策表要给的东西。
真实反例:AI Act 自己就是组合体——硬法骨架(③)+ 自愿 Code of Practice 提供合规推定(⑤的执行外包)。问题不在组合,在于组合时把执行外包给了被监管者。

§5 决策表:给”该用哪种治理模式”拍板

这是本节点的最终交付——按风险类型而非按”形态偏好”来选。

风险类型	时间常数	首选主形态	必须叠加	致命陷阱
前沿能力突现(CBRN、自主复制)	极快(月)	① 自我监管(技术执行力)	④ 国际协调避免逐底竞争	只靠④:执行力一星,等不及
内容与言论治理	中(周-月)	② 平台自治(申诉机制)	③ 国家透明度要求(如 DSA)	只靠②:金主即被管者,问责打折
算法歧视 / 权利侵害	慢(年)	③ 国家监管(可诉性)	⑤ 受影响群体参与立法	只靠①:无受害者救济渠道
市场支配 / 准主权扩张	慢	③ 反垄断 + 国家监管	④ 跨境协调防”AI 孤岛”	只靠⑤:话语俘获使共识偏向业界
数据与基础设施依附	慢	③ + ⑤	② 平台级数据可携	纯市场自律:云租金锁定

读法:横轴的”时间常数”是隐藏的决策变量——风险迭代越快,越要靠技术控制力强(①②)的形态打头阵,因为公共形态(③④)的程序速度跟不上;风险越慢且涉及权利,越要靠可诉的公共形态(③)兜底。 这条规则把”该用哪种治理”从价值争论变成了可操作的工程判断。

§6 跨域呼应:把 AI 公司当准国家行为体,矩阵的四维才有理论根

这张矩阵的四个维度不是 PM 拍脑袋选的,而是政治学对”何为正当统治”的经典追问在 AI 场景的投影。本专题(dim-institutional)的独特资产,是把 AI 制度现象接到 Rick 的政治理论底子上——这里调度三个框架,每个都改变一格的判断,不是装饰。

O’Donnell 委任民主(Delegative Democracy,1994,Journal of Democracy 5:1)——解释”②平台自治的问责为什么注定打折”。 O’Donnell 区分纵向问责(选举式)与横向问责(制度间制衡)。委任民主的病理是:选民把全权委任出去后,横向问责实质缺位。把这套搬到 AI:用户用”安装/卸载”行使纵向问责(类比选举),但 Oversight Board 这类横向问责机构由被监管者出资、其建议可被拒——这正是 O’Donnell 笔下”纵向在、横向缺”的结构。所以②的问责三星不是机构设计不够努力,而是委任结构本身的天花板。(注:此为分析类比,O’Donnell 原框架针对拉美后威权国家,移植到非选举性的私营平台存在”分析单元错配”,见边界。)

Carl Schmitt 例外状态——解释”①自我监管执行力为什么反而高”。 “主权者是决定例外状态的人”(《政治神学》,1922)。AI 公司在”安全紧急状态”(frontier risk)话语下,可单方面暂停服务、override 模型行为——它事实上掌握了对例外的决断权,而这恰恰是执行力的来源。Niu(2026,arXiv:2602.18474)的”宰相陷阱”进一步指出:名义权威(CEO 的 auctoritas)与实际治理能力(算法系统的 potestas)正在分裂。这解释了①的悖论:它合法性最低(无授权),执行力却高(掌握例外决断)——主权的两个面在 AI 公司身上撕裂了。(边界:Schmitt 1933 年附逆纳粹,引用其框架须切割其威权目的论;且其框架预设统一主权实体,AI 治理主体是分散的。)

秦晖”秦制”框架——解释”⑤多利益相关方为什么仍会俘获”。 秦晖的核心命题是大共同体本位、小共同体缺位:国家(大共同体)直接编户齐民,绕过宗族/行会等中间自治体。映射到 AI:超级平台绕过中间层(行业自律组织、开源社区、本地规范)直接触达每个用户。多利益相关方机制看似引入了”小共同体”,但若这些中间组织已被业界资金渗透(话语俘获),则只是”编户齐民”的现代版——中间层有形无实。这给⑤的俘获四星提供了结构性解释:不是参与方不够多,而是中间层是否真正自主。(边界:秦制是前现代中国的历史特殊物,直接挪用于 AI 治理有”以古喻今”的论证捷径风险,目前无同行评审文献完成这一映射,此处为原创类比,标注为分析框架而非既有共识。)

[!note] 这就是 dim-institutional 的命门一般 AI 治理综述把公司当成”待合规的企业”;本矩阵把它当成准国家行为体——于是”合法性”问的不是”是否守法”,而是”凭什么立法”;“问责”问的不是”客服好不好”,而是”有无横向制衡”。Constitutional AI 字面就是宪法,Model Spec 就是准立法,API policy 就是准监管权力。这个视角切换,是 Safety PM / Policy PM 面试桌上的高区分度资产。

§7 产品 PM 视角补盲:工程合规视角看不见的三个坑

跳出”治理=合规成本”的工程 PM 视角,补三个被结构性忽略的盲点:

南方视角缺失(GTM 盲点):上述矩阵的实证几乎全来自美欧。但 Rick 的 DiDi/99 经验提供了独立样本——发展中国家语境下,平台准主权表现为算法劳动控制 + 数据国家化压力的双重挤压(司机调度、抽成规则即”私法”,同时面临东道国数据本地化要求)。出海 AI 产品的治理选型,不能照搬欧美矩阵权重:在制度能力弱的市场,③(国家监管)的执行力星级要进一步下调,②的事实权力相应放大。
“合规推定”是商业护城河,不只是成本:EU GPAI Code 的合规推定意味着——早签早合规的公司获得事实安全港,后来者要么跟随、要么承担举证负担。治理参与本身是先发者的竞争壁垒(arXiv:2410.17481 所称的”结构性权力”)。PM 若只把治理当成本中心,会错失”用合规节奏卡位竞品”的战略机会。
用户对”治理”的心理模型是错位的:用户体感的”治理”是申诉能不能找到人(②的客服面),而非合法性来源(③的可诉性)。这导致一个产品悖论:合法性最高的国家监管,用户感知不到;问责最弱的平台自治,反而因为有”申诉按钮”让用户感觉被保护。Trust & Safety 产品设计要管理的是这种感知与实质的落差,而非只优化实质。

§8 PM 决策启示:面试 / 选型 / 复现三类落地

面试怎么用:被问”AI 该不该被监管”——别答是非题。掏出 §5 决策表:“取决于风险的时间常数。前沿能力风险快到只有公司技术执行力能即时响应,所以短期靠①+④;权利侵害类慢且需可诉,该靠③。单一形态四维必有短板。” 这是 Safety/Policy PM 的高区分度回答。
选型怎么用:为自家 AI 产品设计治理栈时,按 §5 把治理职能拆解分配——技术拦截放①,申诉放②,权利兜底靠③合规,合法性补丁靠⑤参与。验收标准:四维无全空的形态承担单一职能。
复现怎么用:把任一 AI 公司的治理文件(RSP / Model Spec / Oversight Board 章程)放进 §3 矩阵打分,问四个问题:谁立法?违规真有后果吗?决策错了谁纠?起草被谁主导?——30 秒得出该治理机制的真实质量画像。

§9 与已有节点的关系

对照 Constitutional AI(深化):该节点把 CAI 当作对齐技术机制讲;本矩阵把 CAI 重新定位为①自我监管的旗舰实例,补入它在四维上的结构性短板(合法性一星、俘获满分)——从”它怎么工作”升级到”它作为制度形态值几分”。不复述 RLAIF 机制。
对照 AI 公司政治敏感内容立场对比(对话):该节点比较各公司立场内容;本矩阵提供评估立场的制度坐标——把”某公司说了什么”升级为”某公司用哪种治理形态在说,该形态的问责天花板在哪”。
对照本专题 S01 AI 制度权力分层剖面(同级,03 架构剖面):S01 解剖 AI 公司有哪些准主权能力(工具性/结构性/话语性权力);本 S02 解剖这些能力被装进哪种治理形态、各形态质量如何。S01 是”能力解剖”,S02 是”形态对照”,构成 03 模块的能力—制度两半。
升级方向(M5 风险合规):一旦 AI PM 知识图谱·总索引的 M5 模块建成,本矩阵是 M5 “AI 治理与合规”的核心决策工具,应届时双链。

§10 关联节点

核心(必读)

Constitutional AI —— ①自我监管旗舰实例,本矩阵的主要被评估对象
Anthropic —— RSP / Long-Term Benefit Trust 的发布主体
OpenAI —— Model Spec / “IAEA for AI” 倡议主体
0622 秦晖 —— 秦制框架,解释⑤的话语俘获(§6)
奥唐奈 —— 委任民主,解释②的问责天花板(§6)
0116政治哲学 —— 合法性/问责/主权概念的理论入口
AI PM 知识图谱·总索引 —— 升级对照与 M5 挂钩

延伸(可选)

福柯 —— 治理术,可延伸分析算法治理如何”引导品行”
葛兰西 / 霸权 —— 话语俘获作为文化领导权的当代变体
生命政治 —— 平台对行为流的预测性治理
0117社会学 —— 制度形态作为社会事实
0133新制度经济学 —— 俘获理论、制度设计的经济学基础

§11 修订日志

R1(2026-06-07):首稿。建立五形态×四维主矩阵 + 决策表;接地 Klonick(HLR 131)、Wachter(YJOLT 26:3)、Birhane 等(arXiv:2605.06806)、Campos(via ailabwatch)、Corporate Europe Observatory 游说数据、Oversight Board 79% 合规率与 2028 资助威胁、Niu 宰相陷阱(arXiv:2602.18474);跨域调度 O’Donnell / Schmitt / 秦晖三框架,各附边界标注;补南方视角 / 合规推定护城河 / 感知-实质落差三盲点。
R2(2026-06-07):grounding 校验。WebSearch 核实并落实两项原〔待核实〕:① OpenAI “IAEA for AI” 倡议 = Altman/Brockman/Sutskever 2023-05-22 博文(TechCrunch 2023-05-22 确证);② 把含糊的”需三倍人力”改为可追溯的真实数字(当前约 125 人;Voss 主张 ≥200;Pour Demain 建议 2030 年 ≥160;关键岗位空缺——来源 Lawfare + Transformer News 2025)。
待核实项:① 秦晖框架映射 AI 治理无同行评审先例,标为原创类比(非编造,而是明示其为作者原创框架移植)。