S02 AI 治理模式对照矩阵
当一家 AI 公司发布一份 model spec、一个国家通过 AI 法案、一个跨国论坛签下自愿承诺时,它们其实都在回答同一个被掩盖的问题——“谁有权为这个新出现的权力空间立法、执法、问责?” 本节点要解决的不是”哪种治理在道德上更好”,而是一个 PM/Policy 在选型会上真正要拍板的工程化问题:给定一类 AI 风险,该把治理职能放到哪个层级、哪种制度形态上,才能让合法性、执行力、问责、俘获风险这四个变量同时不崩。 用的框架是把治理拆成五种理想型制度形态(self-regulation / 平台自治 / 国家监管 / 国际治理 / 多利益相关方)× 四个制度维度的对照矩阵——不是”工具箱清单”,而是一张带权衡代价的决策表。
§0 为什么是”制度形态 × 制度维度”矩阵,而不是”硬法 vs 软法”二分
读者脑中最容易冒出的默认框架,是法学界惯用的 “硬法 vs 软法”(hard law / soft law) 二分:有强制力的算硬法,自愿的算软法。这个框架对 PM 决策是有害的简化,要先挡掉:
- 它把”形态”和”约束力”混为一谈。 国家监管也可以是软的(执法羸弱的法条),平台自治也可以是硬的(Meta 对账号的封禁就是即时生效、不可上诉的”硬”权力)。软硬是结果,不是形态。
- 它遮蔽了”谁来执法”这个最关键的制度变量。 EU AI Act 是硬法,但它的 GPAI 实践守则(Code of Practice)在技术上自愿、却提供”合规推定”(presumption of conformity,来源:Latham & Watkins 对 AI Act 的合规分析)——这是一个披着软法外衣的委托监管,二分法完全无法描述。
- 它没有问责维度。 一条没人能挑战的硬法,和一个有申诉机制的自治体系,在”问责”上的差异,二分法看不见。
所以本节点的框架是两维交叉:行(制度形态)回答”权力坐落在哪个主体”,列(制度维度)回答”这个主体在四个治理质量指标上各值几分”。这一拆法对标的是 §1 政治学的合法性—执行力—问责经典三角,再补上 AI 时代特有的第四维俘获风险(regulatory/discursive capture)——因为 AI 治理最致命的失败不是”管不住”,而是”被管的人写了管自己的规则”。
[!note] 跨域呼应预告 这张矩阵的四个维度,直接对应政治学对”何为正当统治”的经典追问。把 AI 公司当成准国家行为体(quasi-sovereign actor)来评估,而不是当成”需要合规的企业”,是本专题(dim-institutional)与一般 AI 治理综述的根本分野。详见 §6。
§1 五种制度形态的理想型定义
先把五行说清楚——它们是 Max Weber 意义上的理想型(ideal type),现实中总是混合态,但纯化定义能让对照变锋利。
| 形态 | 谁立法 | 谁执法 | 谁问责 | AI 领域的真实实例 |
|---|---|---|---|---|
| ① 自我监管 Self-Regulation | 单个公司 | 同一公司 | 同一公司 | Anthropic RSP / OpenAI Model Spec / Google AI Principles |
| ② 平台自治 Platform Governance | 平台 + 半独立机构 | 平台 | 半独立申诉机构 | Meta Oversight Board;App Store / API policy |
| ③ 国家监管 State Regulation | 立法机关 | 行政监管机构 | 法院 / 议会 | EU AI Act + AI Office;美国 EO 14179 后的去监管 |
| ④ 国际治理 International Governance | 多边条约 / 国际组织 | 成员国 | 无强制问责(声誉) | OpenAI 倡议的”IAEA for AI”;Seoul Frontier Safety 承诺 |
| ⑤ 多利益相关方 Multistakeholder | 公司+政府+学界+公民社会共商 | 混合 | 混合 | EU GPAI Code of Practice 起草过程;白宫自愿承诺谈判 |
关键洞察:这五种不是按”强度”排成一条线(那又掉回软硬二分)。它们是按权力坐落点展开的光谱——从①完全私有,到③完全公共,②④⑤是三种不同的”中间态”。而 AI 公司当下真正在做的,是把治理职能主动锚定在①②④⑤(它们能影响的),系统性绕开③(它们最难控制的)。这本身就是一个准主权策略:不是逃避治理,而是抢占治理形态的定义权。
§2 四个维度的评分逻辑(矩阵怎么读)
| 维度 | 它问什么 | 高分长什么样 | 低分长什么样 |
|---|---|---|---|
| 合法性 Legitimacy | 凭什么这套规则对所有人有效? | 民主授权 / 受影响者参与 / 程序公开 | 公司自封 / 无被治理者同意 |
| 执行力 Enforcement | 违规真的会有后果吗? | 可强制、有罚则、有技术核查能力 | ”承诺备忘录”、无核查手段 |
| 问责 Accountability | 决策错了,谁负责、能否纠正? | 横向制衡 + 独立申诉 + 可诉 | 自评自纠、最终解释权归己 |
| 俘获风险 Capture Risk | 规则制定有多大可能被被管者操纵? | 利益隔离、旋转门受限 | 起草被业界主导、话语俘获 |
[!warning] 评分是序数不是基数 下表的”★“是相对序数比较(谁比谁强),不是”客观打分”。同一形态在不同议题上分值会变(见 §4 决策表)。把 ★ 当成精确测量 = 误用本矩阵。这是本节点最大的 failure scenario,先标在前面。
§3 主矩阵:五形态 × 四维度
| 形态 ╲ 维度 | 合法性 | 执行力 | 问责 | 俘获风险(★越多=俘获越严重,越差) |
|---|---|---|---|---|
| ① 自我监管 | ★☆☆☆☆ | ★★★☆☆ | ★☆☆☆☆ | ★★★★★ |
| ② 平台自治 | ★★☆☆☆ | ★★★★☆ | ★★★☆☆ | ★★★★☆ |
| ③ 国家监管 | ★★★★★ | ★★★☆☆ | ★★★★★ | ★★★☆☆ |
| ④ 国际治理 | ★★★☆☆ | ★☆☆☆☆ | ★★☆☆☆ | ★★★☆☆ |
| ⑤ 多利益相关方 | ★★★★☆ | ★★☆☆☆ | ★★★☆☆ | ★★★★☆ |
逐行的接地说明(这是矩阵的命门,每一格都要有证据,不能臆测):
① 自我监管——执行力意外地不低,合法性与问责双崩。 合法性给一星,因为规则由公司自写、自实施、自评估——Orozco y Villa & Menendez(2025,DigiCon)对 Constitutional AI 的核心批评正是”宪法”类比在规范上过于单薄(normatively too thin):公司既是立法者又是法官。执行力反而给到三星——因为公司对自己的模型有完全的技术控制力,RSP/Model Spec 一旦写进训练流程,执行是即时的(这是它相对国家监管的真实优势:国家没有计算资源和技术专长独立核查专有模型,来源:Chatham House 2026 类分析 + arXiv:2407.01557 对 Claude 治理的核查发现”无外部机构可核实 Claude 行为是否符合宪法目标”)。俘获风险拉满五星——这不是”被俘获”,这是定义上的俘获:被管者就是立法者。
② 平台自治——Meta Oversight Board 是这一格的最佳实证。 合法性两星:Oversight Board 引入了半独立的外部裁决,其决定被收录进 Westlaw / Lexis+ 法律数据库,联合国人权高专办与以色列最高法院曾正面引用(来源:Platformer 五周年回顾)——这比纯自我监管多了一层程序正当性。但执行力其实四星:平台对账号、内容、API 的处置是即时且事实上不可上诉的(Klonick 称之为”私法体系”)。问责三星:有申诉机制,但 Klonick 本人给 Oversight Board 综合评分仅 “勉强及格(C)“(来源:Platformer),且 Meta 保留政策最终解释权——2021 年 Trump 停权案中,Board 提的 19 条建议 Meta 仅承诺完全执行 15 条(约 79%),明确拒绝 1 条(来源:Oversight Board 决定原文 FB-691QAMHJ + TechCrunch 2022)。俘获四星:机构由 Meta 出资,Meta 已通知可能在 2028 年后停止资助(来源:TechBrew 2026)——金主即被监管者,结构性俘获。
③ 国家监管——唯一在合法性与问责上双满分的形态,但执行力被高估。 合法性五星、问责五星:有民主授权、有法院可诉、有议会问责,这是国家形态不可替代的优势。但执行力只给三星——这是反共识判断:EU AI Act 的执行力比想象中弱。 Sandra Wachter(Yale Journal of Law & Technology 26:3)指出 AI Act 三大结构性漏洞:过度依赖自我认证、执法机制软弱、对公私部门均设宽泛豁免(来源:yjolt.org)。EU AI Office 人手严重不足:当前约 125 人,MEP Axel Voss(2025 年 12 月)主张仅合规与安全单元就该有 ≥200 人,智库 Pour Demain 建议 GPAI 监管能力到 2030 年至少 160 人;且安全单元负责人、首席科学顾问等关键岗位至今空缺(来源:Lawfare “How Much Power Does the EU AI Office Actually Have”+Transformer News 2025)。俘获三星:不是最低,因为国家至少有利益隔离的形式;但科技业在布鲁塞尔年游说 €1.51 亿(较 2021 增 55%),Meta 单家年投 €1000 万为欧盟最大单一游说者,委员会高层 AI 议题 86% 会面对象是业界(来源:Corporate Europe Observatory),导致 GPAI 最初获豁免、基本权利审查条款被删——俘获真实发生。
④ 国际治理——合法性中等,但执行力是五形态最低。 合法性三星:多边性赋予一定正当性。但执行力一星——这是它的死穴。Seoul Frontier Safety Commitments(2024)、白宫自愿承诺都是无法律强制力的自愿协议;OpenAI 三位创始人(Altman / Brockman / Sutskever)2023 年 5 月 22 日博文倡议的”IAEA for AI”(对超过算力/能力阈值的项目设国际稽查机构,来源:TechCrunch 2023-05-22 + OpenAI “Governance of superintelligence”)至今仍是倡议而非机构。问责两星:只有声誉机制。这一行是 §4 决策表里”看起来美好、实则最不可依赖”的陷阱选项。
⑤ 多利益相关方——合法性高、执行力低,且俘获以”话语俘获”形态隐蔽发生。 合法性四星:公司+政府+学界+公民社会共商,程序上最具包容性。执行力两星:共识机制天然慢、易被否决权拖死。俘获四星:这里的俘获最隐蔽——Birhane 等(2026,arXiv:2605.06806,FAccT 2026 录用)在 100 篇报道中识别 249 项俘获实例,最主流叙事是”监管扼杀创新”(占 16%),“旋转门”出现在 24% 的高知名度案例;他们的核心发现是话语俘获先于制度俘获——业界通过资助研究、定义术语、主导专家咨询,在正式规则出台前已塑造了”可能性空间”。EU GPAI Code of Practice 起草中企业主导,正是这一格的实证。
§4 判断主轴:90% 的人在这张矩阵上会犯的 4 个错
这一节是本节点与”治理模式综述”的分水岭。每个错给出症状 → 为什么会错 → 正确做法 → 真实反例。
错误一:把”合法性高”当成”该选它”。
- 症状:看到国家监管合法性五星,就主张”AI 该交给政府管”。
- 为什么会错:合法性是正当性,不是有效性。AI Act 合法性满分,但执行力被自我认证漏洞掏空(Wachter)。一个合法但执行不了的规则,在前沿模型 6 个月迭代一次的速度下,等于没有规则。
- 正确做法:先看议题的时间常数。能力突现类风险(frontier risk)迭代快,只有①②(公司/平台,技术控制力强)能即时响应;权利侵害类风险(歧视、隐私)迭代慢、需可诉性,才适合③。
- 真实反例:GDPR 是合法性满分的国家监管,但对算法歧视的实际执法案例寥寥;反观 Anthropic RSP 虽合法性一星,却真的卡住了 ASL 阈值的模型发布(来源:RSP v2.0 PDF,assets.anthropic.com)。
错误二:把自愿承诺(①④)的”执行力”等同于”承诺的诚意”。
- 症状:OpenAI 签了 Seoul 承诺、Anthropic 发了 RSP,就认为”行业在自律,可以放心”。
- 为什么会错:Campos(2023,via ailabwatch)指出 RSP 是”风险管理做错了方向”——把举证责任从能力研发者转移到安全关切者:高危行业惯例是”不证明安全不得上市”,RSP 却默认放行直到触发阈值。竞争压力下,实验室有激励重新解释阈值定义。
- 正确做法:对自愿承诺,只信绑定了外部核查的部分。RSP v3.0 引入”潜在外部审查”是进步,但目前仍无实质独立审计机制(arXiv:2407.01557)。
- 真实反例:Facebook 广告透明承诺、烟草业自我监管的历史都显示,无约束力的自愿标准在竞争强化期系统性退化。
错误三:以为”多利益相关方=没有俘获”。
- 症状:看到 GPAI Code of Practice 由”独立专家组”起草,就认为程序中立。
- 为什么会错:多利益相关方恰恰是话语俘获的温床(Birhane 等 2026)。“独立”不等于”利益隔离”——起草者可能来自业界资助的机构,或已内化了业界框架。俘获不需要贿赂,只需要让”监管扼杀创新”成为房间里的默认共识。
- 正确做法:评估多方机制时,查起草者的资金来源和否决权分布,而非看”参与方数量”。
- 真实反例:EU GPAI Code 起草过程被指企业主导(来源:Birhane 等对俘获机制的分类)。
错误四:把五种形态当成”四选一”,而不是”分层组合”。
- 症状:在选型会上问”我们该走自律还是该等监管?”——这是个伪二选一。
- 为什么会错:成熟的治理是栈式组合:用①的技术执行力做即时拦截,用②的申诉机制补问责,用③的可诉性兜底权利,用⑤的协商补合法性。单一形态在四维上必有短板(见主矩阵,没有一行四维全满)。
- 正确做法:按议题把治理职能拆解后分配到不同形态——这正是 §5 决策表要给的东西。
- 真实反例:AI Act 自己就是组合体——硬法骨架(③)+ 自愿 Code of Practice 提供合规推定(⑤的执行外包)。问题不在组合,在于组合时把执行外包给了被监管者。
§5 决策表:给”该用哪种治理模式”拍板
这是本节点的最终交付——按风险类型而非按”形态偏好”来选。
| 风险类型 | 时间常数 | 首选主形态 | 必须叠加 | 致命陷阱 |
|---|---|---|---|---|
| 前沿能力突现(CBRN、自主复制) | 极快(月) | ① 自我监管(技术执行力) | ④ 国际协调避免逐底竞争 | 只靠④:执行力一星,等不及 |
| 内容与言论治理 | 中(周-月) | ② 平台自治(申诉机制) | ③ 国家透明度要求(如 DSA) | 只靠②:金主即被管者,问责打折 |
| 算法歧视 / 权利侵害 | 慢(年) | ③ 国家监管(可诉性) | ⑤ 受影响群体参与立法 | 只靠①:无受害者救济渠道 |
| 市场支配 / 准主权扩张 | 慢 | ③ 反垄断 + 国家监管 | ④ 跨境协调防”AI 孤岛” | 只靠⑤:话语俘获使共识偏向业界 |
| 数据与基础设施依附 | 慢 | ③ + ⑤ | ② 平台级数据可携 | 纯市场自律:云租金锁定 |
读法:横轴的”时间常数”是隐藏的决策变量——风险迭代越快,越要靠技术控制力强(①②)的形态打头阵,因为公共形态(③④)的程序速度跟不上;风险越慢且涉及权利,越要靠可诉的公共形态(③)兜底。 这条规则把”该用哪种治理”从价值争论变成了可操作的工程判断。
§6 跨域呼应:把 AI 公司当准国家行为体,矩阵的四维才有理论根
这张矩阵的四个维度不是 PM 拍脑袋选的,而是政治学对”何为正当统治”的经典追问在 AI 场景的投影。本专题(dim-institutional)的独特资产,是把 AI 制度现象接到 Rick 的政治理论底子上——这里调度三个框架,每个都改变一格的判断,不是装饰。
O’Donnell 委任民主(Delegative Democracy,1994,Journal of Democracy 5:1)——解释”②平台自治的问责为什么注定打折”。 O’Donnell 区分纵向问责(选举式)与横向问责(制度间制衡)。委任民主的病理是:选民把全权委任出去后,横向问责实质缺位。把这套搬到 AI:用户用”安装/卸载”行使纵向问责(类比选举),但 Oversight Board 这类横向问责机构由被监管者出资、其建议可被拒——这正是 O’Donnell 笔下”纵向在、横向缺”的结构。所以②的问责三星不是机构设计不够努力,而是委任结构本身的天花板。(注:此为分析类比,O’Donnell 原框架针对拉美后威权国家,移植到非选举性的私营平台存在”分析单元错配”,见边界。)
Carl Schmitt 例外状态——解释”①自我监管执行力为什么反而高”。 “主权者是决定例外状态的人”(《政治神学》,1922)。AI 公司在”安全紧急状态”(frontier risk)话语下,可单方面暂停服务、override 模型行为——它事实上掌握了对例外的决断权,而这恰恰是执行力的来源。Niu(2026,arXiv:2602.18474)的”宰相陷阱”进一步指出:名义权威(CEO 的 auctoritas)与实际治理能力(算法系统的 potestas)正在分裂。这解释了①的悖论:它合法性最低(无授权),执行力却高(掌握例外决断)——主权的两个面在 AI 公司身上撕裂了。(边界:Schmitt 1933 年附逆纳粹,引用其框架须切割其威权目的论;且其框架预设统一主权实体,AI 治理主体是分散的。)
秦晖”秦制”框架——解释”⑤多利益相关方为什么仍会俘获”。 秦晖的核心命题是大共同体本位、小共同体缺位:国家(大共同体)直接编户齐民,绕过宗族/行会等中间自治体。映射到 AI:超级平台绕过中间层(行业自律组织、开源社区、本地规范)直接触达每个用户。多利益相关方机制看似引入了”小共同体”,但若这些中间组织已被业界资金渗透(话语俘获),则只是”编户齐民”的现代版——中间层有形无实。这给⑤的俘获四星提供了结构性解释:不是参与方不够多,而是中间层是否真正自主。(边界:秦制是前现代中国的历史特殊物,直接挪用于 AI 治理有”以古喻今”的论证捷径风险,目前无同行评审文献完成这一映射,此处为原创类比,标注为分析框架而非既有共识。)
[!note] 这就是 dim-institutional 的命门 一般 AI 治理综述把公司当成”待合规的企业”;本矩阵把它当成准国家行为体——于是”合法性”问的不是”是否守法”,而是”凭什么立法”;“问责”问的不是”客服好不好”,而是”有无横向制衡”。Constitutional AI 字面就是宪法,Model Spec 就是准立法,API policy 就是准监管权力。这个视角切换,是 Safety PM / Policy PM 面试桌上的高区分度资产。
§7 产品 PM 视角补盲:工程合规视角看不见的三个坑
跳出”治理=合规成本”的工程 PM 视角,补三个被结构性忽略的盲点:
-
南方视角缺失(GTM 盲点):上述矩阵的实证几乎全来自美欧。但 Rick 的 DiDi/99 经验提供了独立样本——发展中国家语境下,平台准主权表现为算法劳动控制 + 数据国家化压力的双重挤压(司机调度、抽成规则即”私法”,同时面临东道国数据本地化要求)。出海 AI 产品的治理选型,不能照搬欧美矩阵权重:在制度能力弱的市场,③(国家监管)的执行力星级要进一步下调,②的事实权力相应放大。
-
“合规推定”是商业护城河,不只是成本:EU GPAI Code 的合规推定意味着——早签早合规的公司获得事实安全港,后来者要么跟随、要么承担举证负担。治理参与本身是先发者的竞争壁垒(arXiv:2410.17481 所称的”结构性权力”)。PM 若只把治理当成本中心,会错失”用合规节奏卡位竞品”的战略机会。
-
用户对”治理”的心理模型是错位的:用户体感的”治理”是申诉能不能找到人(②的客服面),而非合法性来源(③的可诉性)。这导致一个产品悖论:合法性最高的国家监管,用户感知不到;问责最弱的平台自治,反而因为有”申诉按钮”让用户感觉被保护。Trust & Safety 产品设计要管理的是这种感知与实质的落差,而非只优化实质。
§8 PM 决策启示:面试 / 选型 / 复现三类落地
- 面试怎么用:被问”AI 该不该被监管”——别答是非题。掏出 §5 决策表:“取决于风险的时间常数。前沿能力风险快到只有公司技术执行力能即时响应,所以短期靠①+④;权利侵害类慢且需可诉,该靠③。单一形态四维必有短板。” 这是 Safety/Policy PM 的高区分度回答。
- 选型怎么用:为自家 AI 产品设计治理栈时,按 §5 把治理职能拆解分配——技术拦截放①,申诉放②,权利兜底靠③合规,合法性补丁靠⑤参与。验收标准:四维无全空的形态承担单一职能。
- 复现怎么用:把任一 AI 公司的治理文件(RSP / Model Spec / Oversight Board 章程)放进 §3 矩阵打分,问四个问题:谁立法?违规真有后果吗?决策错了谁纠?起草被谁主导?——30 秒得出该治理机制的真实质量画像。
§9 与已有节点的关系
- 对照 Constitutional AI(深化):该节点把 CAI 当作对齐技术机制讲;本矩阵把 CAI 重新定位为①自我监管的旗舰实例,补入它在四维上的结构性短板(合法性一星、俘获满分)——从”它怎么工作”升级到”它作为制度形态值几分”。不复述 RLAIF 机制。
- 对照 AI 公司政治敏感内容立场对比(对话):该节点比较各公司立场内容;本矩阵提供评估立场的制度坐标——把”某公司说了什么”升级为”某公司用哪种治理形态在说,该形态的问责天花板在哪”。
- 对照本专题 S01 AI 制度权力分层剖面(同级,03 架构剖面):S01 解剖 AI 公司有哪些准主权能力(工具性/结构性/话语性权力);本 S02 解剖这些能力被装进哪种治理形态、各形态质量如何。S01 是”能力解剖”,S02 是”形态对照”,构成 03 模块的能力—制度两半。
- 升级方向(M5 风险合规):一旦 AI PM 知识图谱·总索引 的 M5 模块建成,本矩阵是 M5 “AI 治理与合规”的核心决策工具,应届时双链。
§10 关联节点
核心(必读)
- Constitutional AI —— ①自我监管旗舰实例,本矩阵的主要被评估对象
- Anthropic —— RSP / Long-Term Benefit Trust 的发布主体
- OpenAI —— Model Spec / “IAEA for AI” 倡议主体
- 0622 秦晖 —— 秦制框架,解释⑤的话语俘获(§6)
- 奥唐奈 —— 委任民主,解释②的问责天花板(§6)
- 0116政治哲学 —— 合法性/问责/主权概念的理论入口
- AI PM 知识图谱·总索引 —— 升级对照与 M5 挂钩
延伸(可选)
- 福柯 —— 治理术,可延伸分析算法治理如何”引导品行”
- 葛兰西 / 霸权 —— 话语俘获作为文化领导权的当代变体
- 生命政治 —— 平台对行为流的预测性治理
- 0117社会学 —— 制度形态作为社会事实
- 0133新制度经济学 —— 俘获理论、制度设计的经济学基础
§11 修订日志
- R1(2026-06-07):首稿。建立五形态×四维主矩阵 + 决策表;接地 Klonick(HLR 131)、Wachter(YJOLT 26:3)、Birhane 等(arXiv:2605.06806)、Campos(via ailabwatch)、Corporate Europe Observatory 游说数据、Oversight Board 79% 合规率与 2028 资助威胁、Niu 宰相陷阱(arXiv:2602.18474);跨域调度 O’Donnell / Schmitt / 秦晖三框架,各附边界标注;补南方视角 / 合规推定护城河 / 感知-实质落差三盲点。
- R2(2026-06-07):grounding 校验。WebSearch 核实并落实两项原〔待核实〕:① OpenAI “IAEA for AI” 倡议 = Altman/Brockman/Sutskever 2023-05-22 博文(TechCrunch 2023-05-22 确证);② 把含糊的”需三倍人力”改为可追溯的真实数字(当前约 125 人;Voss 主张 ≥200;Pour Demain 建议 2030 年 ≥160;关键岗位空缺——来源 Lawfare + Transformer News 2025)。
- 待核实项:① 秦晖框架映射 AI 治理无同行评审先例,标为原创类比(非编造,而是明示其为作者原创框架移植)。