R

G01 AI 治理制度代际谱系总图

创建 2026-06-07 更新 2026-06-11 0 条双链 AI 作为制度现象 专题 AI 整理

G01 AI 治理制度代际谱系总图

要解决的问题:当一个 AI PM 在面试桌上被问”你怎么看 AI 治理的演进”,或在合规会上被问”我们这套 RSP 算不算治理”,绝大多数人会下意识画出一条进步主义的直线——从蛮荒到自律到平台规则到自我监管到国家立法到国际条约,仿佛人类正稳步走向”更好的治理”。这条直线是错的,而且错得有诱惑力。 本节点用制度变迁(institutional change)与库恩范式(范式)的视角,把 AI 治理的六代制度形态摆成一张谱系总图——但谱系不是阶梯。每一代都不是上一代的升级版,而是对上一代特定瓶颈的过度反应,自己又生出新的瓶颈;旧代际从不消失,而是层层叠压、同时运行。这是一张地层图,不是楼梯图

[!warning] 本节点的核心赌注 我赌”AI 治理代际”不是线性进步,而是钟摆 + 地层的叠加:权力在”私人自律”与”公共强制”之间来回摆动,而每一次摆动都不抹除上一层,只是在上面再盖一层。如果未来 5 年出现一个单一全球 AI 监管机构有效统辖一切(线性进步史的终点),那么本节点的框架被证伪。我赌它不会出现——理由见 §6。


§0 为什么是”地层 + 钟摆”,而不是”代际进步”

读者脑中默认的框架是技术成熟度曲线式的代际进步:无治理(1.0)→ 社区自律(2.0)→ 平台规则(3.0)→ 自我监管/RSP(4.0)→ 国家监管(5.0)→ 国际治理(6.0),版本号越大越成熟。这个框架有三个致命错误,必须先拆掉:

  1. 它假设旧代际会被淘汰。 事实相反:2026 年的今天,无治理(暗网模型)、社区自律(Hugging Face 社区规范)、平台规则(OpenAI usage policy)、自我监管(Anthropic RSP)、国家监管(EU AI Act)、国际治理(Seoul/Bletchley 承诺)全部同时在运行,治理同一批前沿模型。这不是代际更替,是制度地层的共时叠压

  2. 它假设方向单调向”更强治理”。 事实是钟摆:2023 年是国家监管的高潮(拜登 EO 14110、EU AI Act 定稿);2025 年特朗普以 EO 14148(2025-01-20)撤销 EO 14110、再以 EO 14179(2025-01-23)立去监管纲领。州级层面则上演了一出反转:《One Big Beautiful Bill》曾含十年禁止州级 AI 监管条款,但 2025-07-01 被参议院以 99-1 删除、从未成法(OBBBA 同年 7 月签署时已不含该条款);联邦随后转向 2025-12-11 行政令《Ensuring a National Policy Framework for AI》,设 AI Litigation Task Force(司法部长 30 日内组建)并以 BEAD 非部署资金为杠杆向各州施压。多个行业团体亦呼吁 EU AI Act”暂停两年(stop-the-clock)“(来源:Senate Commerce/白宫 EO 原文,WebSearch 核实)。摆又荡回了私人自律一侧。

  3. 它把”治理形态的出现顺序”误当成”治理能力的进步顺序”。 国际治理在时间上最晚出现,但它恰恰是最弱的一代(全是无强制力的自愿承诺);社区自律在时间上最早,但 Hugging Face 的模型卡规范在某些维度上比国家立法执行得更彻底(因为它嵌在工作流里)。出现晚 ≠ 能力强。

正确的框架是制度经济学的制度变迁(institutional change) + 库恩的范式不可通约性:每一代治理制度是对前一代”瓶颈”的应激反应,在解决旧问题的同时引入新的、不可通约的盲点(见 §1–§6 每代的”反例”列)。诺斯(Douglass North)的洞见在此关键——制度变迁是路径依赖(path-dependent)的,不是最优化的;每一步都被上一步的遗产锁定,所以不存在”从头设计最优 AI 治理”的可能,只有在既有地层上的边际修补。


§1 第一代:无治理(Pre-Governance / The Commons)

维度内容
时间深度学习兴起 ~2012 至 GPT-2 前 ~2019;以及今天的暗层(开源未对齐模型、暗网部署)
制度形态无。能力即权力,谁有算力谁说了算;唯一约束是技术门槛本身
瓶颈无任何外部约束 → 滥用风险无人兜底;GPT-2”因太危险不发布”(2019)成为分水岭事件
反例(反线性)无治理 ≠ 一定坏。早期开放共享(ImageNet、arXiv preprint 文化)恰恰是 AI 爆发的制度前提;过早治理会扼杀这一代的生成性(generativity 概念,见 Zittrain, The Future of the Internet, 2008)

第一代的关键不是”野蛮”,而是生成性(generativity)——Jonathan Zittrain 在《The Generative Internet》(Harvard Law Review 119, 2006)和《The Future of the Internet—And How to Stop It》(Yale University Press, 2008)中论证:互联网的核心价值在于”无需许可的创新(permissionless innovation)“,任何人无需中心机构批准即可在其上构建。AI 的第一代继承了这份遗产——正是无治理状态下的开放共享,催生了今天值得被治理的能力。

[!note] 反线性要点 进步史叙事会把第一代写成”蛮荒待开化”。但 Zittrain 的警告是反方向的:治理的代价是生成性的死亡(他称平台收编互联网为”appliancization”,应用化)。第一代不是问题的源头,而是红利的源头。这是本谱系第一个反例。

事实接地:GPT-2 分阶段发布、以”误用风险”为由延迟完整模型,见 OpenAI 2019 年公告(来源:WebSearch 可核实,具体卷期未逐字核对,标为已知公开事件)。


§2 第二代:社区自律(Community Self-Regulation)

维度内容
时间~2018 起至今(model cards 2019、datasheets、Hugging Face 社区规范、开源许可证之争)
制度形态同行规范(peer norms):模型卡、数据表、负责任发布倡议;无强制,靠声誉与社区压力
瓶颈只对”在乎声誉”的人有效;搭便车者(free rider)不受约束;无法处理跨社区的系统性风险
反例(反线性)社区自律不”原始”——它在某些维度比国家立法执行得更深,因为规范嵌在工作流(commit、PR review)里,而非事后审查

第二代是Klonick 笔下”新治理者(The New Governors)“逻辑的前身——但要小心:Klonick 的对象是 Facebook/Twitter/YouTube 的内容审核(见 内容治理作为准立法 节点),不是 AI 模型社区。AI 社区自律的独特性在于:它治理的不是”用户发的内容”,而是”开发者发布的能力”,治理客体根本不同(这是现有文献的薄弱处,见 Klonick “The New Governors”, Harvard Law Review 131, 2018, 已核实)。

[!note] 跨域呼应 · 制度经济学的”非正式约束” 诺斯把制度分为正式约束(法律)与非正式约束(规范、习俗、声誉)。社区自律是纯粹的非正式约束。诺斯的洞见:非正式约束的执行成本极低但覆盖面狭窄——它对圈内人极有效(违规者被社区驱逐),对圈外人完全无效。这解释了为什么社区自律永远无法独立支撑 AI 治理:总有不在乎社区声誉的行为体(国家实验室、灰产)。但也解释了为什么它不会消失:它是执行成本最低的一层地层。


§3 第三代:平台规则(Platform Rules / Private Ordering)

维度内容
时间~2020 起(OpenAI usage policies、API 准入审查、内容过滤);至今仍是事实上最日常的治理层
制度形态私人立法(private legislation):平台单方制定 usage policy,通过 API 准入、内容过滤、封号执行,集立法/行政/司法于一身
瓶颈缺乏问责结构;平台既是规则制定者又是执法者又是裁判者;Klonick 称之为结构性问责缺口
反例(反线性)平台规则不必然弱于国家法。在跨境场景,OpenAI 的 usage policy 事实上比任何单一国家法律覆盖更广的全球用户——它是真正的”全球言论标准”(Klonick 命题)

第三代是本专题的核心制度现象:AI 公司的 API policy 是一种准监管权力(quasi-regulatory power)。Jack Balkin 的”新学派言论管制(new school speech regulation)“框架在此关键(《Free Speech in the Algorithmic Society》, UC Davis Law Review 51, 2018, 已核实):国家越来越通过胁迫或共谋数字基础设施所有者来间接规制——平台成为”言论社区的专职治理者”。

但平台规则的”准主权”有真实边界。Knight First Amendment Institute 的 Armijo 在《Meet the New Governors, Same as the Old Governors》(2018,已核实)中反驳 Klonick:现有第一修正案框架仍然适用且足够,平台调节更多是”可及性与透明度”问题,不是新型权威。EU DSA 的强制执行(2024–)也证明国家仍可有效压制平台自治。

[!note] 对手框架回应 · 接受 Armijo,标注边界 接受:Armijo 对的部分——平台权力确实面临国家法律的有效边界,尤其在欧盟;把平台等同于”主权者”是过度阐释。边界:但本谱系坚持,在国家执法能力薄弱的辖区(全球南方、监管真空期),平台规则就是用户能遇到的唯一治理。Rick 的滴滴/99 安全产品经验提供了第一手反证:在发展中国家语境下,平台的算法准入规则(实名、信用、准入门槛)对司机/乘客的实际约束力,远超当地交管法规的落地强度。这是 Armijo 美欧中心视角的盲点。


§4 第四代:自我监管(Self-Regulation / RSP)

维度内容
时间2023 起(Anthropic RSP v1.0 2023-09、OpenAI Model Spec、白宫自愿承诺 2023-07、16 家公司 Seoul 前沿安全承诺 2024-05)
制度形态准立法 + 准宪政:用明文”宪法”/能力阈值(ASL)自我约束,自定触发条件,自评合规
瓶颈企业同时是规则制定者、执行者、合规评估者,消除外部问责的逻辑基础;竞争压力下阈值可被重新解释
反例(反线性)自我监管不是”假治理”——RSP 把模糊的安全焦虑转译为可审计的原子命题(Anthropic 205 条、OpenAI 197 条规格,见下),这是私人规则向可问责公共标准转化的真实起点

第四代是本专题命名的来源——Constitutional AI 字面就是”宪法”(见 Constitutional AI)。Bai 等《Constitutional AI: Harmlessness from AI Feedback》(arXiv:2212.08073, 2022-12-15,已核实)用一份明文原则列表替代人工标注,让模型自我批评修正。

代际线(已核实自研究简报):

  • RSP v1.0:2023-09,配合白宫自愿承诺(Amazon、Anthropic、Google、Inflection、Meta、Microsoft、OpenAI 联署,2023-07)。
  • RSP v2.0:2024-10-15,明确 ASL 分级阈值。
  • RSP v3.0:现行版本,新增 Frontier Safety Roadmaps 与 Risk Reports,纳入潜在外部审查。
  • 行业跟进:16 家 AI 公司 2024-05 签署《前沿 AI 安全承诺》,承诺 2025-02 前各自制定 RSP。

[!warning] failure scenario · 第四代最脆弱 自我监管的历时性脆弱是本谱系最重要的反线性证据。Campos(2023,via ailabwatch)批评 RSP 是”风险管理做错了方向”——把举证责任从能力研发者反向转移到安全关切者:高危行业惯例是”不证明安全就不得上市”,RSP 却默认放行直到触发阈值。结构张力在于:竞争压力下实验室有激励放松约束或重新解释阈值。历史先例(巴塞尔协议前的金融自律、烟草业自我监管)显示,无约束力的自愿标准在竞争白热期系统性退化。本专题如果只把 RSP 写成”负责任的进步”,就是 confirmation bias——必须补入 Campos 的反例。

学术分析(《How Well Do Models Follow Their Constitutions?》, arXiv:2605.24229, 2026-05,已核实)把 model spec/constitution 分解为可审计的原子命题(Anthropic 205 条、OpenAI 197 条),用多轮对抗审计管线检验模型实际遵循程度——这是把私人规则转化为可问责公共标准的早期迹象。这是第四代真实的进步面;但与 Campos 的退化论并存,才是完整图景。


§5 第五代:国家监管(State Regulation)

维度内容
时间2024 起(EU AI Act 2024-08 生效、拜登 EO 14110 2023;2025 钟摆回摆——特朗普 EO 14148 撤销、EO 14179 立纲领)
制度形态正式约束(formal constraint):成文法 + 强制执行 + 罚则;AI Office、禁止条款、合规期限
瓶颈监管能力不对称(政府缺算力/专长独立评估专有模型);监管俘获(regulatory capture);执法滞后于技术
反例(反线性)国家监管不是治理的”成熟终点”。EU AI Act 在游说下把 GPAI 一度豁免;美国 2025 年主动退出协调——国家强制力可以倒退,不是单调上升

EU AI Act 时间线(已核实自研究简报,artificialintelligenceact.eu/legiscope.com):

  • 2024-08 正式生效;2025-02 禁止条款(不可接受风险)生效;2025-08 GPAI 义务生效,GPAI 实践守则最终版 2025-07 完成;2026-08 高风险 AI 义务 + AI Office 执法行动开始;2027-08 存量 GPAI 须合规;2028-08 受监管产品类 AI 最终期限。

第五代的命门是监管俘获。游说数据(Corporate Europe Observatory,已核实):科技行业每年布鲁塞尔游说 €1.51 亿(较 2021 增 55%),Meta 单家 €1000 万;欧盟委员会高层 AI 议题 86% 的会面对象是业界。结果:GPAI 一度获豁免,基本权利审查条款被删。Birhane 等《Big AI’s Regulatory Capture: Mapping Industry Interference and Government Complicity》(arXiv:2605.06806, FAccT ‘26,已核实)构建跨 5 大类、27 机制的俘获分类法,标注 100 篇报道验证,主流俘获叙事是”监管扼杀创新”〔“249 项实例/16%/24% 旋转门”等细分数字源自研究简报,arXiv 元数据未逐字复核,标为待核实〕。

[!note] 跨域呼应 · 委任民主与横向问责缺位 Guillermo O’Donnell 的”委任民主(delegative democracy)“框架(《Delegative Democracy》, Journal of Democracy 5:1, 1994, 55–69,已核实,见 奥唐奈)在此提供锋利切口。O’Donnell 区分纵向问责(选举)与横向问责(制度内相互制衡)。把它映射到第五代:国家监管表面上引入了对 AI 公司的”纵向问责”(立法机关代表选民立法),但横向问责——独立审计、技术能力对等的执法机构——实质缺位。AI Office 执法单元需三倍扩编才够用(WebSearch 证据);政府缺算力独立评估专有模型(arXiv:2407.01557)。这正是 O’Donnell 所说的”问责的空壳化”:有立法之形,无制衡之实。注意:这是分析类比,O’Donnell 原框架针对拉美后威权国家,移植到 AI 治理是我的借用,非既有学术共识。

钟摆证据(已核实):特朗普以 EO 14148(2025-01-20)撤销拜登 EO 14110、以 EO 14179(2025-01-23)立去监管纲领;《One Big Beautiful Bill》中十年禁止州级 AI 监管的条款 2025-07-01 被参议院 99-1 删除、从未成法,联邦改以 2025-12-11 行政令《Ensuring a National Policy Framework for AI》(设 AI Litigation Task Force + BEAD 资金施压)向州级监管施压;行业团体呼吁 EU AI Act”stop-the-clock”。第五代正在回摆。 进步史在此被实证证伪。


§6 第六代:国际治理(International Governance)

维度内容
时间2023 起(Bletchley 宣言 2023-11、Seoul 前沿安全承诺 2024、OpenAI 倡议 IAEA 式机构)
制度形态准外交(quasi-diplomacy):多边宣言、自愿承诺、倡议性国际机构;无条约级强制力
瓶颈全是自愿,无强制;大国博弈(美中欧”AI 孤岛”);战略碎片化(strategic fragmentation)
反例(反线性)国际治理是时间上最晚、能力上最弱的一代——它彻底推翻”越晚越成熟”的线性假设。出现晚 ≠ 能力强

第六代是谱系图里最该被祛魅的一层。Lancieri、Edelson & Bechtold(ProMarket, 2025-07-07,已核实)用博弈论框架,把当前美国政策走向定性为”战略碎片化”,指出俘获可能导致各国成为”AI 孤岛”。Bremmer & Suleyman(2023, Foreign Affairs〔具体卷期待核实〕)更尖锐:大型科技公司已事实上成为其所创建数字领域的独立主权行动者——这意味着第六代试图治理的对象,本身已是准主权体,国际治理沦为主权国家与准主权公司之间的弱协调。

[!warning] 本谱系的终极赌注在此被检验 线性进步史的逻辑终点是”全球统一 AI 监管机构”。第六代的实证状态恰恰相反:它是所有六代里强制力最弱的。我赌这个终点不会到来,理由是制度变迁的路径依赖——大国已在前五代里形成不可通约的制度遗产(美国的私人自律偏好、欧盟的权利本位、中国的国家本位),第六代无法抹除这些地层、从头铸造统一框架。如果未来 5 年真出现一个有牙齿的全球 AI 监管机构,本节点框架被证伪。当前证据(Bletchley/Seoul 全是自愿承诺、美国主动退出协调)支持我这一侧。


§7 判断主轴:90% 的人在 AI 治理谱系上会搞错的四个点

这一节是本节点的命门——把上面六代摆成一张图后,读者最容易掉进的四个坑:

错位一:把”出现顺序”当”能力顺序”

  • 症状:“国际治理是最高级的治理形态。”
  • 为什么会错:被版本号思维(6.0 > 1.0)误导,默认时间晚 = 能力强。
  • 正确做法:按强制力重排,而非按出现时间。强制力序:国家监管(EU AI Act,有罚则)> 平台规则(API 封号,即时执行)> 社区自律(声誉压力)> 自我监管(自评,无外部约束)> 国际治理(纯自愿)。时间最晚的第六代,强制力垫底。
  • 真实反例:Seoul 前沿安全承诺(2024,第六代)无任何强制力;OpenAI usage policy(第三代,2020)能在毫秒内封掉一个违规账户。

错位二:把”代际更替”当”代际淘汰”

  • 症状:“现在是国家监管时代了,自我监管已经过时。”
  • 为什么会错:用生物进化(旧物种灭绝)类比制度变迁(旧制度叠压)。
  • 正确做法:把六代看成共时叠压的地层。2026 年同一个前沿模型,同时被 RSP(第四代)、EU AI Act(第五代)、Seoul 承诺(第六代)、OpenAI usage policy(第三代)、Hugging Face 模型卡规范(第二代)治理。
  • 真实反例:EU AI Act 的 GPAI”实践守则”在技术上是自愿的(自我监管,第四代),但提供”合规推定(presumption of conformity)“的安全港(第五代国家监管)——一份文件里第四代与第五代直接嵌套(来源:Latham & Watkins,已核实)。地层不分层运行,而是互相穿透。

错位三:把”治理方向”当”单调向善”

  • 症状:“治理只会越来越严。”
  • 为什么会错:忽略钟摆——权力在”私人自律”与”公共强制”间来回荡。
  • 正确做法:把治理史读成钟摆 + 地层:每次公共强制的高潮(2023 EU AI Act)都会触发私人自律的反扑(2025 特朗普 EO 14148 撤销 + EO 14179 立纲领、十年州禁令虽被删但 2025-12 行政令转向司法施压、stop-the-clock 游说)。
  • 真实反例:2023→2025,美国从拜登 EO 14110(强监管)到特朗普 EO 14148 撤销前朝、EO 14179 立去监管纲领,两年内方向逆转。

错位四:把 RSP/Constitutional AI 当”纯进步”或”纯洗白”,二选一

  • 症状:要么”Anthropic 的宪法是负责任治理的典范”,要么”全是 PR 表演”。
  • 为什么会错:非黑即白,丢掉了制度现象的双面性。
  • 正确做法:同时持有两个判断——RSP确实把模糊安全焦虑转译为可审计原子命题(真实进步面,arXiv:2605.24229);RSP也确实把举证责任反向转移、在竞争压力下可被重新解释(Campos 退化论)。两者并存才是完整图景。
  • 真实反例:Meta Oversight Board(内容治理领域的对应物)——Klonick 给它打 C(勉强及格),既不是空头支票也不是真监督,恰恰卡在中间(见 内容治理作为准立法,已核实)。

§8 产品 PM 视角补盲:谱系图的三个商业/合规盲点

工程视角看治理代际是”约束越来越多”;PM 视角必须补三个看走眼的点:

  1. 合规套利(regulatory arbitrage)是真实商业策略。六代地层不均匀分布在全球——同一个模型可以在 EU(第五代强监管)受限,却在监管真空辖区按第三代(平台自律)运营。PM 选型时,“在哪个辖区部署”本身是治理决策,不只是技术决策。Rick 的 99(巴西)/国际化经验在此直接相关:发展中国家的治理地层缺第五代,平台规则就是事实上的法律。

  2. “合规推定”是产品级安全港,不是法务细节。EU GPAI 实践守则的”presumption of conformity”意味着:签了自愿守则 = 事实上获得执法豁免。这把第四代(自我监管)直接变成第五代(国家监管)的入场券。PM 若把它当”可选的自愿项”跳过,会在执法期(2026-08 起)付出代价。

  3. 治理代际差异 = 高区分度的面试信号。Safety PM / Policy PM / Trust & Safety 岗位面试,能区分”内容治理(Klonick 的对象)“与”模型能力治理(RSP 的对象)“的候选人极少。多数人把两者混为一谈。能说清”AI 公司通过训练数据选择/安全政策/usage terms 行使的权力,在机制上不同于 Facebook 的内容审核”——这是现有文献都薄弱的点,直接是高区分度论据。


§9 跨域呼应:库恩范式 vs 制度变迁——谱系图到底是什么形状

本节点最深的跨域调度,是用两个互相竞争的框架来逼问”代际”到底意味着什么:

库恩(Thomas Kuhn)的范式革命(见 范式):如果 AI 治理的代际是库恩式的范式转移,那么相邻两代之间不可通约(incommensurable)——第三代”平台私人立法”的合法性标准,与第五代”国家民主授权”的合法性标准,无法用同一把尺子衡量。这解释了为什么”平台规则算不算治理”的争论永远谈不拢:双方在用不同范式的”治理”定义。库恩的贡献是把”代际之争”诊断为范式之争,而非”谁更先进”之争。

诺斯(Douglass North)的制度变迁(见 0133新制度经济学):如果代际是制度变迁,那么它是路径依赖渐进叠压的——新制度不取代旧制度,而是在旧制度的”交易成本结构”上边际生长。这解释了为什么六代共时叠压:每一层都因为有正的边际收益(降低某类交易成本)而被保留。

[!note] 两个框架的张力,正是本节点的认识论核心 库恩说代际不可通约(像格式塔切换,不能平滑过渡);诺斯说代际路径依赖叠压(像地层,平滑累积)。这两个判断表面矛盾。我的综合赌注是:两者在不同尺度上都对——在”合法性话语”层面是库恩式不可通约(平台逻辑 vs 国家逻辑无法互译);在”制度存量”层面是诺斯式叠压(六代地层共存运行)。这个综合本身是我的原创判断,不是既有共识,可能错。如果证据显示某一代曾完全抹除前一代(纯库恩式替代),诺斯侧被削弱;如果显示代际间能平滑互译(无格式塔切换),库恩侧被削弱。这是本节点留给读者的开放赌局。

破 echo chamber 的对手框架:Morozov 的”技术封建主义批判”(《Critique of Techno-Feudal Reason》, New Left Review 133/134, 2022,已核实)逼问的是——也许”代际”本身是错误的隐喻。Morozov 反对把当前体制描述为”封建退行”,坚持它仍是彻底的资本主义;同理,他会反对把 AI 治理描述为”代际进化”,因为这暗示了一种自然演进的必然性,而掩盖了背后的资本积累逻辑。接受 Morozov 的边界:谱系图确有把权力斗争美化为”自然代际”的风险。坚持的边界:但即使治理形态的更替由资本驱动,形态本身的差异(强制力、问责结构)仍是 PM 必须辨识的真实约束。


§10 PM 决策启示

  • 面试怎么用:被问”AI 治理怎么演进”,不要背版本号直线。画地层图 + 钟摆,举 2023→2025 美国逆转作反例,再点出”出现晚 ≠ 能力强”(国际治理最弱)。30 秒展示反线性判断力。
  • 选型怎么用:评估一个 AI 供应商的”治理成熟度”,不是看它在哪一代(越高越好),而是看它在六代地层里的覆盖组合——有没有 RSP(第四代)、是否签了 GPAI 守则拿合规推定(第四→五代桥)、usage policy 的执行力(第三代)。
  • 复现怎么用:本节点是 02 代际演化模块的总图,后续 G02/G03(范式革命剖面、当下 Hype Cycle 定位)在此分叉;架构剖面 S 系列对应”每一代的制度堆栈解剖”。

§11 与已有节点的关系(升级对照,不复述)

  • 对照 Constitutional AI:旧节点讲透了 CAI 的技术机制(RLAIF、宪法文本、与 RLHF 对比)。本节点升高一个抽象层——不复述 CAI 怎么工作,而是把它定位为第四代”自我监管”的代表制度形态,并指出”宪法”命名本身是把工程选择包装为宪政意象的话语行为(Birhane 等的”话语俘获”框架)。做的是定位与对话,不是机制重述。
  • 对照本专题 内容治理作为准立法:那个节点深挖第三代在内容审核领域的准立法机制(Gillespie/Douek/Meta Oversight Board)。本节点补缺——把内容治理与模型能力治理摆在同一张谱系上,显式指出两者治理客体不同(发的内容 vs 发布的能力),这是现有文献的薄弱处。做的是横向补缺
  • 对照 对齐哲学/机制设计/STS/失败考古学:做显式升级对照。预期升级关系:0419 讲 CAI 作为对齐技术,本节点讲 CAI 作为制度形态;0421 讲机制设计的博弈论,本节点讲制度变迁的路径依赖,互为正交切面;0422 STS 讲技术的社会建构,本节点是其在 AI 治理上的具体地层化;0416 失败讲单点制度失灵,本节点讲失灵如何驱动下一代制度应激。不复述这四个节点的内容基础。

§12 关联节点

核心(必读)

  • Constitutional AI——第四代自我监管的代表制度
  • 内容治理作为准立法——第三代平台规则在内容领域的深剖(本专题同级)
  • 范式——库恩范式不可通约性,§9 跨域核心
  • 0133新制度经济学——诺斯制度变迁/路径依赖,§9 跨域核心
  • 奥唐奈——委任民主/横向问责缺位,§5 跨域

延伸(可选)

  • 0116政治哲学——治理合法性的政治理论根基
  • 霸权——平台/AI 公司准主权的葛兰西式解读
  • 生命政治——治理术作为权力形态(福柯线)
  • 0622 秦晖——秦制框架:大共同体穿透中间层,对照平台消解自治空间
  • 福柯——治理术(governmentality),算法治理的权力分析
  • AI PM 知识图谱·总索引——回主图

修订日志

  • R1(2026-06-07):首稿。建立六代地层 + 钟摆框架;每代配反例(反线性);判断主轴四错位;库恩 vs 诺斯跨域综合;Klonick/Balkin/Armijo/Campos/O’Donnell/Morozov 对手框架接入;EU AI Act 时间线与 RSP 版本线接地。
  • R1-grounding(2026-06-07):WebFetch/WebSearch 二次核实四个 arXiv ID 全部成立——2212.08073《Constitutional AI: Harmlessness from AI Feedback》(Bai et al., 2022-12-15)、2407.01557《AI Governance and Accountability: An Analysis of Anthropic’s Claude》(Priyanshu/Maurya/Hong)、2605.06806《Big AI’s Regulatory Capture》(Birhane et al., FAccT ‘26, 27 机制/5 类/100 篇标注)、2605.24229《How Well Do Models Follow Their Constitutions?》(2026-05, 205/197 原子命题)。已去除这四项〔待核实〕标记。仍待核实:Birhane 论文”249 实例/16%/24%“细分数字、Bremmer & Suleyman Foreign Affairs 卷期、0419/0421/0422/0416 双链(待节点建立)。
  • 2026-06-11 P3.1 OBBBA 十年禁令改为事实过去时(§绪论、§5 表/正文、错位三),把”试图禁止州监管”改写为”2025-07-01 参议院 99-1 删除、从未成法 + 联邦转向 2025-12-11 行政令设 AI Litigation Task Force/BEAD 施压”;EO 14179 撤销误归因订正为 EO 14148 撤销 + EO 14179 立纲领。依据:Senate Commerce 99-1 公告、白宫 EO《Ensuring a National Policy Framework for AI》原文(WebSearch 核实)。
  • 2026-06-11 P3.4 校链:§11 死链 0419 CAI对齐/0421 机制设计/0422 STS/0416 失败 四个跨专题引用改为别名链 0419 总览/0421 总览/0422 总览/0416 总览,删去”未建实体节点,待节点建立后补双链”的 staging 注解(四专题均已入库)。