G02 AI 治理制度代际演化详解 · 知识库

本节点要解决的问题：当我们说”AI 治理在演化”，演化的到底是什么？是技术，是法律，还是制度结构本身？本节用制度代际视角逐代切开——每一代有自己的代表性制度安排、把它推上历史舞台的驱动力、最终把它拖垮的瓶颈、以及被下一代超越的具体方式。判断主轴不是”哪一代更好”，而是：每一代都在解决上一代留下的合法性赤字，又制造出自己的合法性赤字。这是一部”权力从国家手中漏向私人行为体、又被国家试图收回”的拉锯史，不是一部进步史。G01 给出了谱系总图（G01 AI 治理制度代际谱系总图），本节是它的逐代展开与年份接地。

[!warning] 反线性进步史声明本节点严格遵守 SHARED_CONTEXT §7「进步主义叙事修正」：每一代制度安排都同时是进步（解决了前代的某个失败）和退步（牺牲了前代的某个优点）。把它读成”自我监管 → 准立法 → 国家监管”的单调上升，就读反了——下面会看到，2025–2026 年恰恰出现了向自我监管的回潮。

§0 为什么用”制度代际”框架，而不是”技术代际”或”法律时间线”

读者脑中默认有两个错误框架，先挡掉：

错误框架 A：技术代际（GPT-2 → GPT-3 → GPT-4 → o1）。 技术代际讲的是模型能力，治理代际讲的是谁有权制定约束谁的规则。两者节奏不同步：技术每 12–18 个月一代，制度往往滞后 3–5 年才长出对应的治理形态——这个滞后本身就是治理危机的根源（能力跑在合法性前面）。

错误框架 B：法律时间线（GDPR → DSA → EU AI Act）。 法律时间线是国家视角，它会让你误以为治理史就是立法史。但本专题的核心命题（见 A01 AI 作为制度现象概念谱系）是：真正的治理权力大量沉淀在私人行为体手里——平台社区准则、Constitutional AI、Model Spec、Responsible Scaling Policy 都是”准立法”，却不在任何立法时间线上。只看法律时间线，会系统性地漏掉一半的治理史。

所以本节用制度代际：每一代由”主导性制度安排 + 其合法性来源 + 其问责结构”三件套定义。判据是合法性从哪里来、问责向谁负责，而不是技术参数或成文法条数。这个框架升高的抽象层是：把 AI 治理从”合规问题”提升为”政体演化问题”——AI 公司不是在遵守制度，而是在生产制度。

§1 第一代（约 2008–2016）：平台自我排序 —— 私人秩序的黄金时代

代表性制度安排： 平台社区准则（Community Guidelines）+ 服务条款（ToS）+ 内部审核团队。Facebook、YouTube、Twitter 各自演化出”定期修订的规则 + 受训的人工决策者 + 类行政的申诉流程”——Kate Klonick 把这套体系命名为”新治理者”（“The New Governors”, Harvard Law Review 131, 2018, pp. 1598–1670）。

驱动力： 三股力量。其一，Section 230（美国《通信规范法》第 230 条，1996）给平台免责盾牌，使其有空间自行裁量内容；其二，全球化扩张使平台触达的言论量级远超任何单一司法辖区的执法能力——平台被迫成为事实上的全球言论标准制定者；其三，经济动机——Klonick 的关键经验发现是，平台对标第一修正案精神不是出于意识形态，而是为了留住用户。这是一种”私人排序”（private ordering），Jack Balkin 称之为平台作为”言论社区的专职治理者”（special-purpose governors of speech，“Free Speech in the Algorithmic Society”, UC Davis Law Review 51, 2018, pp. 1149–1210）。

瓶颈（被下代超越的原因）： 合法性纯粹来自所有权——“我的服务器我做主”。没有任何外部问责：用户被封号没有说理、没有上诉、没有先例约束。Jonathan Zittrain 在 The Future of the Internet—And How to Stop It（Yale UP, 2008）已预见这种”应用化”（appliancization）会把开放的生成性互联网封闭成专有系统，集中起准国家权力。Hannah Bloch-Wehba 后来系统诊断了这个赤字：平台同时制定规则与裁定争议，而行政法的基本原则——透明度、参与、说理、复审——全部缺失（“Global Platform Governance: Private Power in the Shadow of the State”, SMU Law Review 72, 2019）。

2026 位置： 这一代制度没有消失，而是被叠加。社区准则至今仍是内容治理的底层操作系统；后续每一代都是在它之上增建上层建筑（监督机制、国家监管），而非替换它。

[!note] 反例修正（破线性进步）第一代不是纯粹的”蛮荒时代”。Klonick 的研究显示，纯私人秩序反而催生了相当成熟的”准普通法”——规则随个案积累而演化，比许多国家的成文言论法更细密、响应更快。第二代的”监督”反而引入了官僚迟滞。

§2 第二代（约 2018–2021）：准立法 + 准司法 —— 平台试图给自己造一部宪法

代表性制度安排： 把单一的”私人秩序”分化出准立法（成文化、原则化的政策）与准司法（独立裁决机构）。标志性事件是 Meta Oversight Board 的成立（2020 年 5 月测试版，2021 年 1 月开始正式裁决）——一个可受理 Facebook/Instagram 用户申诉、Meta 承诺执行其个案决定的外部机构。

驱动力： 第一代的合法性赤字在 2016–2018 年集中爆发（剑桥分析、选举操纵、缅甸罗兴亚事件）。平台面临双重压力：国家威胁立法、公众质疑其权力来源。Evelyn Douek 精确地把这一代的制度逻辑命名为**“内容审核即行政”**（“Content Moderation as Administration”, Harvard Law Review 136:2, 2022, pp. 526–607）——关键决策从”逐案司法判决”转向”大规模言论行政”，约束手段是审计、影响评估、透明度报告。平台试图用”造一个法院 + 写一部成文政策”来回应”你凭什么治理”的质问。

瓶颈： 准司法机构的合法性是自授的——Meta 资助它、Meta 设计它的章程、Meta 保留对政策的最终解释权。Klonick 本人给 Oversight Board 的综合评价是”勉强及格（C）”，“并未达到预期”。证据接地：

Trump 停权案（2021）：Board 维持停权，但裁定 Meta 施加了”无限期且无标准的处罚”，要求六个月内重审；Meta 于 2021 年 6 月将”无限期”改为两年停权，Trump 账号于 2023 年 3 月复权。这显示 Board 能约束”程序”，却约束不了”实质”。
政策建议合规率：在某批次 19 条具体建议中，Meta 承诺完全执行 15 条（约 79%），部分执行 1 条，搁置 2 条，明确拒绝 1 条——保留了否决权。

2026 位置： 这一代正在结构性衰退。2025 年 1 月 Meta 废除美国区第三方事实核查、改用 Community Notes 众包模式，Board 批评此举”仓促、偏离常规程序、缺乏人权尽职调查记录”。规模对比触目惊心：Community Notes 上线美国首六个月仅产生约 900 条已发布笔记，同期 EU 专业事实核查员标记约 3500 万条内容。更致命的是 Meta 于 2026 年通知 Board 成员，可能在 2028 年后停止资助并已削减预算（来源：TechBrew, 2026-04-03；Platformer “Meta Oversight Board 五年回顾”）。准司法机构的命门在于：法官的工资由被告发——这是第二代无法自我克服的合法性赤字。

§3 第三代（约 2022–2024）：行为宪法 —— Constitutional AI 把”宪法”字面化

代表性制度安排： 从”治理人的内容”转向”治理 AI 的行为”。代表是 Anthropic 的 Constitutional AI（Bai et al., “Constitutional AI: Harmlessness from AI Feedback”, arXiv:2212.08073, 2022 年 12 月〔arXiv ID 待 WebFetch 验证〕）——用一份明文”宪法”（一组原则列表，部分条款源自《世界人权宣言》、Apple ToS、DeepMind 原则）替代大量人工标注，让模型经 RLAIF 自我批评、自我修正。配套制度还有 OpenAI 的 Model Spec 与 Anthropic 的 Responsible Scaling Policy（RSP v1.0, 2023 年 9 月）。

驱动力： AI 能力跃迁（ChatGPT, 2022 年 11 月）使治理对象从”用户发的内容”变成”模型生成的行为”——这是治理客体的根本转移。同时，2023 年 7 月白宫自愿承诺（Amazon、Anthropic、Google、Meta、Microsoft、OpenAI 等联署）与 2024 年 5 月《前沿 AI 安全承诺》（Seoul，16 家公司）把”行为宪法”推成行业标配。命名本身是制度创新：把工程选择（RLAIF 训练程序）命名为”宪政”，是一次有意识的合法性话语建构。

瓶颈（这一代最锋利的争议）： “宪法”类比规范上”过于单薄”（Orozco y Villa & Menendez, 2025, DigiCon）。三点批评：(1) 高层原则与具体工程实现之间存在不可弥合的翻译鸿沟；(2) 以 AI 自我批评替代人工监督，违背 EU AI Act “human-in-the-loop” 要求；(3) 无任何外部机构可核实模型行为是否符合宪法目标（Priyanshu, Maurya & Hong, 2024, arXiv:2407.01557，已核实（2026-06-12）——无独立审计机制接触训练过程，违规后果完全依赖公司自身判断）。一句话：这是一部自己写、自己执行、自己当法官的宪法。 在政治理论上，这恰恰是 0622 秦晖 “秦制” 框架里”法、术、势三位一体、行政安全至上”的私人版本——规则制定者、执行者、裁决者合一，中间没有任何独立的横向问责。

2026 位置： 仍是主导范式，但已出现”私人规则可问责化”的早期裂缝——有学术工作把 model spec / constitution 分解为可审计的原子命题（Anthropic 约 205 条、OpenAI 约 197 条），作为外部审计的治理目标（arXiv:2605.24229《How Well Do Models Follow Their Constitutions?》，Jakkli/Rajamanoharan/Nanda, 2026-05-22，ID 已核实（2026-06-12）；205/197 具体条数仍待核实）。这是私人行为宪法向可诉公共标准转化的第一道缝。

§4 第四代（约 2023–2026）：国家强制监管 —— 主权试图收回外包出去的权力

代表性制度安排： 具有法律强制力的国家/超国家监管框架。标志是 EU Digital Services Act（DSA） 与 EU AI Act。

DSA：2023 年 4 月 25 日指定首批超大型平台（VLOP）/超大型搜索引擎（VLOSE）；对其义务自 2023 年 8 月 25 日生效；对所有平台全面适用自 2024 年 2 月 17 日。核心机制：强制年度透明度报告、欧盟委员会 DSA 透明度数据库、法外争议解决机制。两年成效：欧盟称 DSA 已使约 5000 万条内容审核决定获得复审机会。
EU AI Act：2024 年 8 月生效；2025 年 2 月禁止条款（不可接受风险）生效；2025 年 8 月 GPAI 义务生效；2026 年 8 月高风险义务 + AI Office 执法启动；后续合规期延至 2027–2028 年〔时间线节点较多，关键里程碑已接地，细节以 artificialintelligenceact.eu 官方为准〕。

驱动力： 前三代的核心赤字——没有民主授权——终于触发主权反弹。欧盟明确把 DSA 定位为”终结科技公司本质上自我监管时代”的工具。Farrell & Newman 的判断是：数据与算力的控制同时强化国家权力与私人权力，并非零和〔具体出处待核实〕——国家发现自己有能力把外包出去的治理权力收回来。

瓶颈（被”下一代/回潮”超越的原因）： 两个结构性问题。

监管能力不对称：政府缺乏算力和技术专长独立评估专有模型；AI Office 执法单元据称需三倍扩编才够用〔来源待核实〕。Sandra Wachter 指出 EU AI Act 三大漏洞：过度依赖自我监管/自我认证、执法机制软弱、对公私部门设有宽泛豁免（Yale Journal of Law & Technology 26:3〔卷期待核实〕）。
监管俘获：科技行业在布鲁塞尔年游说支出约 €1.51 亿（较 2021 年 +55%），Meta 单家约 €1000 万；欧盟委员会高层在 AI 议题上约 86% 的会面对象是业界〔来源：Corporate Europe Observatory，数字待二次核实〕。结果是 GPAI 最初获豁免、基本权利审查条款被削。Birhane et al.（2026, arXiv:2605.06806, FAccT 2026，arXiv ID 已核实（2026-06-12））构建 27 机制俘获分类法，在 100 篇报道中识别 249 项俘获实例，最主流叙事是”监管扼杀创新”（占 16%）〔249/16% 等细分数字仍待二次核实〕。

2026 位置：这一代正遭遇回潮（关键的反进步证据）。 特朗普政府先以 EO 14148（2025-01-20）撤销拜登 EO 14110 多项 AI 安全/透明度要求，再以 EO 14179（2025-01-23）确立去监管纲领；州级层面，《One Big Beautiful Bill》曾含十年禁止州级 AI 监管的条款，但 2025-07-01 被参议院以 99-1 删除、从未成法（OBBBA 同年 7 月签署时已不含该条款），联邦随后转向 2025-12-11 行政令《Ensuring a National Policy Framework for AI》——设 AI Litigation Task Force（司法部长 30 日内组建）并以 BEAD 非部署资金为杠杆向各州施压；2025 年多个行业团体呼吁对 EU AI Act 执行”暂停两年”（stop-the-clock）。Lancieri et al.（ProMarket, 2025-07-07）把美国政策走向定性为”战略碎片化”，警告各国可能成为”AI 孤岛”。

[!warning] 这就是”代际”框架最反直觉的发现第四代（国家监管）没有稳定地超越第三代（行为宪法）。2025–2026 年我们看到的不是”国家最终收回权力”，而是国家主动退出协调、把权力又让渡回私人行为体。代际不是阶梯，是钟摆。

§5 判断主轴 —— 读代际史时 90% 的人会搞错的四个点

这是本节点的命门。每点带”症状 → 为什么会错 → 正确做法 → 真实反例”。

错位一：把代际读成”替换”，而非”叠加”。

症状：以为”现在是国家监管时代了，平台自我监管已经过时”。
为什么会错：把治理类比成技术（新版本替换旧版本）。
正确做法：四代制度同时在场、层层叠加——社区准则（一代）跑在底层，Oversight Board（二代）和 Constitutional AI（三代）在中层，EU AI Act（四代）在顶层，且彼此冲突。
真实反例：2025 年 Meta 同时（a）维持社区准则、（b）让 Oversight Board 继续运作却威胁断供、（c）改用 Community Notes、（d）受 DSA 约束——四代制度在同一家公司同一时刻打架。

错位二：把”合法性”等同于”合规”。

症状：以为公司只要通过 EU AI Act 合规审查，治理问题就解决了。
为什么会错：混淆了”是否守法”（合规）与”凭什么有权立法”（合法性）。
正确做法：每一代的真正危机都是合法性赤字（power without authority），不是合规失败。Constitutional AI 可以完美”合规”，但它”凭什么代表人类价值”这一合法性问题无解。
真实反例：Meta Oversight Board 程序上完全合规（独立章程、公开裁决），但 Klonick 仍评 C——因为合法性来源是 Meta 自授的。

错位三：把自愿承诺当成约束。

症状：把 RSP、白宫自愿承诺、前沿安全承诺读成”行业已经被管住了”。
为什么会错：忽略了自愿标准在竞争加剧期的历时性脆弱。
正确做法：自愿承诺本质是”承诺备忘录”（promissory note），高风险行业惯例是”不证明安全不得上市”，而 RSP 框架恰恰相反——默认放行直到触发阈值（Campos, 2023, via ailabwatch.org）。
真实反例：Google DeepMind 的 Frontier Safety Framework 被指”尚未将安全措施与风险评估结果挂钩”〔来源：ailabwatch.org，待二次核实〕——承诺存在，挂钩缺失。

错位四：把代际史读成进步史。

症状：画出一条”自我监管 → 监督 → 宪法 → 国家监管”的上升曲线。
为什么会错：用结果偏误剪掉了回潮的证据。
正确做法：承认 2025–2026 的回潮（EO 14148 撤销 + EO 14179 立纲领、十年州禁令被删后转 2025-12 行政令司法施压、stop-the-clock、Oversight Board 断供威胁）是数据点，不是噪声。
真实反例：第一代的”准普通法”在响应速度上反而优于第二代的官僚化监督——后代未必更优。

§6 产品 PM 视角补盲

工程视角会把这四代读成”治理工具升级”，漏掉三个 PM 必须看见的盲点：

合规即护城河（商业模式盲点）：EU AI Act 的高合规成本对头部公司是护城河、对初创是壁垒——Meta 既游说削弱监管、又有能力承担合规，两头通吃。PM 在做市场进入决策时，要把”监管强度”当成竞争变量而非外部约束。
治理形态决定产品边界（用户心理盲点）：用户对”被算法封号无处申诉”（一代）和”有 Oversight Board 可上诉”（二代）的信任感截然不同。治理制度是产品体验的一部分——申诉权、说理、透明度报告都是可设计的信任界面（呼应 p305 - 信任架构与可解释性设计）。
南方语境缺失（GTM 盲点）：以上四代全是美欧叙事。DiDi/99 这类平台在发展中国家面临的是算法劳动控制 + 数据国家化压力的另一条治理线——准主权行为体在弱监管/强国家语境下的形态完全不同。作为做国际化的安全 PM，Rick 的独特资产正是这条被主流文献系统性忽略的”南方治理代际”。

§7 对手框架回应（接受 + 边界，不是反驳）

对手立场一：现有第一修正案框架足够，不需要”新治理者”叙事（Armijo, Knight First Amendment Institute, “Meet the New Governors, Same as the Old Governors”, 2018）。

接受：在内容领域，国家法律（尤其 EU DSA/AI Act 的强制执行）确实证明主权仍有有效边界，平台自治不是无法无天。
边界：但这个立场低估了 AI 公司（OpenAI/Anthropic）通过训练数据选择、安全政策、Model Spec 行使的权力——这种权力在机制上与内容审核不同，第一修正案框架对它几乎无话可说。Klonick 自己 2024 年后转向 EU DSA/DMA 研究，暗示”新治理者”框架可能正在瓦解——但瓦解的方式是被国家监管部分收编，不是因为它从来不成立。

对手立场二：技术封建主义夸大其词，这仍是彻底的资本主义（Evgeny Morozov, “Critique of Techno-Feudal Reason”, New Left Review 133/134, 2022，反驳 Varoufakis Technofeudalism, 2023 与 Durand Technoféodalisme, 2020）。

接受：Morozov 对得很——Alphabet 2017–2020 年均 R&D 投入约 160–275 亿美元，不符合”懒惰食租者”模型；技术公司在生产而非单纯提取。把 AI 公司的准主权类比成”封建领主”在结构上不准确。
边界：但”框架不准”不等于”现象不在”——“云租金”与平台依附性是真实的；本节点用的是”准主权/准立法”而非”封建”,正是为了避开这个陷阱。准主权强调的是治理权力的转移，不预设它是前现代的退行。

Rick 未读对手框架引入（破 echo chamber）：

Carl Schmitt 的主权/例外状态（Politische Theologie, 1922/1934）：“主权者是决定例外状态的人”。用它逼问代际史：四代治理中，谁有权宣布”AI 安全紧急状态”并暂停常规规则？答案恰恰落在私人行为体——RSP 的阈值由公司自定、override 算法决策的权力不透明。Xuechen Niu 的”宰相陷阱”（arXiv:2602.18474, 2026，已核实（2026-06-12））进一步指出：名义主权（CEO/国家）保留 auctoritas，实际治理能力（potestas）转移给算法中间层——主权者对”例外”的识别能力本身被系统性剥蚀。这是对线性代际史最深的颠覆：可能没有任何一代真正”握有”主权。

§8 PM 决策启示

面试怎么用：被问”你怎么看 AI 监管”，不要答”应该加强监管”（hype）。答：“AI 治理有四代叠加的制度形态，关键不是合规而是合法性赤字——而且 2025–2026 出现了向自我监管的回潮（EO 14148 撤销前朝 + EO 14179 立去监管纲领、十年州禁令被删后联邦改以 2025-12 行政令司法施压、stop-the-clock）。我会从’谁有问责义务’切入做产品决策。” 这是 Safety/Policy/T&S PM 的高区分度答案。
选型怎么用：评估一个 AI 供应商的治理成熟度，别看它有没有”宪法/原则”（第三代标配），看它的承诺是否与外部可审计的评估挂钩——这是区分”承诺备忘录”与真约束的分水岭。
复现怎么用：用本节点的”三件套”（制度安排 + 合法性来源 + 问责结构）给任何 AI 治理新闻做快速归代，立刻看出它在解决谁的赤字、又制造谁的赤字（配合 R01 分析一个 AI 产品的制度权力模板）。

§9 与已有节点的关系（升级对照，不复述旧节点事实）

对照 G02 对齐范式代际演化详解（0419 对齐哲学专题）——做”视角纠偏”：0419 的代际史是技术/价值视角（RLHF → CAI → Scalable Oversight，演化的是”如何让模型对齐人类价值”）。本节点是制度/权力视角（演化的是”谁有权定义那个’人类价值’、并问责谁”）。同一个 Constitutional AI，在 0419 是对齐方法的一代，在本节点是”行为宪法”这一制度代际——把技术对象重新读成制度对象。不复述 CAI 的技术机制（见 0419 E01）。
对照 G02 机制设计代际演化详解（0421 机制设计专题）——做”抽象层升级”：0421 用激励相容/委托代理分析 Agent 之间的机制；本节点把同一套制度经济学逻辑升一层，分析 AI 公司与社会之间的治理机制——监管俘获就是”委托代理”在国家-平台层面的失灵（被监管者俘获监管者）。0421 的微观机制是本节点宏观治理的微观基础。
对照 G02 STS 代际演化详解（0422 STS 专题）——做”对话”：0422 从 STS 看 AI 如何被社会建构、如何隐形为基础设施；本节点接住这条线——当 AI 隐形为基础设施（0422 E03），它的治理权力也随之隐形，“准主权”恰恰是”隐形基础设施”的权力面。两节点是同一现象的”建构面”与”权力面”。
对照 G02 失败模式代际演化详解（0416 失败考古学专题）——做”补缺”：0416 编目的是产品级失败（幻觉、注入、法律越界）；本节点补的是制度级失败——合法性赤字、监管俘获、自愿承诺退化是另一类失败，发生在比单个产品高一层的治理结构上。Air Canada 案（0416 E02）在本框架里是”第一代私人秩序的问责缺失”在法律上撞墙的实例。

§10 关联节点

核心（必读）

延伸（可选）

Anthropic
OpenAI
AI 公司政治敏感内容立场对比
p305 - 信任架构与可解释性设计
福柯
霸权
生命政治
0116政治哲学
0133新制度经济学
AI PM 知识图谱·总索引

修订日志

R1（2026-06-07）：首稿。建立”制度代际三件套”（制度安排 + 合法性来源 + 问责结构）框架，逐代写四代（平台自我排序 / 准立法准司法 / 行为宪法 / 国家监管），每代含驱动力·瓶颈·2026 位置·反例修正；判断主轴四件套（错位一至四）；接受+边界回应 Armijo 与 Morozov 两个业界反方；引入 Schmitt/Niu 宰相陷阱作未读对手框架；与 0419/0421/0422/0416 四专题做显式升级对照（纠偏/升级/对话/补缺）。多处事实标〔待核实〕待 grounding pass。
〔待办〕R2：grounding pass —— 验证 arXiv:2212.08073、2407.01557、2602.18474、2605.06806 等 ID；核实 Wachter 卷期、Farrell & Newman 出处、Corporate Europe Observatory 游说数字、ailabwatch 关于 DeepMind 的表述、stop-the-clock 来源；确认 G01 AI 治理制度代际谱系总图等同级双链最终 basename 与奥唐奈节点真实存在。
2026-06-11 P3.1 OBBBA 十年禁令改为事实过去时(§第五代 2026 位置、错位三正确做法、§8 面试话术),由”拟禁止州监管的立法动议”改写为”2025-07-01 参议院 99-1 删除、从未成法 + 联邦转向 2025-12-11 行政令设 AI Litigation Task Force/BEAD 施压”;EO 14179 撤销误归因订正为 EO 14148 撤销 + EO 14179 立纲领;移除 stop-the-clock 处〔来源待核实〕。依据:Senate Commerce 99-1 公告、白宫 EO《Ensuring a National Policy Framework for AI》原文(WebSearch 核实)。
2026-06-12 内审修复:对齐台账矛盾——arXiv:2407.01557(§瓶颈)与 arXiv:2602.18474(§Schmitt/Niu)、arXiv:2605.06806(§监管俘获)三处本节点遗留的〔arXiv ID 待核实〕,统一为”已核实(2026-06-12)“(三 ID 在本专题 S01/A02/A05/E02/G01/总览等处均有 WebFetch/WebSearch 确证记录);2605.06806 的 249/16% 细分数字仍标待核实。
2026-06-12 内审·arXiv 联网核实:清 1 个 ID-level〔待核实〕——§2026 位置处 205/197 原子命题溯源 ID = arXiv:2605.24229《How Well Do Models Follow Their Constitutions?》(Jakkli/Rajamanoharan/Nanda, 2026-05-22)经 WebFetch 确证存在且引述吻合。存疑 0 个;205/197 具体条数为非 arXiv 数字,本轮不动。