R01 分析一个 AI 产品的制度权力
给定一个 AI 产品(Claude 的内容政策、OpenAI 的 Model Spec、抖音的推荐审核、滴滴的派单与封号),你能不能在 30 分钟内说清它事实上行使了哪几项准国家权力、这些权力的制衡缺口在哪、缺口最致命的是哪一层?这一节给一套可操作的审计模板——把抽象的”平台权力”拆成六层可勾选、可取证、可填空的制度权力清单。它的视角不是技术合规(“模型有没有越界”),而是制度设计(“这套规则体系在功能上是不是一个微型国家,它缺了哪三权分立里的哪一权”)。一句话立场:分析能让你看清权力的形状,但看清不等于撼动——本节末尾会承担这个边界。
§0 为什么是”六层制度权力”框架,而不是”伦理风险清单”
转型 PM 拿到”分析一个 AI 产品的治理问题”这个任务,脑中默认会跳出两个错误框架,必须先挡掉。
错误框架一:伦理风险清单(responsible-AI checklist)。 “有没有偏见?有没有隐私问题?有没有可解释性?“——这是合规视角,把 AI 公司当成一个被监管对象,问的是”它有没有违规”。但本专题的核心命题恰恰相反:AI 公司不只是被监管者,它自己就是监管者。Frank Pasquale 在 The Black Box Society(Harvard UP, 2015)里点破:算法的不透明造成的不是”合规瑕疵”,而是权力不对称——用户无法理解、质疑那套支配自己生活的规则。伦理清单永远问不出”谁有权制定规则、谁来审这个规则制定者”。
错误框架二:商业竞争分析(波特五力 / 网络效应)。 这能解释 AI 公司为什么强,解释不了它为什么像国家。Tim Wu 在 The Curse of Bigness(Columbia Global Reports, 2018)里的关键升级,是把平台之大从”反垄断的市场问题”重述为”反民主的政治问题”——规模本身威胁的不是竞争对手,是民主。这一步从”市场”跳到”政体”,正是本框架要的抽象层。
为什么是六层。 把”准国家权力”拆成可审计的颗粒,需要一组正交的维度——既要覆盖政治学经典的立法/行政/司法三权,又要补上现代国家特有的暴力垄断、身份认定、主权宣称。本框架的六层(立法权 / 司法权 / 行政—执法权 / 暴力与基础设施权 / 身份与户籍权 / 主权宣称)正是把 Klonick「平台即私法体系」、Balkin「言论的专职治理者」、Schmitt「主权者决定例外」、福柯「治理术」这几套互不兼容的诊断,强行排进一张可勾选的表。它们互不兼容是优点——逼你从四个角度同时审一个产品,任何单一框架的盲点都会被另一层补上(§6 会展开这个张力)。
[!note] 框架名的自觉 “制度权力”不是 buzzword。它指的是 Douglass North 意义上的”制度”——博弈规则(the rules of the game),而非组织本身。一个 AI 产品行使制度权力,意思是它在为别人设定博弈规则,而不只是参与博弈。这就是为什么”Constitutional AI”这个命名值得严肃对待:它字面就是”宪法 AI”——一份为模型行为立宪的规则文本。
§1 六层制度权力清单(审计主表)
下表是本节的操作核心。拿到任一 AI 产品,逐层填”它行使了吗 / 取证线索 / 制衡装置 / 缺口”。
| 层 | 准国家权力 | 在 AI 产品里长什么样 | 政治学锚点 |
|---|---|---|---|
| L1 立法权 | 制定普遍规则 | 社区准则 / Usage Policy / Model Spec / Constitution | Klonick「私法体系」 |
| L2 司法权 | 裁定个案、解释规则 | 内容审核判定、申诉裁决、封号复核 | Douek「言论行政」 |
| L3 行政—执法权 | 大规模执行 | 自动下架、限流、降权、shadow-ban | Balkin「附带审查」 |
| L4 暴力与基础设施权 | 排除性强制力 | 封号 = 数字流放;API 断供 = 准制裁 | Schmitt「例外状态」 |
| L5 身份与户籍权 | 认定”谁是谁” | 实名认证、徽章、信誉分、KYC | 秦晖「编户齐民」 |
| L6 主权宣称权 | 宣称自治、对抗管辖 | ”我们的平台我们做主”、跨境抗法 | Bremmer & Suleyman「数字主权」 |
填表纪律:每一层不是问”有没有这个功能”,而是问”这个功能在功能上是否替代了原本由国家行使的职能”。封号功能人人有;但当一个账号是某人的生计、政治表达、社会身份的唯一载体时,封号就从”产品操作”升格为”L4 数字流放”——一种私人行使的、不经审判的放逐刑。判断标准是后果的国家级严重性,不是动作的技术形态。
§2 逐层取证:怎么把”权力”变成可填的证据
L1 立法权 — 找那份”宪法”
取证线索:产品有没有一份公开的、定期修订的、声称普遍适用的规则文本?Klonick 在 “The New Governors”(Harvard Law Review 131, 2018, pp.1598–1670)里论证 Facebook/Twitter/YouTube 的内容政策”在功能上构成私法体系”。AI 公司把这一步做得更露骨:Anthropic 的 Constitutional AI(Bai 等, “Constitutional AI: Harmlessness from AI Feedback”, arXiv:2212.08073, 2022)直接用一份明文”宪法”训练模型;学术界已把 Model Spec / Constitution 拆成可审计的原子命题做外部审计(据称 Anthropic 约 205 条、OpenAI 约 197 条,来源:arXiv:2605.24229《How Well Do Models Follow Their Constitutions?》,Jakkli/Rajamanoharan/Nanda, 2026-05-22,ID 已核实(2026-06-12);205/197 具体条数仍待核实)。填表问题:规则谁起草?谁批准?修订有没有公示期?普通用户能不能参与?——如果答案全是”公司内部说了算”,这就是无授权的私人立法。
L2 司法权 — 找那个”法院”
取证线索:有没有一个裁定个案、解释规则、处理申诉的机制?Meta Oversight Board 是迄今最像法院的样本:2020 年 5 月成立,2021 年 1 月起正式裁决,截至 2025 年发布超 200 份决定、317 条政策建议(来源:Oversight Board 官网、Platformer “Meta Oversight Board 五年回顾”)。它的 Trump 停权案(2021)维持停权但裁定 Meta”施加了无限期且无标准的处罚”——这是一个私人机构在用正当程序的语言审查另一个私人机构。填表问题:申诉走得通吗?裁决有没有约束力?解释规则的权力在不在用户手里?Evelyn Douek 在 “Content Moderation as Administration”(Harvard Law Review 136, 2022, pp.526–607)提醒:真正的司法权不在事后个案纠错,而在事前的制度设计——别只盯着申诉窗口,要看规则本身怎么被解释。
L3 行政—执法权 — 找那台”执行机器”
取证线索:规则怎么被大规模、自动化地执行?这是 Douek 说的”mass speech administration(大规模言论行政)“。AI 产品的执法是隐形的:不是公开封禁,而是限流、降权、shadow-ban——用户甚至不知道自己被处罚了。Balkin 的”附带审查”(collateral censorship)在此适用:国家通过胁迫平台来间接规制言论,平台成了执法的代理人。填表问题:执法可见吗?被处罚者知情吗?错误率多少?有没有透明度报告?欧盟 DSA 要求 VLOP 至少每年公开透明度报告(含下架数量、自动化准确率),正是想把这层从黑箱里拽出来。
L4 暴力与基础设施权 — 找那把”剑”
取证线索:产品最严厉的排除性手段是什么,后果有多重?韦伯的国家定义是”垄断合法暴力的组织”。AI 公司没有物理暴力,但有结构性暴力:封号是数字流放,API 断供是准制裁。当 OpenAI/Anthropic 可以单方面切断某个第三方应用的 API 访问——而那个应用的全部业务建立在此之上——这在功能上等于一国对另一国的经济制裁,且不经任何审判。这是 Schmitt 的”例外状态”在算法时代的落地:谁能宣布例外、单方面暂停服务,谁就握有真实主权。Niu 在 “The Chancellor Trap: Administrative Mediation and the Hollowing of Sovereignty in the Algorithmic Age”(Xuechen Niu, arXiv:2602.18474)甚至论证了一个逆转——名义主权者(CEO)保留 auctoritas,但 potestas 已转移到自动处理例外的算法层,主权者对例外的识别能力本身被剥蚀。填表问题:最重的处罚是什么?谁能触发?有没有先于处罚的程序保障?
L5 身份与户籍权 — 找那本”户口本”
取证线索:产品怎么认定”你是谁”、给你贴什么标签?这是六层里最容易被 PM 忽略、却最有秦制味道的一层。秦晖的”编户齐民”——朝廷通过官僚体系直接控制每一户,绕开宗族、村社等中间共同体(来源:0622 秦晖;爱思想”法家与秦制”)。AI 产品的实名认证、信誉分、徽章体系,正是数字版的编户齐民:平台直接给每个个体建档、评级、定身份,绕开了一切中间组织。Rick 在滴滴做过的 CPF实名验证、PAX-Premium实名徽章、优质信息徽章 PPP〔待建节点〕 就是这一层的活样本——徽章和信誉分本质是平台在颁发数字身份证。填表问题:谁定义身份等级?信誉分怎么算、能不能申诉、错判怎么办?身份能不能携带到别处(数据可携权)?
L6 主权宣称权 — 找那句”我们说了算”
取证线索:产品/公司有没有对抗外部管辖、宣称自治的言行?Bremmer & Suleyman(2023, Foreign Affairs〔具体卷期待核实〕,引于 Srivastava & Bullock, “AI, Global Governance, and Digital Sovereignty”, arXiv:2410.17481, 2024)直言”大型科技公司已事实上成为其所创建数字领域中的独立主权行动者”。OpenAI 倡议设立 IAEA 式国际监管机构,本身就是一种准外交行为——一个公司在为整个行业的国际治理架构提案。填表问题:公司怎么回应各国监管?是配合、规避、还是公开对抗?它有没有自己的”外交政策”?
§3 缺口诊断:把六层接到”三权分立”上
填完六层”有没有”,第二步是诊断制衡缺口。这里用一个简单的对照:现代国家用三权分立 + 选举问责来约束这六种权力;AI 产品有没有对应的约束装置?
| 国家的制衡装置 | AI 产品里的对应物 | 典型缺口 |
|---|---|---|
| 立法须经代议 | 用户参与规则制定 | 几乎全缺:规则公司内部定 |
| 司法独立 | 独立申诉/复核机构 | 极弱:Oversight Board 受 Meta 资助、Klonick 评 C |
| 行政受司法审查 | 执法可被外部审查 | 黑箱:限流/shadow-ban 不可见 |
| 暴力须经审判 | 封号/断供前的正当程序 | 缺:即时、单方、无审判 |
| 户籍受法律约束 | 身份认定的申诉与纠错 | 弱:信誉分算法不透明 |
| 主权受国际法约束 | 公司受各国法律约束 | 张力:跨境抗法 vs DSA/AI Act |
诊断公式:对每一层,问”纵向问责存在吗?横向问责存在吗?” 这是 O’Donnell 在 “Delegative Democracy”(Journal of Democracy 5:1, 1994, pp.55–69)的核心区分。AI 产品几乎总是有纵向问责(用户能用脚投票、给差评、卸载)却缺横向问责(没有独立机构能制衡规则制定者)。这正是 O’Donnell 笔下”委任民主”的结构:选民把全权委任出去后,横向制衡缺位。把它套到 AI 产品:用户”委任”了平台,此后平台”为所欲为”,唯一的退出是离开——而当平台是基础设施时,退出成本趋近于无穷。缺口最致命的判定标准:哪一层的退出成本最高、横向问责最弱,哪一层就是这个产品的”主权命门”。对消费级内容平台,往往是 L3(隐形执法);对开发者平台,往往是 L4(API 断供);对滴滴这类劳动平台,往往是 L5(信誉分决定接单权 = 生计)。
§4 判断主轴:审计这类产品时 90% 的人会栽的四个坑
这一节是本模板的命门——把”制度权力分析”做砸的四种典型方式,每个带症状→为什么错→正确做法→真实反例。
坑一:把”有治理机制”当成”有制衡”。
- 症状:看到 Meta 有 Oversight Board,就写”该产品具备司法制衡”。
- 为什么错:机制的存在不等于有效。Oversight Board 被 Klonick 评为”勉强及格(C)“,Meta 保留对政策的最终解释权,2025 年 1 月废除美国第三方事实核查、改用 Community Notes 时”仓促宣布、偏离常规程序”(来源:Platformer、TechPolicy Press),且 Meta 通知 Board 可能 2028 年后停止资助(来源:TechBrew, 2026)。一个可以被资助方随时断粮、且其裁决可被改写的”法院”,不是司法制衡,是合法性外衣。
- 正确做法:对每个制衡装置追问”它能不能否决创造它的人”。否决不了 = 装饰。
- 真实反例:Community Notes 上线首六个月美国仅产生约 900 条已发布笔记,同期 EU 专业事实核查标记约 3500 万条内容(来源:0430 专题接地材料)——量级差三个数量级,“制衡”名存实亡。
坑二:把”自愿承诺”当成”约束”。
- 症状:看到公司发布了 RSP、签了白宫自愿承诺,就写”该产品已建立安全治理框架”。
- 为什么错:自愿承诺是”承诺备忘录(promissory note)“不是政策。竞争压力下实验室有激励放松约束或重新解释阈值(来源:ailabwatch 总结的 Campos 2023 批评)。高风险行业惯例是”不证明安全不得上市”,RSP 框架恰恰相反——默认放行直到触发阈值。
- 正确做法:区分”承诺”与”可执行约束”。问:违约的后果是什么?谁来认定违约?没有外部执法 = 自我监管 = 没有约束。
- 真实反例:Google DeepMind 的 Frontier Safety Framework 被明确指出”尚未将安全措施与风险评估结果挂钩”(来源:ailabwatch)——承诺与执行之间是断的。
坑三:把”技术合规视角”误当”制度权力视角”。
- 症状:审计报告写满”模型偏见率""幻觉率""可解释性评分”,却没有一句”谁有权制定这些标准”。
- 为什么错:这是把 AI 公司当被监管对象,回避了它自己是监管者这个核心事实。Birhane 等(“Big AI’s Regulatory Capture: Mapping Industry Interference and Government Complicity”, arXiv:2605.06806, FAccT 2026)的”话语俘获”框架点破:行业通过资助研究、定义术语、主导专家咨询,在正式监管出台前就已塑造了监管可能性空间。你用它定义的合规指标去审它,等于用它写的考卷给它打分。
- 正确做法:先问”这套评价标准是谁定的、为谁服务”,再用标准评分。
- 真实反例:欧盟立法过程中科技业年游说支出达 €1.51 亿、Meta 单家 €1000 万,GPAI 最初获豁免、基本权利审查条款被删(来源:Corporate Europe Observatory, 2024)——标准本身就是被俘获的产物。
坑四:把”主权宣称”当成”已是主权”(过度阐释)。
- 症状:读了几篇”技术封建主义”,就写”AI 公司已成为不受国家约束的数字领主”。
- 为什么错:这是把一个张力现象夸大为既成事实。Morozov 在 “Critique of Techno-Feudal Reason”(New Left Review 133/134, 2022)反驳 Varoufakis:当前体制仍是彻底的资本主义而非封建主义——Alphabet 年均 R&D 投入数百亿美元,不符合”懒惰食租者”模型;技术公司在生产而非单纯提取。同样地,EU DSA/AI Act 的强制执法证明国家边界仍然有效。
- 正确做法:用”接受 + 边界”。接受 AI 公司正在积累准主权权力,但坚持这是未完成的、受国家有效约束的过程,尤其在欧盟。
- 真实反例:DSA 两年内据称使 5000 万条内容审核决定获得复审机会(来源:欧盟委员会)——主权宣称撞上了真实的法律边界。
§5 产品 PM 视角补盲:审计之外的三个看走眼点
工程/政策视角容易只盯”权力—制衡”这条线,PM 还要补三个商业与用户心理的盲点。
- 用户心理:为什么用户主动交出权力。 福柯的治理术(governmentality)说权力不靠压制、靠”引导品行”。Rouvroy & Berns(“Algorithmic Governmentality”, Réseaux 177, 2013)更进一步:算法治理绕过主体化,直接作用于行为概率——用户不是被强迫,是被推荐流”引导”得心甘情愿。审计 L5 身份层时要补这一问:信誉分不只是控制工具,它让用户主动表演符合平台期待的行为。这是比强制更深的权力。
- 商业模式:制衡缺口往往是利润来源。 隐形执法(L3)之所以隐形,常因为透明会损害广告/推荐的商业逻辑。审计时别把缺口当”疏忽”,它可能是有意的设计。Zuboff 的”行为剩余”(The Age of Surveillance Capitalism, 2019)提示:数据提取与治理权力的集中是同一枚硬币——你审的制度权力,常常就是商业模式本身。
- GTM 与合规套利:南方视角缺失。 多数治理文献以美欧为中心。但同一个 AI 产品在 DSA 管辖下和在监管薄弱地区,行使的制度权力天差地别。Rick 的滴滴/99 经验在此是稀缺资产:发展中国家语境下平台的算法劳动控制、数据国家化压力,构成独立的分析对象——审计模板必须问”在哪个司法辖区”。
§6 对手框架回应:四套理论互掐,模板怎么不被打穿
本框架硬把四套不兼容的理论塞进六层表,最锋利的反方是:“你这是理论大杂烩,施密特的统一主权和福柯的弥散权力根本不能同时成立。”
接受:这个批评对。Schmitt 预设主权是统一的政治实体(“主权者决定例外”),Foucault 则消解主权中心(权力无处不在、无主体)——两者在本体论上确实冲突,不能在同一句话里既说”CEO 是主权者”又说”没有主权者”。
边界与赌注:但本模板的用途不是建构统一理论,而是多角度取证。我赌的是——一个真实 AI 产品在不同层会呈现不同的权力形态:L4(封号/断供)确实像 Schmitt 的例外决断(有明确的决断者),L3(推荐流引导)确实像 Foucault 的弥散治理(没有单一决断者)。用 Schmitt 审 L4、用 Foucault 审 L3,不是逻辑矛盾,是分工。Niu 的”Chancellor Trap”恰好证明二者可以接合:名义上的 Schmitt 式主权者(CEO)与实际上的 Foucault 式弥散权力(算法层)在同一产品里并存且互相掏空。框架的不兼容是诊断工具,逼审计者别用单一镜头看完全部六层。这与本专题的另一处升级呼应:把”AI 治理”从单一框架的争辩,升级为多框架的可操作清单。
Klonick 自己的转向也是边界提示:她后续研究转向 EU DSA/DMA 执法,暗示”新治理者”框架正在被国家法律的回归所修正(来源:0430 专题接地材料)。本模板因此把 L6 主权宣称设计成”张力”而非”事实”——留出国家反扑的位置。
§7 PM 决策启示:面试 / 选型 / 复现三类落地
- 面试(Safety PM / Policy PM / Trust & Safety 高区分度):被问”你怎么看 AI 平台治理”,别答伦理清单。用六层表现场拆一个产品:“Claude 的 Usage Policy 是 L1 立法,没有用户参与;申诉是 L2 但无独立性;API 断供是 L4 准制裁、无正当程序——最致命的缺口在 L4。“30 秒展示制度设计视角,区分度立现。
- 选型(基础模型 / API 供应商):把六层当供应商风险评估表。L4 是采购决策的隐藏命门——你的业务建在谁的 API 上,谁就握有对你的”准制裁权”。选型时问:断供有没有申诉?有没有迁移期?有没有多供应商冗余?这是把制度权力分析变成供应链韧性。
- 复现(设计自家产品的治理):反过来用——审计自家产品行使了哪几层、缺了哪些制衡,主动补上会成为合规护城河(DSA/AI Act 时代尤甚)。Rick 在滴滴做信誉分/徽章(L5),正确做法是同步设计申诉与纠错(给 L5 配一个 L2),而不是只造权力不造制衡。
§8 与已有节点的关系
本节点是 0430 专题”05 复现指南”的入口模板,对照并升级以下既有节点(不复述其事实基础):
- 对照 Constitutional AI:该节点讲 CAI 的技术机制(RLAIF、宪法文本);本节点把它升格为 L1 立法权的取证样本——补的是”宪法即权力”的制度维度,纠的是”把 CAI 只当对齐技术看”的窄化。
- 对照 AI 公司政治敏感内容立场对比:该节点做横向立场对比;本节点提供纵向权力解剖的方法论——对比是结果,六层表是产生对比的工具。
- 对话 p305 - 信任架构与可解释性设计:信任架构是”如何让用户信任”,本节点问”用户凭什么该信任一个无制衡的权力”——把信任问题接到合法性问题。
- 深化 Rick 工作节点 CPF实名验证 / PAX-Premium实名徽章 及其在出行平台安全感知方向的一手履历:把这些产品实践重新框定为 L5 身份与户籍权的真实案例,提供”从实践到制度理论”的反向通道。
- 升级对照专题内 0419(CAI 对齐):0419 在对齐工程层讨论 CAI;本节点在制度权力层重用同一对象——升高了抽象层,从”对齐做得好不好”到”立宪权归谁”。
- 升级对照 0421(机制设计):0421 讲激励机制设计;本节点的”造权力须同步造制衡”是机制设计在治理层的应用——0421 是工具,R01 是把工具用在制度审计上。
- 升级对照 0422(STS):0422 提供 Rouvroy/福柯的 STS 框架;本节点把它落地为 §5 用户心理补盲的取证步骤——不空喊治理术,而是变成可填的审计问题。
- 升级对照 0416(失败实例剖解):0416 剖的是产品功能失败;本节点剖的是制度缺口失败——同一个产品,0416 问”为什么不好用”,R01 问”为什么不可问责”。
§9 关联节点
核心(必读) Constitutional AI · AI 公司政治敏感内容立场对比 · 0622 秦晖 · 奥唐奈 · 福柯 · 0116政治哲学 · 生命政治 · 霸权 · CPF实名验证 · PAX-Premium实名徽章 · p305 - 信任架构与可解释性设计 · AI PM 知识图谱·总索引
延伸(可选) 0606 韦伯 · 阿伦特 · 葛兰西 · 0133新制度经济学 · 政治哲学图谱 · 极权主义 · 出行平台安全感知方向(一手履历)· PAX-Premium实名徽章 · 降发生方法论 · 明镜系统 · Anthropic · OpenAI · Agent
§10 边界承担:分析 ≠ 改变权力
最后必须诚实地承担本模板的根本局限。这套六层框架能让你看清一个 AI 产品的权力形状,但看清不等于撼动它。
这是认识论与政治之间的鸿沟。福柯式的诊断、Klonick 式的描述、本模板的填表,全都停在”使权力可见”这一步。可见性本身不重组权力——Pasquale 揭开黑箱二十年,黑箱更大了;Oversight Board 写下数百份漂亮裁决,Meta 照样在 2025 年单方面拆掉事实核查。Birhane 的”话语俘获”框架最刺人的地方在于:连”批判 AI 权力”这件事本身,都可能被纳入权力的再生产——公司资助治理研究、邀请批评者进咨询委员会,让批判成为合法性的装饰。一个 PM 用这套模板写出完美的审计报告,报告很可能被归档进”我们重视治理”的 PR 材料里。
所以本节点的赌注是有限的:它赌的是”清晰的诊断是行动的必要条件,不是充分条件”。改变权力需要的是制度装置(DSA 那样的强制执法)、集体行动、以及国家与平台之间的真实博弈——这些都在一份分析模板的能力之外。把这一点写在末尾不是泄气,是认识论自觉:别把”我分析透了”误当成”我解决了”。对一个转型 Safety/Policy PM,这条边界恰恰是最有价值的判断——它让你在面试桌上既能展示锋利的分析,又不至于天真到以为分析就是治理。能看清权力又承认看清的局限,比假装分析能改变一切,更接近真正的制度成熟。
修订日志
- R1(2026-06-07):首稿。建立六层制度权力审计主表(L1–L6)+ 逐层取证 + 缺口诊断(接 O’Donnell 横向/纵向问责)+ 四坑判断主轴 + 四框架互掐回应 + 三类 PM 落地 + 末尾”分析≠改变权力”边界承担。
- R2(2026-06-07):grounding pass。WebFetch 验证四个 arXiv ID 全部为真且与论点匹配——2212.08073(Bai 等, Constitutional AI: Harmlessness from AI Feedback, 2022)、2410.17481(Srivastava & Bullock, AI, Global Governance, and Digital Sovereignty, 2024)、2602.18474(Xuechen Niu, The Chancellor Trap)、2605.06806(Birhane 等, Big AI’s Regulatory Capture)。补全标题/作者,移除对应〔待核实〕标记。余下〔待核实〕:CAI/OpenAI 原子命题条数(205/197)、Bremmer & Suleyman 2023 Foreign Affairs 具体卷期——均为二手转引,保留标记。
- 2026-06-12 内审·arXiv 联网核实:清 1 个 ID-level〔待核实〕——L1 取证线索处 205/197 原子命题溯源 ID = arXiv:2605.24229《How Well Do Models Follow Their Constitutions?》(Jakkli/Rajamanoharan/Nanda, 2026-05-22)经 WebFetch 确证存在且引述吻合。存疑 0 个;205/197 具体条数与 Bremmer & Suleyman 卷期为非 arXiv 项,本轮不动。