S03 认知友好 AI 设计全景

本专题前面所有节点都在拆解”用户的脑子在用 AI 时会以哪些可预测的方式失灵”——双系统会盲信流畅（A02）、工作记忆只有 4 块（A03）、确定系统的心智模型套不上概率系统（A04）、首版输出会锚死后续判断（A05）、好用即技能退化（A06）。但拆完之后必须有人把它们重新拼回去：当 PM 真的坐到一块空白画布前要做一个 AI 产品，这些散落的认知机制如何收敛成一套可执行、可排序、互相会打架的设计原则？ 这就是本节点要解决的问题。它是整个 0426 专题的收口节点：不引入任何新的认知机制，只做一件事——把五条认知科学链路整合成 AI 设计原则全景，给出一份可贴墙的原则清单，并与 p302 - 七种 AI 交互设计模式–p305 - 信任架构与可解释性设计这套设计模式做显式的”底座 vs 招式”对照。

本节点的视角框架是**「认知底座 → 设计原则 → 设计模式」三层结构**。c01 与本专题各节点是底座（人脑为什么这样反应），S03 是原则（据此该坚持什么），p3xx 是模式（具体怎么落地）。S01 是”认知账本”（负荷往哪流），S02 是”偏差查表”（哪块屏幕诱发哪个偏差）——S03 站在它们之上，回答一个它们都不回答的问题：这些原则之间互相冲突时，PM 该怎么排序取舍。 这是本节点存在的全部理由，也是它区别于”把五条原则列一遍”的综述的地方。

§0 为什么是”五原则 + 冲突排序”，而不是”设计 checklist”

业界最常见的默认框架，是把”AI 设计指南”做成一份扁平 checklist——加来源、显置信度、做确认断点、控制选项数……每条单看都对，攒成一张表发出去。这个框架有一个致命缺陷：它假设原则之间是相加的、无冲突的、可以同时满足的。 而本专题前面每个节点都在反复证明同一件事——它们不是。

降负荷（A03）和保技能（A06）在长期上直接对立；防锚定（A05）要求多候选并列，但多候选又触发 Hick 定律推高负荷（A03/S02），把用户推回 System 1；流畅体验是产品卖点，却恰恰是 System 1 盲信的引擎（A02）。一份扁平 checklist 会让 PM 在两条互相矛盾的”最佳实践”之间无所适从，最后哪条好实现就做哪条——而好实现的那条（降负荷、做流畅）几乎总是会牺牲那条难实现的（保技能、促审视）。

所以本节点拒绝 checklist 的扁平结构，采用**「五原则 + 显式冲突矩阵 + 按风险的排序规则」**：先给五条原则各自的认知出处与可观测动作，再用一张矩阵标出它们两两之间在哪里打架，最后给出”冲突时按什么排序”的决策规则。原则清单只是入场券，冲突排序才是 PM 的真功夫。

[!note] 框架级辨析

checklist 框架问”我做全了吗”——适合确定性系统，因为那里的设计目标（可用性、一致性）大体同向、可叠加。

冲突排序框架问”它们打架时我赌哪边”——AI 交互必须用这个，因为概率系统把”降负荷/保技能""流畅/审视”这些原本同向的目标撕成了对立面。这正是 A01 认知科学与 AI 交互概念谱系说的”AI 比 GUI 更依赖认知科学是性质问题”在设计层的兑现。

§1 五条认知友好设计原则（认知出处 → 可观测动作 → 对应模式）

下面是从本专题五支认知机制收敛出的五条设计原则。读法：每条标出认知出处（本专题哪个节点）、一句话原则、可观测的设计动作、以及它主要兑现在哪个 p3xx 模式上。

原则	认知出处	一句话原则	可观测动作	对应 p3xx
P1 校准 System 2	A02 双系统	按风险增/减摩擦，而非全局加摩擦或全局去摩擦	高风险不可逆操作设确认断点；低风险主动降摩擦让 System 1 顺过	p304 - 防御性 UX：对抗延迟与幻觉分段确认 / p305 - 信任架构与可解释性设计 HITL
P2 控认知负荷	A03 负荷理论	砍外在负荷、分段内在负荷、单屏组块 ≤4±1	砍客套冗余；长输出分段/折叠；候选项 ≤4–5（Cowan 而非 Miller）	p303 - 克服空白画布综合症渐进揭示 / p304 流式
P3 扶正心智模型	A04 心智模型	主动构造能让用户正确归因的证据结构，填评估鸿沟	暴露 temperature/seed/logprobs/工具日志；显式标”每次可能不同”；能力边界可见	p305 校准信任 / p304 状态可见
P4 防锚定	A05 锚定	用结构而非文字解锚；管理”问题的第一下框定”	多候选并列打散单锚；高风险先让用户出锚再给建议；首版笃定度与置信度校准	p305 / p302 - 七种 AI 交互设计模式多候选
P5 保技能（防退化）	A06 依赖陷阱	区分替代练习 vs 辅助练习；核心技能路径保留”自己来”	HITL 断点兼作强制练习点；监测用户无 AI 时的独立能力（非只看依赖度）	p305 HITL 的二次价值

几个关键的接地说明：

P2 的容量阈值取 Cowan (2001) 的 4±1，而非 Miller (1956) 的 7±2。 原因 A03/S01 已论证：当用户在审视 AI 输出（一项 System 2 任务）的同时还要持有候选项，纯注意焦点容量（Cowan 的 4）才是安全阈值。把候选设到 7 是用 Miller 的乐观上限给一个已满载的系统加码。
P1 的”按风险校准”是双侧的，不是单侧加摩擦。 A02 用 U 型曲线（Horowitz & Kahn 2023, arXiv:2306.16507，9 国 9000 人）证明过度激活 System 2 会把用户推向算法厌恶（Dietvorst et al. 2015, JEP:General 144:114–126）。所以 P1 的目标是”在对的地方触发 System 2、在对的地方让 System 1 顺过”，不是”摩擦越多越安全”。
P5 的技能退化有 RCT 证据。 Liu et al. (2026, arXiv:2604.04721, n=1,222) 发现仅约 10 分钟 AI 辅助后，参与者独立完成同类任务表现显著变差、更易放弃。理论根在 Bainbridge (1983) 自动化悖论。但要砍 confirmation bias：Peng et al. (2023) 的 Copilot 实验显示 AI 可提升初学者效率——退化与否取决于”替代练习还是辅助练习”，是设计责任而非技术宿命。

§2 五原则不是相加的：冲突矩阵

把五条原则两两放在一起，会发现它们之间有四对结构性冲突。这张矩阵是本节点相对一切”AI 设计指南”的核心增量——它把”打架的地方”显式画出来，而不是假装它们能同时满足。

	P1 校准S2	P2 控负荷	P3 扶心智	P4 防锚定	P5 保技能
P1 校准S2	—	协同：减负腾出的资源应定向补给审视	协同	协同	协同：HITL 既校准又练技能
P2 控负荷	协同	—	冲突①：扶心智要加证据（来源/置信度/日志）→ 增负荷（透明度悖论）	冲突②：防锚定要多候选 → Hick 定律增负荷	协同
P3 扶心智	协同	冲突①	—	协同	协同
P4 防锚定	协同	冲突②	协同	—	协同
P5 保技能	协同	协同	协同	协同	—

但矩阵里”协同”的格子藏着最阴险的一对冲突，它不在两条原则之间，而在**“全部原则的成功”与 P5 之间**：

[!warning] 冲突③（隐藏的总冲突）：P1–P4 做得越好，P5 越危险 P1–P4 每一条做到位，都是一次成功的认知卸载——把审视、记忆、判断、构想的负荷从用户搬给系统。短期是体验胜利；长期看，用户失去练习机会，技能图式（Sweller 的 schema）无从建构。前四条优化得越好，P5 退化得越快，这是一组直接负相关。它不在任何单次交互内显现，所以最容易被”五原则都满足了”的自满掩盖。这正是 S01 耦合点三（降负荷反噬技能层）在原则层的复现。

冲突④是流畅体验 vs 促审视：把 P2（控负荷、做流畅）做到极致，输出越顺滑、越自信、越像答案，越触发 System 1 的快速接受（processing fluency 偏差），恰恰削弱 P1 想要的高风险处审视。流畅是 P2 的胜利，却是 P1 的敌人。

这四对冲突，就是下一节”90% 会搞错”的来源——因为大多数 PM 根本没意识到原则之间会打架。

§3 判断主轴：认知友好设计上 90% 的人会搞错的四个点

[!warning] 这是本节点的命门把”认知友好”落到产品上，最致命的不是漏掉某条原则，而是误以为原则之间可以无代价地同时满足。下面四点，每个都是一对原则在打架时的错误取舍，配 症状 → 为什么会错 → 正确做法 → 真实反例/证据 四件套。

错位一：把”认知友好”等同于”负荷最小化”

症状：团队把”降低认知负荷”当成 AI 设计的最高目标，KPI 是”让用户少想、少点、少读”，越省力越好，输出越流畅越自信越好。
为什么会错：这是把”认知友好”窄化成了”负荷最小化”，而二者恰恰相反。一味降负荷会直接反噬 P1（校准 System 2）和 P5（保技能）。 负荷降到极致，意味着审视所需的”减速点”被全部抹平、技能所需的”自己来”机会被全部替代——用户进入无摩擦的盲信与退化。S01 耦合点一已证明：工作记忆是共享池，把 L2 负荷降得太顺，省下的资源不会自动流向 L3 可信判断，反而被 System 1 拿去”更快地接受”。认知友好 = 把负荷分配到对的地方，不是把负荷总量压到最低。
正确做法：放弃”负荷最小化”目标，改为”负荷再分配”目标——砍掉外在负荷（客套、冗余、乱序），但把省下的资源定向补给 L3 可信判断（置信度外显、溯源、低置信片段视觉降级），并在高价值技能路径上主动保留一定摩擦（强制练习点）。“该省的省到底，该留的摩擦一点不能少。”
真实证据：Beck, Eckman, Kern & Kreuter (2025, arXiv:2509.08514, N=2,784) 发现一个反直觉结果——要求用户纠错反而降低参与度、提高了对错误建议的接受率，因为纠错占用工作记忆、激活 System 1 省力策略。这反向证明”负荷越低越好”是错的：负荷管理是定向调度，不是单调下降。

错位二：以为降负荷能顺便提升可信判断（降负荷 → 盲信）

症状：产品把界面做得极简、输出做得极流畅，团队相信”用户负担轻了，自然就有余力好好审视了”。可用性指标（完成率、满意度）全线上扬，错误采纳率却在悄悄上升。
为什么会错：这是错位一的”近亲”，但更隐蔽——它假设”省下的认知资源会自动流向审视”。不会。 processing fluency 偏差（A02 §1、S02 §2.1）的机制是：流畅度被大脑误读为可信度。你把输出做得越顺滑、越自信、越像”答案”，越是在批量生产 System 1 的快速接受。降负荷腾出的资源，被流畅外壳引导去”更快地相信”，而非”更仔细地核验”。冲突④在这里兑现。
正确做法：降负荷与促审视必须协同设计、定向补给——在削减外在负荷的同时，在高风险处主动注入”减速点”，并让首版的笃定程度与真实置信度校准（A05 错位三）。即把省下的资源用结构（而非呼吁）定向引到 L3，而不是放任它流失成盲信。“审视不能靠呼吁，只能靠结构”（A02）。
真实证据：Dhuliawala et al. (2023, EMNLP, arXiv:2310.13544) 证明最有害的模式是 overconfident + wrong（高置信但出错），对信任的破坏远大于 underconfident + correct，且信任恢复极慢。流畅自信的错误，比明显的错误危险得多——降负荷做出的”完美流畅”恰恰是这种危险的温床。

错位三：把降负荷与保技能当成同向目标（其实长期对立）

症状：产品在 L1–L5 每层都做了出色的减负，用户用得飞起、依赖度极高，团队把”用户离不开”当成留存胜利。停掉 AI，用户连基础独立任务都做不利索了。
为什么会错：这是冲突③——降负荷（P2）与保技能（P5）在长期上结构性对立，但它的代价跨越时间累积，不在任何一次交互内显现，所以最容易被误当成”双赢”。更深一层是商业模式的对立：多数 AI 产品的北极星指标奖励”依赖度上升”，而依赖度上升与技能退化是孪生兄弟（A06 错位一）。指标体系会自动把产品推向”让用户保持恰到好处的无能”——这不是恶意，是激励结构的必然。
正确做法：把 P5 当成显式的设计约束，而非 P1–P4 优化的副产品。具体：(a) 区分”替代练习”（计算器替代算术，可接受）与”辅助练习”（若产品价值主张正建立在”用户保有该技能”上，就不能无脑替代）；(b) 在核心技能路径保留”自己来”模式；(c) 让 HITL 确认断点兼作强制练习点——它逼用户调用 System 2，同时对抗盲信和退化（P1×P5 协同）；(d) 为依赖的”质量”建指标（用户无 AI 时的成功率随时间变化），而非只看依赖的”量”。
真实证据：Liu et al. (2026, arXiv:2604.04721, n=1,222 RCT) 的 10 分钟退化；GitClear (2024) 对 1.53 亿行代码的分析显示 AI 辅助后代码搅动率预计较 AI 前基线翻倍（相关性而非因果，方法论受过质疑，列为 confirmation-bias 砍除项）。注意：Liu 是 RCT（强证据），GitClear 是观察（弱证据），不可等同。

错位四：把防锚定与流畅体验当成可兼得（其实直接冲突）

症状：为防锚定（P4），产品在每次输出时并列 5–6 个等价候选、加满”这只是一种可能”的标注、要求用户先表态再看 AI——结果交互变得又慢又重，用户嫌烦，体验崩塌。或者反过来：为了流畅，只给一个笃定的首版答案，把防锚定彻底牺牲掉。
为什么会错：这是冲突②叠加冲突④——防锚定要求的”多候选并列 + 顺序反转 + 不确定标注”，每一样都在增加外在负荷、打断流畅体验。多候选触发 Hick 定律（选项越多决策越慢、负荷越高），把用户推回 System 1 反而更依赖锚点偷懒（S02 §3 错位三）。“全面防锚定”做过头，本身就是认知负荷灾难。
正确做法：防锚定必须按风险分级，不是一刀切。锚定不是绝对的恶——在低风险、需快速起步的场景（空白画布冷启动），首版给个起点正是 p303 - 克服空白画布综合症要解决的问题，被锚反而是期望的（A05 §4）。只在高风险 + 陌生领域 + 中等时间压力（多数 C 端 AI 主战场）做结构性解锚，且解锚手段要在 Cowan 4±1 预算内统筹：与其堆 6 个候选，不如给 2–3 个 + 一个清晰默认 + 高风险处的顺序反转。“用减法做防锚定”。
真实证据：Rosbach et al. (2026, arXiv:2603.11821) 对 28 名病理学专家测得 7% 自动化偏差率——在高风险场景，7% 已需 HITL 断点；但在低风险（营销文案初稿）场景，被锚是可接受甚至期望的。锚定是一个要按场景风险分级管理的力，不是要无差别消灭的偏差。

[!note] 四个错位的共同结构它们都源于同一个认知盲区：把”认知友好”理解成了一个单调可优化的标量（越省力/越流畅/越少锚越好），而它其实是一个带约束的多目标权衡。 五条原则共享同一份有限的认知预算（工作记忆）和同一本长期的技能账，任何一条做到极致都会透支另一条。PM 的真功夫不是”满足所有原则”，而是在它们打架时，按风险赌对取舍方向。

§4 设计原则清单（可贴墙 · 按风险分级）

把五原则落成一份按风险分级的可观测清单。核心用法：先定这块屏幕的风险等级，再查该等级下每条原则的动作——因为同一条原则在高低风险下的正确动作恰恰相反。

原则	低风险场景（高频、可逆、低赌注）	高风险场景（不可逆、安全/医疗/金融）
P1 校准S2	主动降摩擦，让 System 1 顺过；不弹无谓确认	设真正打断的确认断点（非走过场的确认框）；HITL 必须真激活 System 2
P2 控负荷	砍到极简，默认 top 1–3，其余折叠	仍砍外在负荷，但不砍法定告知 / 必要证据；分段呈现复杂内在负荷
P3 扶心智	轻量提示”每次可能不同”即可	强制暴露溯源/置信度/状态；把评估鸿沟的证据结构做成一等公民
P4 防锚定	允许单一首版起点（被锚 = feature，解冷启动）	多候选并列 + 顺序反转（先让用户出锚）+ 不确定区间外显
P5 保技能	可放心替代练习（用户不靠它长技能）	若该技能是用户核心价值承重墙，保留”自己来”路径 + HITL 当练习点

[!tip] 怎么用这张清单三步：① 先判风险等级（这块屏幕的操作可逆吗？错了谁承担后果？）；② 对照该列逐条过五原则；③ 重点检查 §2 矩阵里的四对冲突——尤其在高风险列，P2（控负荷）和 P3（扶心智）会因透明度悖论打架、P2 和 P4（防锚定）会因 Hick 定律打架，此时风险等级决定谁让步：高风险一律以”扶心智 + 防锚定 + 保技能”优先，宁可牺牲一点流畅/简洁。低风险则反过来，以负荷最小化和流畅优先，砍掉过度防御。

§5 与 p302–p305 设计模式的显式升级对照（认知底座 vs 设计模式）

这是本节点对全专题的收口职责：把五条认知原则与 p3xx 这套设计模式做一次总对照，说清”本专题是认知底座，p3xx 是设计模式”这层关系到底兑现在哪里。原则是”为什么这么做有效 + 什么时候失效”，模式是”具体怎么做”。

p3xx 设计模式	它解决的设计问题	本专题供给的认知原则底座	S03 做的升级（补缺/纠偏/失效边界）
p302 - 七种 AI 交互设计模式	七种交互模式总览（怎么做）	P1–P5 全部——p302 是模式库，本专题是其认知根基	补：七模式整体可读作”对五原则冲突的对症设计库”；纠偏：模式之间也会因原则冲突而打架，不能无脑叠加
p303 - 克服空白画布综合症	输入侧表达焦虑、冷启动（怎么做）	P2 控负荷（渐进揭示=砍外在负荷）；P4 防锚定的反面（首版起点是解药）	补失效边界：p303 把”给首版起点”当解药，本专题指出同一起点在高风险场景是毒（锚死错误判断）——P4 的风险分级是 p303 缺的那一半
p304 - 防御性 UX：对抗延迟与幻觉	对抗延迟与幻觉（怎么做）	P1 校准S2（分段确认）；P2（流式=摊平负荷峰值）；P3 扶心智（置信度外显=填评估鸿沟）	纠偏：p304 的设计模式”为什么有效”取决于是否真激活 System 2、是否定向补给 L3；补：流式降负荷与促审视会打架（冲突④）
p305 - 信任架构与可解释性设计	信任架构、可解释性（怎么做）	P1（HITL）；P3（校准信任=扶正心智模型）；P4（解锚）；P5（HITL 兼作练习点）	升格：A04 把 p305 从”UX 模式”升格为”认识论补偿装置”；补：S01 指出 p305 的 HITL 断点还兼对抗 P5 技能退化，这层价值 p305 未显式点出

[!note] 一句话定位关系 p3xx 是招式，本专题（含 S03）是内力运行图。 p304 教你”做流式输出”，S03 告诉你”流式把 L2 高峰负荷摊平，但若不在 L3 定向补给，省下的资源会流失成盲信”（冲突④）。p305 教你”校准信任而非最大化信任”，S03 告诉你”校准的本质是按风险调度 System 2（P1），且 HITL 断点同时在干保技能（P5）的活”。没有 S03 的原则层，p3xx 就是一堆可能互相打架却被当成可叠加 checklist 的招式。

§6 产品 PM 视角补盲（跳出工程视角）

三个最容易被”认知友好设计”漏掉的 PM 盲点：

“认知友好”在指标体系里是反增长的，且短期必输。 P5（保技能）和 P1（高风险加摩擦）几乎总与留存/转化/满意度对立——流畅盲信带来即时好评，技能退化的伤害有延迟。这是 0117社会学意义上”工具理性侵蚀实质理性”在产品层的落地：指标体系会自动把产品推向”恰到好处的无能”。PM 要做的不是假装冲突不存在，而是在 OKR 里主动设反向护栏（如”依赖质量”指标）——否则默认方向就是牺牲认知友好换增长。
认知友好的责任边界在合规处变成硬约束。 在医疗/金融/安全场景，P3（扶心智、填评估鸿沟）和 P1（真确认断点）不是体验偏好，是合规要件。Rick 做安全产品的经验直接适用：安全系统里”让用户自己判断”往往等于”没有设计安全”；同理，AI 系统里”挂个免责声明把 L3 负荷甩给用户”在高风险域站不住——欧盟 AI Act 的”人类监督”要求本质就是在立法对抗自动化偏差〔具体条款适用性待核实〕。
拟人化是认知友好的隐性反派。 界面越拟人（人格化名字、第一人称、“我觉得”），用户越把 AI 当”懂的人”，P3（扶正心智模型）和 P1（审视）越被削弱——你不会核验一个”专家朋友”的每句话（A04 §4、S01 §4.3）。拟人化提升 engagement（短期指标好看），却以让用户心智模型更偏离”概率系统”真相为代价。这是一个被 engagement 掩盖的长期信任债务，且它与五原则全部对立，却最不易被察觉。

§7 对手框架回应（接受 + 边界，不是反驳）

对手立场（业界 minimalist / “less-is-more” 阵营 + Gerd Gigerenzer 生态理性）：认知友好设计是过度设计——最好的界面是没有界面，用户的快速启发式在真实生态里往往比复杂防御更高效；给每个交互都加减速点、多候选、置信度标注，是把用户当傻子，是骚扰。

Gigerenzer 长期反对 Kahneman-Tversky 的”偏差范式”，主张启发式（fast-and-frugal heuristics）是适应环境的高效工具，“把每个 System 1 反应都当要纠正的错误是傲慢的”（见其 Gut Feelings）。minimalist 阵营则主张纯自然语言对话才是 AI 交互终极形态，任何额外结构都是干扰。

接受：他们对的部分很重要，且本节点已把它写进了原则本身——§3 错位一、错位四、§4 的低风险列，全是对这个立场的吸收。在低风险、高频、可逆的交互里（改个措辞、选个表情、营销文案初稿），用户快速接受 AI 建议是完全理性的，强加摩擦/多候选/置信度标注反而是骚扰和过度设计。把五原则一刀切地全量施加，正是错位四批判的认知负荷灾难。认知友好设计的第一要义是减法，不是堆防御。
边界与赌注：但这个立场有一个失效边界——它的”生态有效性”前提在 AI 高风险场景被破坏了。Gigerenzer 的启发式之所以”快速节俭仍准确”，是因为环境线索与结果稳定相关；而 LLM 的流畅度与正确性零相关（A02 §1），这正是启发式被系统性误导的”欺骗性环境”。所以本节点赌的是：认知友好设计的价值不在”全场加防御”，而在”精准识别生态有效性被破坏的高风险点，只在那里恢复线索的真实性”（让流畅度真实反映置信度）。minimalist 在低风险对，认知友好在高风险对——分歧点不是”要不要防御”，而是”风险分级”。这恰好是 §4 清单的全部用意。

[!note] failure scenario 显式标注本节点的五原则全景在以下场景会失效或需大幅打折：① 纯娱乐/沉浸式 AI 体验——用户不需要”审视”，P1/P3/P5 目标根本不适用，强加只会破坏体验；② 异步 Agent 场景——用户不实时持有信息，工作记忆瓶颈被时间维度稀释，P2 的”4 块阈值”要重新定义（见 Agent 的长程交互）；③ 对抗性用户——刻意想用 AI 论证预设的用户，任何防锚定/反例呈现都会被无视，五原则的适用前提是”用户有真实判断意愿但被界面诱导”。

confirmation-bias 砍除：本节点早期叙事容易把”加防御 = 认知友好”当正面立场反复强化，这是 bias——补入 minimalist/Gigerenzer 反例后，正确立场是”认知友好 = 按风险的减法+精准防御”，而非”防御越多越友好”。

§8 跨域呼应：Norman × Kahneman 的整合——评估鸿沟即 System 2 的工作面

本节点是整合节点，跨域呼应也做整合：把 A04 心智模型形成·概率系统 vs 确定系统调度的 Norman 评估鸿沟与 A02 双系统理论与 AI 接受调度的 Kahneman 双系统，在设计原则层缝成一个框架——这是 S01/S02 都未做的整合，是 S03 的专属增量。

两个框架此前在本专题里各管一段：Norman 解释”用户面对概率系统时，‘判断输出可不可信’的认知劳动被从系统转嫁到了用户头上”（评估鸿沟拓宽）；Kahneman 解释”用户何时用 System 1 快速接受、何时用 System 2 审视”。把它们叠起来会得到一个对设计极有穿透力的判断：

评估鸿沟，正是 System 2 必须工作的那个认知地面。 评估鸿沟拓宽（Norman），意味着系统把大量本该自己承担的”可信判断”甩给了用户的 System 2（Kahneman）；而 System 2 是稀缺、昂贵、易被负荷挤占的（A03）。于是 AI 设计的核心矛盾被这个整合一句话点破：AI 一边拓宽评估鸿沟（把判断负荷推给用户），一边又用流畅外壳麻痹用户的 System 2（让用户不去判断）——它同时制造了”必须审视”的处境和”不会审视”的诱因。

这个整合改变了什么设计判断？它把 P1（校准 System 2）和 P3（扶正心智模型）从两条独立原则焊成了一条：填评估鸿沟（P3）的本质，就是给 System 2 铺设可工作的证据地面（P1）。 置信度外显、溯源、状态可见——这些 P3 的动作，单看是”扶正心智模型”，整合后看是”在评估鸿沟里埋下 System 2 的着力点”。没有这些证据结构，用户的 System 2 即使被唤醒也无处使力（无法独立验证一段流畅文本对不对），只能退回 System 1 盲信。

这也解释了为什么”加个’请核实’提示”无效（A02/A06 反复证明的反直觉发现）：提示唤醒了 System 2，却没给它评估鸿沟里的着力点——它被唤醒了却无事可做，于是迅速疲劳、退回 System 1。真正的认知友好设计不是”呼吁用户审视”，而是”先把评估鸿沟里的证据地面铺好，让被唤醒的 System 2 有处下脚”。 这把 Norman 的”系统意象作为唯一可及证据”（A04 §6）和 Kahneman 的”System 2 监控”在产品设计层合成了一条可执行原则。链入 0114认识论——这本质是产品在为用户面对概率系统时的”归因无能”做认识论补偿。

（破 echo chamber：分布式认知（Hutchins, Cognition in the Wild, 1995）会进一步质疑——把 System 2 的”工作面”定位在个体头脑里，是否过度个体主义？认知其实分布在人-AI-界面系统中，评估鸿沟的一部分可以由系统结构永久承担而非交给用户 System 2。本节点接受这个张力：五原则是个体认知的简化切片，分布式视角下 P3 的”证据结构”其实是把判断外置到了系统，这是模型的边界，也是 P5 技能退化的另一重根源——外置得越多，用户的 System 2 越无需出力，越退化。）

§9 PM 决策启示（三类落地）

面试桌：被问”你怎么做一个认知友好的 AI 产品”，不要列 checklist（“加来源、显置信度……”）——那暴露你停在扁平堆砌层。用本节点的反共识判断回答：“认知友好不是负荷最小化，是按风险做负荷再分配。五条原则——校准 System 2、控负荷、扶心智、防锚定、保技能——之间会打架：降负荷和保技能长期对立，防锚定和流畅体验直接冲突。我的功夫在它们打架时按风险赌对取舍方向，而不是假装能同时满足。” 30 秒展示”原则冲突排序”的判断力，立刻区别于背 checklist 的候选人。
选型/评审会：用 §4 的按风险分级清单逐条过候选方案，重点查 §2 矩阵的四对冲突。尤其在安全/医疗/金融场景，把”高风险处是否以扶心智+防锚定+保技能优先、宁可牺牲流畅”作为一票否决项——这是合规边界不是体验偏好。
复现/做产品：把五原则当设计 checklist 的纵轴，把风险等级当横轴，交叉处填动作。每加一个功能，强制问三连：它动了哪几条原则？这几条之间有冲突吗（查矩阵）？在本场景的风险等级下，冲突该让哪条原则赢？

§10 与已有节点的关系（升级对照，不复述）

对照本专题 S01 AI 交互的认知负荷分层剖面 / S02 认知偏差 × AI 交互对照矩阵（收口 + 整合）：S01 是”认知账本”（负荷往哪层流），S02 是”偏差查表”（哪块屏幕诱发哪个偏差），二者都是单维剖面。S03 站在它们之上做整合与冲突排序：把 S01 的负荷分层、S02 的偏差缓解，连同 A02–A06 的五支机制，收敛成五条设计原则，并显式画出原则间的冲突矩阵——这是 S01/S02 都没做的”原则打架时怎么排序”。不复述 S01 的六层模型与 S02 的五偏差查表，只调用其结论作原则的认知出处。
对照 A02 双系统理论与 AI 接受–A06 自动化偏见与学习性无助（凝练 + 提层）：A02–A06 各深挖一支机制并各给一组”判断主轴”。S03 把这五支的核心判断凝练成五条可执行设计原则，并把它们之间的张力（A03 降负荷 vs A06 保技能、A05 防锚定 vs A03 控负荷）从”各节点内部的边界声明”提升为”全专题的冲突矩阵”。不复述各 A 节点的机制论证。
对照 c01 - 认知重构：从确定性系统到概率系统（用户侧设计应答）：c01 论证 AI 是概率系统、把可信判断责任转嫁给用户。S03 是这条转嫁在设计原则层的总应答——五原则整体就是”产品如何系统性地接住这次转嫁”，P3 扶心智 + P1 校准 System 2 直接对应 c01 指出的归因无能。不复述 c01 的概率论证。
对照 p302 - 七种 AI 交互设计模式–p305 - 信任架构与可解释性设计（认知底座 vs 设计模式）：见 §5 总对照表。S03 是原则层（为什么有效+何时失效），p3xx 是模式层（怎么做）。S03 补 p3xx 缺的一环——模式之间会因原则冲突而打架，不能当可叠加 checklist 用。
对照 0418 审阅瓶颈专题（提供原则底座）：0418 诊断”审阅是 AI 协作瓶颈、根因是认知负荷”。S03 把这个单点观察升级为原则级处方——审阅瓶颈是 P2（控负荷）失效叠加 P1（未校准 System 2）的特例，对应 S01 耦合点一（L2 挤占 L3）。

§11 关联节点

核心（必读）

S01 AI 交互的认知负荷分层剖面 —— 负荷账本，P2 的认知出处与冲突③源头
S02 认知偏差 × AI 交互对照矩阵 —— 偏差查表，P1/P4 的缓解动作来源
A02 双系统理论与 AI 接受 —— P1 校准 System 2 的认知出处
A03 认知负荷理论与 AI 信息呈现 —— P2 控负荷的认知出处
A04 心智模型形成·概率系统 vs 确定系统 —— P3 扶心智 + Norman 评估鸿沟整合源
A05 锚定效应与 AI 输出 —— P4 防锚定的认知出处
A06 自动化偏见与学习性无助 —— P5 保技能的认知出处
c01 - 认知重构：从确定性系统到概率系统 —— 五原则总应答的范式前提

延伸（可选）

p302 - 七种 AI 交互设计模式 —— 设计模式总库，五原则的招式层
p303 - 克服空白画布综合症 —— P2/P4 在输入侧的模式
p304 - 防御性 UX：对抗延迟与幻觉 —— P1/P2/P3 的模式层
p305 - 信任架构与可解释性设计 —— P1/P3/P4/P5 的模式层
幻觉 —— P3 扶心智要对抗的核心威胁源
Agent —— 异步长程交互对五原则的 failure scenario
范式 —— 概率 vs 确定的范式切换底座
0114认识论 —— Norman 系统意象作为唯一可及证据；认识论补偿
0117社会学 —— 认知友好与增长指标的工具理性冲突
AI PM 知识图谱·总索引 —— 全图谱入口

修订日志

R1（2026-06-07） 首稿。作为 0426 专题收口/整合节点，确立「认知底座 → 设计原则 → 设计模式」三层结构；从 A02–A06 五支机制凝练五条设计原则（P1 校准 System 2 / P2 控负荷 / P3 扶心智 / P4 防锚定 / P5 保技能），各标认知出处+可观测动作+对应 p3xx；§2 原则冲突矩阵（冲突①透明度悖论 / 冲突②Hick 定律 / 冲突③降负荷反噬技能 / 冲突④流畅 vs 审视）；§3 判断主轴四错位（认知友好≠负荷最小化 / 降负荷→盲信 / 降负荷与保技能长期对立 / 防锚定与流畅体验冲突）四件套；§4 按风险分级原则清单；§5 与 p302–p305 显式升级对照表（认知底座 vs 设计模式）；§7 对手框架 minimalist + Gigerenzer 生态理性”接受+边界”；§8 跨域呼应 Norman 评估鸿沟 × Kahneman 双系统整合（评估鸿沟=System 2 工作面），破 echo chamber 引入 Hutchins 分布式认知；与 S01/S02/A02-A06/c01/p302-p305/0418 升级对照。
R1.1（2026-06-07，grounding pass） 载重 arXiv 来源沿用本专题已经 WebFetch 核实的简报：2509.08514（Beck et al. N=2,784）、2310.13544（Dhuliawala overconfident+wrong）、2604.04721（Liu et al. n=1,222 RCT 10 分钟退化）、2603.11821（Rosbach et al. 病理学 7%）、2306.16507（Horowitz & Kahn U 型 9 国 9000 人）。经典文献 Miller (1956)、Cowan (2001)、Sweller、Kahneman、Norman、Tversky & Kahneman (1974)、Bainbridge (1983)、Dietvorst et al. (2015)、Hutchins (1995)、Gigerenzer 以专题简报多源交叉核实为准。仍标〔待核实〕：EU AI Act 具体条款适用性、GitClear 2024（相关性证据，已标方法论受质疑）。S03 不引入简报外的新硬事实。
2026-06-11 P3.4 校链：0418 审阅瓶颈专题已迁入 04AI，§“跨域呼应”对 0418 的〔跨专题待落盘〕降级文本恢复为真 0418 总览 双链。