R

S03 认知友好 AI 设计全景

创建 2026-06-07 更新 2026-06-11 0 条双链 认知科学 专题 AI 整理

S03 认知友好 AI 设计全景

本专题前面所有节点都在拆解”用户的脑子在用 AI 时会以哪些可预测的方式失灵”——双系统会盲信流畅(A02)、工作记忆只有 4 块(A03)、确定系统的心智模型套不上概率系统(A04)、首版输出会锚死后续判断(A05)、好用即技能退化(A06)。但拆完之后必须有人把它们重新拼回去:当 PM 真的坐到一块空白画布前要做一个 AI 产品,这些散落的认知机制如何收敛成一套可执行、可排序、互相会打架的设计原则? 这就是本节点要解决的问题。它是整个 0426 专题的收口节点:不引入任何新的认知机制,只做一件事——把五条认知科学链路整合成 AI 设计原则全景,给出一份可贴墙的原则清单,并与 p302 - 七种 AI 交互设计模式p305 - 信任架构与可解释性设计 这套设计模式做显式的”底座 vs 招式”对照。

本节点的视角框架是**「认知底座 → 设计原则 → 设计模式」三层结构**。c01 与本专题各节点是底座(人脑为什么这样反应),S03 是原则(据此该坚持什么),p3xx 是模式(具体怎么落地)。S01 是”认知账本”(负荷往哪流),S02 是”偏差查表”(哪块屏幕诱发哪个偏差)——S03 站在它们之上,回答一个它们都不回答的问题:这些原则之间互相冲突时,PM 该怎么排序取舍。 这是本节点存在的全部理由,也是它区别于”把五条原则列一遍”的综述的地方。


§0 为什么是”五原则 + 冲突排序”,而不是”设计 checklist”

业界最常见的默认框架,是把”AI 设计指南”做成一份扁平 checklist——加来源、显置信度、做确认断点、控制选项数……每条单看都对,攒成一张表发出去。这个框架有一个致命缺陷:它假设原则之间是相加的、无冲突的、可以同时满足的。 而本专题前面每个节点都在反复证明同一件事——它们不是。

降负荷(A03)和保技能(A06)在长期上直接对立;防锚定(A05)要求多候选并列,但多候选又触发 Hick 定律推高负荷(A03/S02),把用户推回 System 1;流畅体验是产品卖点,却恰恰是 System 1 盲信的引擎(A02)。一份扁平 checklist 会让 PM 在两条互相矛盾的”最佳实践”之间无所适从,最后哪条好实现就做哪条——而好实现的那条(降负荷、做流畅)几乎总是会牺牲那条难实现的(保技能、促审视)。

所以本节点拒绝 checklist 的扁平结构,采用**「五原则 + 显式冲突矩阵 + 按风险的排序规则」**:先给五条原则各自的认知出处与可观测动作,再用一张矩阵标出它们两两之间在哪里打架,最后给出”冲突时按什么排序”的决策规则。原则清单只是入场券,冲突排序才是 PM 的真功夫。

[!note] 框架级辨析

  • checklist 框架问”我做全了吗”——适合确定性系统,因为那里的设计目标(可用性、一致性)大体同向、可叠加。
  • 冲突排序框架问”它们打架时我赌哪边”——AI 交互必须用这个,因为概率系统把”降负荷/保技能""流畅/审视”这些原本同向的目标撕成了对立面。这正是 A01 认知科学与 AI 交互概念谱系 说的”AI 比 GUI 更依赖认知科学是性质问题”在设计层的兑现。

§1 五条认知友好设计原则(认知出处 → 可观测动作 → 对应模式)

下面是从本专题五支认知机制收敛出的五条设计原则。读法:每条标出认知出处(本专题哪个节点)、一句话原则可观测的设计动作、以及它主要兑现在哪个 p3xx 模式上。

原则认知出处一句话原则可观测动作对应 p3xx
P1 校准 System 2A02 双系统按风险增/减摩擦,而非全局加摩擦或全局去摩擦高风险不可逆操作设确认断点;低风险主动降摩擦让 System 1 顺过p304 - 防御性 UX:对抗延迟与幻觉 分段确认 / p305 - 信任架构与可解释性设计 HITL
P2 控认知负荷A03 负荷理论砍外在负荷、分段内在负荷、单屏组块 ≤4±1砍客套冗余;长输出分段/折叠;候选项 ≤4–5(Cowan 而非 Miller)p303 - 克服空白画布综合症 渐进揭示 / p304 流式
P3 扶正心智模型A04 心智模型主动构造能让用户正确归因的证据结构,填评估鸿沟暴露 temperature/seed/logprobs/工具日志;显式标”每次可能不同”;能力边界可见p305 校准信任 / p304 状态可见
P4 防锚定A05 锚定用结构而非文字解锚;管理”问题的第一下框定”多候选并列打散单锚;高风险先让用户出锚再给建议;首版笃定度与置信度校准p305 / p302 - 七种 AI 交互设计模式 多候选
P5 保技能(防退化)A06 依赖陷阱区分替代练习 vs 辅助练习;核心技能路径保留”自己来”HITL 断点兼作强制练习点;监测用户无 AI 时的独立能力(非只看依赖度)p305 HITL 的二次价值

几个关键的接地说明:

  • P2 的容量阈值取 Cowan (2001) 的 4±1,而非 Miller (1956) 的 7±2。 原因 A03/S01 已论证:当用户在审视 AI 输出(一项 System 2 任务)的同时还要持有候选项,纯注意焦点容量(Cowan 的 4)才是安全阈值。把候选设到 7 是用 Miller 的乐观上限给一个已满载的系统加码。

  • P1 的”按风险校准”是双侧的,不是单侧加摩擦。 A02 用 U 型曲线(Horowitz & Kahn 2023, arXiv:2306.16507,9 国 9000 人)证明过度激活 System 2 会把用户推向算法厌恶(Dietvorst et al. 2015, JEP:General 144:114–126)。所以 P1 的目标是”在对的地方触发 System 2、在对的地方让 System 1 顺过”,不是”摩擦越多越安全”。

  • P5 的技能退化有 RCT 证据。 Liu et al. (2026, arXiv:2604.04721, n=1,222) 发现仅约 10 分钟 AI 辅助后,参与者独立完成同类任务表现显著变差、更易放弃。理论根在 Bainbridge (1983) 自动化悖论。但要砍 confirmation bias:Peng et al. (2023) 的 Copilot 实验显示 AI 可提升初学者效率——退化与否取决于”替代练习还是辅助练习”,是设计责任而非技术宿命。


§2 五原则不是相加的:冲突矩阵

把五条原则两两放在一起,会发现它们之间有四对结构性冲突。这张矩阵是本节点相对一切”AI 设计指南”的核心增量——它把”打架的地方”显式画出来,而不是假装它们能同时满足。

P1 校准S2P2 控负荷P3 扶心智P4 防锚定P5 保技能
P1 校准S2协同:减负腾出的资源应定向补给审视协同协同协同:HITL 既校准又练技能
P2 控负荷协同冲突①:扶心智要加证据(来源/置信度/日志)→ 增负荷(透明度悖论)冲突②:防锚定要多候选 → Hick 定律增负荷协同
P3 扶心智协同冲突①协同协同
P4 防锚定协同冲突②协同协同
P5 保技能协同协同协同协同

但矩阵里”协同”的格子藏着最阴险的一对冲突,它不在两条原则之间,而在**“全部原则的成功”与 P5 之间**:

[!warning] 冲突③(隐藏的总冲突):P1–P4 做得越好,P5 越危险 P1–P4 每一条做到位,都是一次成功的认知卸载——把审视、记忆、判断、构想的负荷从用户搬给系统。短期是体验胜利;长期看,用户失去练习机会,技能图式(Sweller 的 schema)无从建构。前四条优化得越好,P5 退化得越快,这是一组直接负相关。它不在任何单次交互内显现,所以最容易被”五原则都满足了”的自满掩盖。这正是 S01 耦合点三(降负荷反噬技能层)在原则层的复现。

冲突④是流畅体验 vs 促审视:把 P2(控负荷、做流畅)做到极致,输出越顺滑、越自信、越像答案,越触发 System 1 的快速接受(processing fluency 偏差),恰恰削弱 P1 想要的高风险处审视。流畅是 P2 的胜利,却是 P1 的敌人。

这四对冲突,就是下一节”90% 会搞错”的来源——因为大多数 PM 根本没意识到原则之间会打架。


§3 判断主轴:认知友好设计上 90% 的人会搞错的四个点

[!warning] 这是本节点的命门 把”认知友好”落到产品上,最致命的不是漏掉某条原则,而是误以为原则之间可以无代价地同时满足。下面四点,每个都是一对原则在打架时的错误取舍,配 症状 → 为什么会错 → 正确做法 → 真实反例/证据 四件套。

错位一:把”认知友好”等同于”负荷最小化”

  • 症状:团队把”降低认知负荷”当成 AI 设计的最高目标,KPI 是”让用户少想、少点、少读”,越省力越好,输出越流畅越自信越好。
  • 为什么会错:这是把”认知友好”窄化成了”负荷最小化”,而二者恰恰相反。一味降负荷会直接反噬 P1(校准 System 2)和 P5(保技能)。 负荷降到极致,意味着审视所需的”减速点”被全部抹平、技能所需的”自己来”机会被全部替代——用户进入无摩擦的盲信与退化。S01 耦合点一已证明:工作记忆是共享池,把 L2 负荷降得太顺,省下的资源不会自动流向 L3 可信判断,反而被 System 1 拿去”更快地接受”。认知友好 = 把负荷分配到对的地方,不是把负荷总量压到最低。
  • 正确做法:放弃”负荷最小化”目标,改为”负荷再分配”目标——砍掉外在负荷(客套、冗余、乱序),但把省下的资源定向补给 L3 可信判断(置信度外显、溯源、低置信片段视觉降级),并在高价值技能路径上主动保留一定摩擦(强制练习点)。“该省的省到底,该留的摩擦一点不能少。”
  • 真实证据:Beck, Eckman, Kern & Kreuter (2025, arXiv:2509.08514, N=2,784) 发现一个反直觉结果——要求用户纠错反而降低参与度、提高了对错误建议的接受率,因为纠错占用工作记忆、激活 System 1 省力策略。这反向证明”负荷越低越好”是错的:负荷管理是定向调度,不是单调下降。

错位二:以为降负荷能顺便提升可信判断(降负荷 → 盲信)

  • 症状:产品把界面做得极简、输出做得极流畅,团队相信”用户负担轻了,自然就有余力好好审视了”。可用性指标(完成率、满意度)全线上扬,错误采纳率却在悄悄上升。
  • 为什么会错:这是错位一的”近亲”,但更隐蔽——它假设”省下的认知资源会自动流向审视”。不会。 processing fluency 偏差(A02 §1、S02 §2.1)的机制是:流畅度被大脑误读为可信度。你把输出做得越顺滑、越自信、越像”答案”,越是在批量生产 System 1 的快速接受。降负荷腾出的资源,被流畅外壳引导去”更快地相信”,而非”更仔细地核验”。冲突④在这里兑现。
  • 正确做法:降负荷与促审视必须协同设计、定向补给——在削减外在负荷的同时,在高风险处主动注入”减速点”,并让首版的笃定程度与真实置信度校准(A05 错位三)。即把省下的资源用结构(而非呼吁)定向引到 L3,而不是放任它流失成盲信。“审视不能靠呼吁,只能靠结构”(A02)。
  • 真实证据:Dhuliawala et al. (2023, EMNLP, arXiv:2310.13544) 证明最有害的模式是 overconfident + wrong(高置信但出错),对信任的破坏远大于 underconfident + correct,且信任恢复极慢。流畅自信的错误,比明显的错误危险得多——降负荷做出的”完美流畅”恰恰是这种危险的温床。

错位三:把降负荷与保技能当成同向目标(其实长期对立)

  • 症状:产品在 L1–L5 每层都做了出色的减负,用户用得飞起、依赖度极高,团队把”用户离不开”当成留存胜利。停掉 AI,用户连基础独立任务都做不利索了。
  • 为什么会错:这是冲突③——降负荷(P2)与保技能(P5)在长期上结构性对立,但它的代价跨越时间累积,不在任何一次交互内显现,所以最容易被误当成”双赢”。更深一层是商业模式的对立:多数 AI 产品的北极星指标奖励”依赖度上升”,而依赖度上升与技能退化是孪生兄弟(A06 错位一)。指标体系会自动把产品推向”让用户保持恰到好处的无能”——这不是恶意,是激励结构的必然。
  • 正确做法:把 P5 当成显式的设计约束,而非 P1–P4 优化的副产品。具体:(a) 区分”替代练习”(计算器替代算术,可接受)与”辅助练习”(若产品价值主张正建立在”用户保有该技能”上,就不能无脑替代);(b) 在核心技能路径保留”自己来”模式;(c) 让 HITL 确认断点兼作强制练习点——它逼用户调用 System 2,同时对抗盲信和退化(P1×P5 协同);(d) 为依赖的”质量”建指标(用户无 AI 时的成功率随时间变化),而非只看依赖的”量”。
  • 真实证据:Liu et al. (2026, arXiv:2604.04721, n=1,222 RCT) 的 10 分钟退化;GitClear (2024) 对 1.53 亿行代码的分析显示 AI 辅助后代码搅动率预计较 AI 前基线翻倍(相关性而非因果,方法论受过质疑,列为 confirmation-bias 砍除项)。注意:Liu 是 RCT(强证据),GitClear 是观察(弱证据),不可等同。

错位四:把防锚定与流畅体验当成可兼得(其实直接冲突)

  • 症状:为防锚定(P4),产品在每次输出时并列 5–6 个等价候选、加满”这只是一种可能”的标注、要求用户先表态再看 AI——结果交互变得又慢又重,用户嫌烦,体验崩塌。或者反过来:为了流畅,只给一个笃定的首版答案,把防锚定彻底牺牲掉。
  • 为什么会错:这是冲突②叠加冲突④——防锚定要求的”多候选并列 + 顺序反转 + 不确定标注”,每一样都在增加外在负荷、打断流畅体验。多候选触发 Hick 定律(选项越多决策越慢、负荷越高),把用户推回 System 1 反而更依赖锚点偷懒(S02 §3 错位三)。“全面防锚定”做过头,本身就是认知负荷灾难。
  • 正确做法防锚定必须按风险分级,不是一刀切。锚定不是绝对的恶——在低风险、需快速起步的场景(空白画布冷启动),首版给个起点正是 p303 - 克服空白画布综合症 要解决的问题,被锚反而是期望的(A05 §4)。只在高风险 + 陌生领域 + 中等时间压力(多数 C 端 AI 主战场)做结构性解锚,且解锚手段要在 Cowan 4±1 预算内统筹:与其堆 6 个候选,不如给 2–3 个 + 一个清晰默认 + 高风险处的顺序反转。“用减法做防锚定”。
  • 真实证据:Rosbach et al. (2026, arXiv:2603.11821) 对 28 名病理学专家测得 7% 自动化偏差率——在高风险场景,7% 已需 HITL 断点;但在低风险(营销文案初稿)场景,被锚是可接受甚至期望的。锚定是一个要按场景风险分级管理的力,不是要无差别消灭的偏差。

[!note] 四个错位的共同结构 它们都源于同一个认知盲区:把”认知友好”理解成了一个单调可优化的标量(越省力/越流畅/越少锚越好),而它其实是一个带约束的多目标权衡。 五条原则共享同一份有限的认知预算(工作记忆)和同一本长期的技能账,任何一条做到极致都会透支另一条。PM 的真功夫不是”满足所有原则”,而是在它们打架时,按风险赌对取舍方向


§4 设计原则清单(可贴墙 · 按风险分级)

把五原则落成一份按风险分级的可观测清单。核心用法:先定这块屏幕的风险等级,再查该等级下每条原则的动作——因为同一条原则在高低风险下的正确动作恰恰相反。

原则低风险场景(高频、可逆、低赌注)高风险场景(不可逆、安全/医疗/金融)
P1 校准S2主动降摩擦,让 System 1 顺过;不弹无谓确认设真正打断的确认断点(非走过场的确认框);HITL 必须真激活 System 2
P2 控负荷砍到极简,默认 top 1–3,其余折叠仍砍外在负荷,但不砍法定告知 / 必要证据;分段呈现复杂内在负荷
P3 扶心智轻量提示”每次可能不同”即可强制暴露溯源/置信度/状态;把评估鸿沟的证据结构做成一等公民
P4 防锚定允许单一首版起点(被锚 = feature,解冷启动)多候选并列 + 顺序反转(先让用户出锚)+ 不确定区间外显
P5 保技能可放心替代练习(用户不靠它长技能)若该技能是用户核心价值承重墙,保留”自己来”路径 + HITL 当练习点

[!tip] 怎么用这张清单 三步:① 先判风险等级(这块屏幕的操作可逆吗?错了谁承担后果?);② 对照该列逐条过五原则;③ 重点检查 §2 矩阵里的四对冲突——尤其在高风险列,P2(控负荷)和 P3(扶心智)会因透明度悖论打架、P2 和 P4(防锚定)会因 Hick 定律打架,此时风险等级决定谁让步:高风险一律以”扶心智 + 防锚定 + 保技能”优先,宁可牺牲一点流畅/简洁。低风险则反过来,以负荷最小化和流畅优先,砍掉过度防御。


§5 与 p302–p305 设计模式的显式升级对照(认知底座 vs 设计模式)

这是本节点对全专题的收口职责:把五条认知原则与 p3xx 这套设计模式做一次总对照,说清”本专题是认知底座,p3xx 是设计模式”这层关系到底兑现在哪里。原则是”为什么这么做有效 + 什么时候失效”,模式是”具体怎么做”。

p3xx 设计模式它解决的设计问题本专题供给的认知原则底座S03 做的升级(补缺/纠偏/失效边界)
p302 - 七种 AI 交互设计模式七种交互模式总览(怎么做)P1–P5 全部——p302 是模式库,本专题是其认知根基补:七模式整体可读作”对五原则冲突的对症设计库”;纠偏:模式之间也会因原则冲突而打架,不能无脑叠加
p303 - 克服空白画布综合症输入侧表达焦虑、冷启动(怎么做)P2 控负荷(渐进揭示=砍外在负荷);P4 防锚定的反面(首版起点是解药)补失效边界:p303 把”给首版起点”当解药,本专题指出同一起点在高风险场景是毒(锚死错误判断)——P4 的风险分级是 p303 缺的那一半
p304 - 防御性 UX:对抗延迟与幻觉对抗延迟与幻觉(怎么做)P1 校准S2(分段确认);P2(流式=摊平负荷峰值);P3 扶心智(置信度外显=填评估鸿沟)纠偏:p304 的设计模式”为什么有效”取决于是否真激活 System 2、是否定向补给 L3;补:流式降负荷与促审视会打架(冲突④)
p305 - 信任架构与可解释性设计信任架构、可解释性(怎么做)P1(HITL);P3(校准信任=扶正心智模型);P4(解锚);P5(HITL 兼作练习点)升格:A04 把 p305 从”UX 模式”升格为”认识论补偿装置”;补:S01 指出 p305 的 HITL 断点还兼对抗 P5 技能退化,这层价值 p305 未显式点出

[!note] 一句话定位关系 p3xx 是招式,本专题(含 S03)是内力运行图。 p304 教你”做流式输出”,S03 告诉你”流式把 L2 高峰负荷摊平,但若不在 L3 定向补给,省下的资源会流失成盲信”(冲突④)。p305 教你”校准信任而非最大化信任”,S03 告诉你”校准的本质是按风险调度 System 2(P1),且 HITL 断点同时在干保技能(P5)的活”。没有 S03 的原则层,p3xx 就是一堆可能互相打架却被当成可叠加 checklist 的招式。


§6 产品 PM 视角补盲(跳出工程视角)

三个最容易被”认知友好设计”漏掉的 PM 盲点:

  1. “认知友好”在指标体系里是反增长的,且短期必输。 P5(保技能)和 P1(高风险加摩擦)几乎总与留存/转化/满意度对立——流畅盲信带来即时好评,技能退化的伤害有延迟。这是 0117社会学 意义上”工具理性侵蚀实质理性”在产品层的落地:指标体系会自动把产品推向”恰到好处的无能”。PM 要做的不是假装冲突不存在,而是在 OKR 里主动设反向护栏(如”依赖质量”指标)——否则默认方向就是牺牲认知友好换增长。

  2. 认知友好的责任边界在合规处变成硬约束。 在医疗/金融/安全场景,P3(扶心智、填评估鸿沟)和 P1(真确认断点)不是体验偏好,是合规要件。Rick 做安全产品的经验直接适用:安全系统里”让用户自己判断”往往等于”没有设计安全”;同理,AI 系统里”挂个免责声明把 L3 负荷甩给用户”在高风险域站不住——欧盟 AI Act 的”人类监督”要求本质就是在立法对抗自动化偏差〔具体条款适用性待核实〕。

  3. 拟人化是认知友好的隐性反派。 界面越拟人(人格化名字、第一人称、“我觉得”),用户越把 AI 当”懂的人”,P3(扶正心智模型)和 P1(审视)越被削弱——你不会核验一个”专家朋友”的每句话(A04 §4、S01 §4.3)。拟人化提升 engagement(短期指标好看),却以让用户心智模型更偏离”概率系统”真相为代价。这是一个被 engagement 掩盖的长期信任债务,且它与五原则全部对立,却最不易被察觉。


§7 对手框架回应(接受 + 边界,不是反驳)

对手立场(业界 minimalist / “less-is-more” 阵营 + Gerd Gigerenzer 生态理性):认知友好设计是过度设计——最好的界面是没有界面,用户的快速启发式在真实生态里往往比复杂防御更高效;给每个交互都加减速点、多候选、置信度标注,是把用户当傻子,是骚扰。

Gigerenzer 长期反对 Kahneman-Tversky 的”偏差范式”,主张启发式(fast-and-frugal heuristics)是适应环境的高效工具,“把每个 System 1 反应都当要纠正的错误是傲慢的”(见其 Gut Feelings)。minimalist 阵营则主张纯自然语言对话才是 AI 交互终极形态,任何额外结构都是干扰。

  • 接受:他们对的部分很重要,且本节点已把它写进了原则本身——§3 错位一、错位四、§4 的低风险列,全是对这个立场的吸收。在低风险、高频、可逆的交互里(改个措辞、选个表情、营销文案初稿),用户快速接受 AI 建议是完全理性的,强加摩擦/多候选/置信度标注反而是骚扰和过度设计。把五原则一刀切地全量施加,正是错位四批判的认知负荷灾难。认知友好设计的第一要义是减法,不是堆防御。
  • 边界与赌注:但这个立场有一个失效边界——它的”生态有效性”前提在 AI 高风险场景被破坏了。Gigerenzer 的启发式之所以”快速节俭仍准确”,是因为环境线索与结果稳定相关;而 LLM 的流畅度与正确性零相关(A02 §1),这正是启发式被系统性误导的”欺骗性环境”。所以本节点赌的是:认知友好设计的价值不在”全场加防御”,而在”精准识别生态有效性被破坏的高风险点,只在那里恢复线索的真实性”(让流畅度真实反映置信度)。minimalist 在低风险对,认知友好在高风险对——分歧点不是”要不要防御”,而是”风险分级”。这恰好是 §4 清单的全部用意。

[!note] failure scenario 显式标注 本节点的五原则全景在以下场景会失效或需大幅打折:① 纯娱乐/沉浸式 AI 体验——用户不需要”审视”,P1/P3/P5 目标根本不适用,强加只会破坏体验;② 异步 Agent 场景——用户不实时持有信息,工作记忆瓶颈被时间维度稀释,P2 的”4 块阈值”要重新定义(见 Agent 的长程交互);③ 对抗性用户——刻意想用 AI 论证预设的用户,任何防锚定/反例呈现都会被无视,五原则的适用前提是”用户有真实判断意愿但被界面诱导”。

confirmation-bias 砍除:本节点早期叙事容易把”加防御 = 认知友好”当正面立场反复强化,这是 bias——补入 minimalist/Gigerenzer 反例后,正确立场是”认知友好 = 按风险的减法+精准防御”,而非”防御越多越友好”。


§8 跨域呼应:Norman × Kahneman 的整合——评估鸿沟即 System 2 的工作面

本节点是整合节点,跨域呼应也做整合:把 A04 心智模型形成·概率系统 vs 确定系统 调度的 Norman 评估鸿沟A02 双系统理论与 AI 接受 调度的 Kahneman 双系统,在设计原则层缝成一个框架——这是 S01/S02 都未做的整合,是 S03 的专属增量。

两个框架此前在本专题里各管一段:Norman 解释”用户面对概率系统时,‘判断输出可不可信’的认知劳动被从系统转嫁到了用户头上”(评估鸿沟拓宽);Kahneman 解释”用户何时用 System 1 快速接受、何时用 System 2 审视”。把它们叠起来会得到一个对设计极有穿透力的判断:

评估鸿沟,正是 System 2 必须工作的那个认知地面。 评估鸿沟拓宽(Norman),意味着系统把大量本该自己承担的”可信判断”甩给了用户的 System 2(Kahneman);而 System 2 是稀缺、昂贵、易被负荷挤占的(A03)。于是 AI 设计的核心矛盾被这个整合一句话点破:AI 一边拓宽评估鸿沟(把判断负荷推给用户),一边又用流畅外壳麻痹用户的 System 2(让用户不去判断)——它同时制造了”必须审视”的处境和”不会审视”的诱因。

这个整合改变了什么设计判断?它把 P1(校准 System 2)和 P3(扶正心智模型)从两条独立原则焊成了一条填评估鸿沟(P3)的本质,就是给 System 2 铺设可工作的证据地面(P1)。 置信度外显、溯源、状态可见——这些 P3 的动作,单看是”扶正心智模型”,整合后看是”在评估鸿沟里埋下 System 2 的着力点”。没有这些证据结构,用户的 System 2 即使被唤醒也无处使力(无法独立验证一段流畅文本对不对),只能退回 System 1 盲信。

这也解释了为什么”加个’请核实’提示”无效(A02/A06 反复证明的反直觉发现):提示唤醒了 System 2,却没给它评估鸿沟里的着力点——它被唤醒了却无事可做,于是迅速疲劳、退回 System 1。真正的认知友好设计不是”呼吁用户审视”,而是”先把评估鸿沟里的证据地面铺好,让被唤醒的 System 2 有处下脚”。 这把 Norman 的”系统意象作为唯一可及证据”(A04 §6)和 Kahneman 的”System 2 监控”在产品设计层合成了一条可执行原则。链入 0114认识论——这本质是产品在为用户面对概率系统时的”归因无能”做认识论补偿。

(破 echo chamber:分布式认知(Hutchins, Cognition in the Wild, 1995)会进一步质疑——把 System 2 的”工作面”定位在个体头脑里,是否过度个体主义?认知其实分布在人-AI-界面系统中,评估鸿沟的一部分可以由系统结构永久承担而非交给用户 System 2。本节点接受这个张力:五原则是个体认知的简化切片,分布式视角下 P3 的”证据结构”其实是把判断外置到了系统,这是模型的边界,也是 P5 技能退化的另一重根源——外置得越多,用户的 System 2 越无需出力,越退化。)


§9 PM 决策启示(三类落地)

  • 面试桌:被问”你怎么做一个认知友好的 AI 产品”,不要列 checklist(“加来源、显置信度……”)——那暴露你停在扁平堆砌层。用本节点的反共识判断回答:“认知友好不是负荷最小化,是按风险做负荷再分配。五条原则——校准 System 2、控负荷、扶心智、防锚定、保技能——之间会打架:降负荷和保技能长期对立,防锚定和流畅体验直接冲突。我的功夫在它们打架时按风险赌对取舍方向,而不是假装能同时满足。” 30 秒展示”原则冲突排序”的判断力,立刻区别于背 checklist 的候选人。
  • 选型/评审会:用 §4 的按风险分级清单逐条过候选方案,重点查 §2 矩阵的四对冲突。尤其在安全/医疗/金融场景,把”高风险处是否以扶心智+防锚定+保技能优先、宁可牺牲流畅”作为一票否决项——这是合规边界不是体验偏好。
  • 复现/做产品:把五原则当设计 checklist 的纵轴,把风险等级当横轴,交叉处填动作。每加一个功能,强制问三连:它动了哪几条原则?这几条之间有冲突吗(查矩阵)?在本场景的风险等级下,冲突该让哪条原则赢?

§10 与已有节点的关系(升级对照,不复述)

  • 对照本专题 S01 AI 交互的认知负荷分层剖面 / S02 认知偏差 × AI 交互对照矩阵(收口 + 整合):S01 是”认知账本”(负荷往哪层流),S02 是”偏差查表”(哪块屏幕诱发哪个偏差),二者都是单维剖面。S03 站在它们之上做整合与冲突排序:把 S01 的负荷分层、S02 的偏差缓解,连同 A02–A06 的五支机制,收敛成五条设计原则,并显式画出原则间的冲突矩阵——这是 S01/S02 都没做的”原则打架时怎么排序”。不复述 S01 的六层模型与 S02 的五偏差查表,只调用其结论作原则的认知出处。
  • 对照 A02 双系统理论与 AI 接受A06 自动化偏见与学习性无助(凝练 + 提层):A02–A06 各深挖一支机制并各给一组”判断主轴”。S03 把这五支的核心判断凝练成五条可执行设计原则,并把它们之间的张力(A03 降负荷 vs A06 保技能、A05 防锚定 vs A03 控负荷)从”各节点内部的边界声明”提升为”全专题的冲突矩阵”。不复述各 A 节点的机制论证。
  • 对照 c01 - 认知重构:从确定性系统到概率系统(用户侧设计应答):c01 论证 AI 是概率系统、把可信判断责任转嫁给用户。S03 是这条转嫁在设计原则层的总应答——五原则整体就是”产品如何系统性地接住这次转嫁”,P3 扶心智 + P1 校准 System 2 直接对应 c01 指出的归因无能。不复述 c01 的概率论证。
  • 对照 p302 - 七种 AI 交互设计模式p305 - 信任架构与可解释性设计(认知底座 vs 设计模式):见 §5 总对照表。S03 是原则层(为什么有效+何时失效),p3xx 是模式层(怎么做)。S03 补 p3xx 缺的一环——模式之间会因原则冲突而打架,不能当可叠加 checklist 用。
  • 对照 0418 审阅瓶颈专题(提供原则底座):0418 诊断”审阅是 AI 协作瓶颈、根因是认知负荷”。S03 把这个单点观察升级为原则级处方——审阅瓶颈是 P2(控负荷)失效叠加 P1(未校准 System 2)的特例,对应 S01 耦合点一(L2 挤占 L3)。

§11 关联节点

核心(必读)

延伸(可选)


修订日志

  • R1(2026-06-07) 首稿。作为 0426 专题收口/整合节点,确立「认知底座 → 设计原则 → 设计模式」三层结构;从 A02–A06 五支机制凝练五条设计原则(P1 校准 System 2 / P2 控负荷 / P3 扶心智 / P4 防锚定 / P5 保技能),各标认知出处+可观测动作+对应 p3xx;§2 原则冲突矩阵(冲突①透明度悖论 / 冲突②Hick 定律 / 冲突③降负荷反噬技能 / 冲突④流畅 vs 审视);§3 判断主轴四错位(认知友好≠负荷最小化 / 降负荷→盲信 / 降负荷与保技能长期对立 / 防锚定与流畅体验冲突)四件套;§4 按风险分级原则清单;§5 与 p302–p305 显式升级对照表(认知底座 vs 设计模式);§7 对手框架 minimalist + Gigerenzer 生态理性”接受+边界”;§8 跨域呼应 Norman 评估鸿沟 × Kahneman 双系统整合(评估鸿沟=System 2 工作面),破 echo chamber 引入 Hutchins 分布式认知;与 S01/S02/A02-A06/c01/p302-p305/0418 升级对照。
  • R1.1(2026-06-07,grounding pass) 载重 arXiv 来源沿用本专题已经 WebFetch 核实的简报:2509.08514(Beck et al. N=2,784)、2310.13544(Dhuliawala overconfident+wrong)、2604.04721(Liu et al. n=1,222 RCT 10 分钟退化)、2603.11821(Rosbach et al. 病理学 7%)、2306.16507(Horowitz & Kahn U 型 9 国 9000 人)。经典文献 Miller (1956)、Cowan (2001)、Sweller、Kahneman、Norman、Tversky & Kahneman (1974)、Bainbridge (1983)、Dietvorst et al. (2015)、Hutchins (1995)、Gigerenzer 以专题简报多源交叉核实为准。仍标〔待核实〕:EU AI Act 具体条款适用性、GitClear 2024(相关性证据,已标方法论受质疑)。S03 不引入简报外的新硬事实。
  • 2026-06-11 P3.4 校链:0418 审阅瓶颈专题已迁入 04AI,§“跨域呼应”对 0418 的〔跨专题待落盘〕降级文本恢复为真 0418 总览 双链。