认知科学系统化专题 · 总览（MOC）

本专题 = 04AI 产品设计模块（p302–p309）之下的认知理论底座。p3xx 回答”AI 产品该怎么设计”，本专题回答”用户的大脑为什么会这样反应”。读完，你能在面试桌、选型会、复现台上 30 秒说清：为什么照搬 GUI 假设到概率系统必崩，以及该从认知科学的哪一层动手。

§0 序：那堵墙

设想一个 PM 会遇到的选型会场景：一个团队兴奋地展示他们的 AI 助手——一个能生成无限方案、无限解释、无限备选的对话框。Demo 很惊艳。可一旦有人追问”用户一次能看懂几个方案、能审完几段解释”，全场就该沉默了。他们把”AI 能生成多少”当成了产品力，却忘了墙的另一边：用户的工作记忆被生物结构钉死在约 4 个组块上，几十年没变；用户的审视带宽（System 2）是稀缺且昂贵的。AI 的供给侧无限，用户的需求侧恒定——这条裂缝，就是那堵墙。

撞墙的根因只有一个：他们把图形界面（GUI）三十年沉淀的设计假设——同样操作给同样结果、出错就是 bug、状态可见可验证——原封不动搬到了一个概率系统上。 而概率系统恰恰违反了这些隐性假设里最核心的几条。假设被违反，建立在假设之上的”最佳实践”会静默失效：不报错，但用户的认知在你看不见的地方崩塌——盲信流畅的幻觉、被首版输出锚死、把概率工具当确定工具用、十分钟就开始技能退化。

本专题的反共识立场：AI 交互比传统 GUI 更依赖认知科学，不是程度问题，是性质问题。 解药不是更长的 UX checklist，而是一套能解释”为什么这条最佳实践在 AI 上不成立”的认知理论底座。这就是 0426 专题要建的东西。

§1 专题定位：为什么认知科学配独立建一个专题号

用 SHARED_CONTEXT §2 的四条选题判据逐条论证（满足前三条全部 + 第四条为真）：

判据	是否满足	论证
① 中心性（影响 ≥3 个 PM 决策链节点）	✅	认知底座直接决定 p303（输入构想）、p304（防御性 UX）、p305（信任架构）三个设计模块的”为什么有效”；并横切选型、复现、合规三类决策。
② 误解深度（业界定义互相矛盾、系统性滑变）	✅	“心智模型""System 1/2”等术语在 AI 话语里发生维特根斯坦式语义滑变——研究者说 AI 的”mental model”时其实指行为预测而非认知状态（Yin et al. 2025, arXiv:2510.02660）；连 258 篇 CHI 论文都把 LLM 推理”去语境化”误当工具（Mothilal et al. 2025, arXiv:2510.22978）。
③ 速变性（24 个月内 ≥1 次格式塔切换）	✅	2022 生成式大模型把”同一输入→不同输出”从异常态变成正常态——交互认知史上的一次 Kuhn 式不可通约范式切换（详见 G01）。
④ 学了就能用	✅	读完即得三条可立即落地的判断力：拆负荷分层（不是看总量）、按风险校准 System 2 触发（不是加提示）、把心智模型校准建模成可测的误用率实验（不是写文档）。

升高的抽象层：c/m/p 单维节点是”设计模式”（怎么做）。本专题升高一层到认知理论底座（人脑为什么会以特定方式失灵）——它不复述任何设计模式，只供给每个设计决策可溯源的认知理由。最关键的跨模块桥接是补上 c01 → p304、c01 → p305 的直接认知链路：从”系统为什么是概率的”（c01）到”用户的脑子为什么会被概率系统搞乱”（本专题）到”设计该怎么应对”（p3xx）。

§2 模块全景

graph TD
    subgraph 概念辨析["01 概念辨析（横向·是什么）"]
        A01[A01 概念谱系] --> A02[A02 双系统·接受]
        A01 --> A03[A03 认知负荷·呈现]
        A01 --> A04[A04 心智模型·概率vs确定]
        A02 --> A05[A05 锚定效应]
        A02 --> A06[A06 自动化偏见·习得性无助]
    end
    subgraph 代际演化["02 代际演化（纵向·从哪来·横切）"]
        G01[G01 代际谱系总图] --> G02[G02 五代逐代详解]
    end
    subgraph 架构剖面["03 架构剖面（解剖·由什么组成）"]
        S01[S01 认知负荷六层剖面★旗舰] 
        S02[S02 偏差×交互对照矩阵]
        S03[S03 认知友好设计全景·收口整合]
        S01 --> S03
        S02 --> S03
    end
    subgraph 实例剖解["04 实例剖解（病理·现实怎么走样）"]
        E01[E01 对话框负荷剖解] 
        E02[E02 Generative UI·Artifact]
        E03[E03 锚定与心智模型失配案例]
    end
    subgraph 复现指南["05 复现指南（操作·自己怎么动手）"]
        R01[R01 测认知负荷] --> R02[R02 设计降负荷呈现]
        R01 --> R03[R03 心智模型校准实验]
    end

    概念辨析 依赖链> 架构剖面
    架构剖面 依赖链> 实例剖解
    实例剖解 依赖链> 复现指南
    代际演化 -.横切时间维.-> 概念辨析
    代际演化 -.横切时间维.-> 架构剖面

矩阵含义：六模块按 SHARED_CONTEXT §3 的标准骨架排布——概念（横向）→ 架构（解剖）→ 实例（病理）→ 复现（操作） 是主依赖链；代际演化（纵向）横切整条链，给每个认知机制一个”在第几代成为核心问题”的时间坐标；阅读指南（本总览 + README）反向编织成多条可读路径。01 概念辨析是全专题的认知词典，A01 是其谱系入口，A02–A06 各深挖一支（双系统/负荷/心智模型/锚定/偏见），其余模块全部回链到这六支。

§3 六模块逐一介绍

01 概念辨析（A01–A06）｜收录什么：认知科学里真正与 AI 交互相关的四支理论的辨析与深挖。解决：“是什么”——把双系统、认知负荷、心智模型、认知偏差从笼统名词拆成可操作判断。何时读：求职速通、想建立认知词典时第一站。

A01：四分支谱系总图 + 反共识判断”AI 比 GUI 更依赖认知科学是性质问题”。
A02：流畅诱发 System 1 盲信、负荷挤占审视、按风险校准 System 2 触发；双侧失衡（盲信 vs 算法厌恶）。
A03：Miller/Cowan 容量定律（4±1 而非 7±2）+ Sweller 三元负荷（砍外在、分段内在、慎增生）。
A04：Norman 三角 + 执行/评估鸿沟反向拉扯 + 四种确定系统心智模型迁移误用。
A05：首版输出=概率系统的结构性风险；重生成≠解锚、免责≠解锚。
A06：依赖陷阱三阶段（自动化偏见→技能退化→习得性无助）；好用即有害的留存-伦理两难。

02 代际演化（G01–G02）｜收录什么：HCI 五代交互范式的认知谱系。解决：“从哪来”——每代改变的不是”友好度”，而是对用户大脑下的认知假设；瓶颈只会搬家不会消失。何时读：想看清”对话式 AI/生成式不是终点而是认知陷阱密集爆发期”时。

G01：五代（CLI→GUI→触屏→对话式→生成式）认知假设/消除瓶颈/制造新瓶颈/反例四列表，以 Kuhn 不可通约性反线性进步史。
G02：逐代五件套（代表交互→认知依据→瓶颈→被下代超越的接口→AI 新挑战）。

03 架构剖面（S01–S03）｜收录什么：把认知负荷与偏差拆成可替换的分层堆栈与对照矩阵。解决：“由什么组成”——p3xx 设计模式底下的认知账本。何时读：做架构评审、想要一张能贴墙的查表时。

S01★旗舰最厚：六层剖面（L1 输入构想→L2 输出理解→L3 可信判断→L4 选项决策→L5 记忆维持→L6 技能保持）+ 三个致命层间耦合点。
S02：流畅性/锚定/自动化/确认/可得性 × 交互场景 × 缓解设计的三轴查表矩阵。
S03★收口整合：把五支认知机制凝练成五条设计原则（P1 校准 System 2 / P2 控负荷 / P3 扶心智 / P4 防锚定 / P5 保技能），核心增量是显式冲突矩阵 + 按风险排序规则（降负荷 vs 保技能长期对立、防锚定 vs 流畅直接冲突），并与 p302–p305 做”认知底座 vs 设计模式”总对照。原则清单只是入场券，冲突排序才是真功夫。

04 实例剖解（E01–E03）｜收录什么：真实产品/系统里用户走偏的现场。解决：“现实怎么走样”——病理学切片。何时读：想看理论如何落到 ChatGPT 对话框、Claude Artifact、病理学 7% 改对为错的真实案例时。

E01：剖 ChatGPT 式对话框三段账单——构想负荷（表达焦虑）+ 理解负荷 + 判断负荷（信任焦虑）。
E02：剖结构件如何用外显降外在负荷，及”用精致结构掩盖概率性”的暗面。
E03：四个可追溯案例（病理学锚定 7%、LLM 自身被锚、过度置信信任崩塌、10 分钟降表现）。

05 复现指南（R01–R03）｜收录什么：PM 当天就能动手跑的测量与实验。解决：“自己怎么动手”——从理论到仪表盘。何时读：想验证”我的设计真降负荷了吗/真扶正心智模型了吗”时。

R01：任务时间 + 错误率（分两类）+ NASA-TLX 三件套 + 三份模板；核心反共识”主观负荷≠客观表现，打架处有金子”。
R02：四步法（审计→分层→结构默认值→A/B）+ 呈现模板 + 带”植入错误检出率”护栏的实验设计。
R03：诊断鸿沟→注入校准干预（体验性反例为核心）→测误用率前后差的实验闭环 + 可抄的登记表/onboarding 脚本/埋点清单。

06 阅读指南：本 _总览（MOC）+ README（三路径 + ≥10 题自测 + 反方对话训练，另出）。

§4 与现有节点的关系（升级对照表）

本专题不复述任何旧节点的事实基础，只做”补缺/纠偏/对话/深化/奠基”五类升级。最关键的桥接是补上 c01 → p304/p305 的直接认知链路（此前都是隐性的）。

旧节点	本专题哪些节点	升级类型	具体做了什么
c01	A01/A04/A05/A06/G01/G02/S01/S02/E01/E02/E03/R01/R02/R03（全专题）	深化 + 用户侧对偶	c01 论证”系统侧为什么是概率的”；本专题论证”用户认知侧为什么被概率系统搞乱”——同一范式跃迁的一体两面。
p302	A01/S01/S02/E02/R01	奠基	p302 是设计模式总览，本专题是其认知理论根基；E02 为其中 Generative UI 模式补可证伪的外在负荷净值底座。
p303	A03/S01(L1)/E01/R02	奠基 + 失效边界	p303 的渐进式揭示/场景化入口，其有效性溯源到”砍外在负荷”；E01 补出”脚手架砍不动内在负荷”这条失效边界。补 p303→c01 的回链根源（表达焦虑的底层=概率系统）。
p304	A02/A04/A05/A06/S01(L2-L3)/S02/E01/E03/R01	提供底座 + 补 c01 直接回链	p304 的置信度外显/优雅降级/分段确认，本专题解释它们”为什么有效”=是否真激活了 System 2、定向补给 L3。补全 p304 缺失的 c01 §1.1 直接回链。
p305	A02/A04/A05/A06/S01(L3,L6)/S02/E03/R01/R03	升格定位 + 补 c01 直接回链	A04 把 p305 从”UX 模式”升格为”认识论补偿装置”；S01 指出其 HITL 断点兼作对抗 L6 技能退化的强制练习点。补全 p305 §3.5.1 应在 c13 之后加 c01 §1.1 直接回链。
0418 审阅瓶颈系列（专题）	A02/A03/A06/G01/S01/S02/E01/E02/R01/R02/R03	深化 + 操作化 + 提供底座	0418 诊断”审阅是 AI 协作瓶颈、根因是认知负荷”；本专题给它补理论底座（Sweller 三元/Cowan 4±1）、给操作化仪器（R01-R03），并把它定位为 S01 耦合点一（L2 挤占 L3）的特例。
幻觉	A01/A04/A05/A06/S01/S02/E01/E02/E03/R01/R03	补缺（风险链另一半）	幻觉=“AI 会出错”；本专题=“人为什么会信错的 AI”，两者合起来才是完整风险链。

§5 三条阅读起点（详表见 README）

求职速通路径（面试桌 30 秒火力）：A01 → G01 → S01 → S02。拿到”认知底座 vs 设计模式两层思维”+“分层论 vs 总量论”+“按风险校准 System 2”三把面试利器。
决策链路径（选型会/设计评审）：A04 → S01 → E01 / E02 → R02。从”评估鸿沟为什么爆炸”到”六层负荷账本”到”具体怎么重设计”。
紧迫度路径（高风险品类/安全合规，对 Rick 的安全+国际化业务最相关）：A05 → A06 → E03 → R01 / R03。从”7% 改对为错的责任红线”到”怎么测、怎么校准”。

§6 跨域思想资源调度（不留空 invocation）

每个调度都在对应节点的”跨域呼应”段落具体展开了它如何改变一个技术判断，绝非装饰性点名。

跨域资源	调度位置	在该节点的具体作用（改变了什么判断）
Kahneman 双系统（System 1/2）	A01/A02/G02/S01/S02/E01	把”接受 vs 审视”从意愿/知识问题还原为注意力资源调度问题——审视不能靠呼吁，只能靠结构。
Sweller 认知负荷 + Miller/Cowan 容量	A03/S01/E01/E02/R01/R02	把”信息太多”从 IA/极简主义问题升级为”砍外在/分段内在/慎增生”的分性质处理；设计阈值取 Cowan 4±1 而非 Miller 7±2。
Norman 心智模型 + 执行/评估鸿沟	A01/A04/G01/G02/E01/E03/R03	揭示 AI 缩窄执行鸿沟却拓宽评估鸿沟——防御性 UX 不是锦上添花，是填评估鸿沟的结构必需。
Tversky 锚定效应	A05/G02/S01/S02/E03	首版输出不只锚定数值，更锚定”问题的语法”——真正的设计权力在”用什么框架接住问题的第一下”。
自动化偏见（Parasuraman & Manzey；Skitka）	A06/S02/E03/R01	专家也不免疫、单靠练习无法克服——缓解责任在界面端不在用户端；7% 是责任红线不是体验问题。
Kuhn 范式不可通约性	G01	把 HCI 史从”越来越友好”的辉格史改写为范式更替——范式选择是任务匹配，不是版本竞赛。
维特根斯坦（家族相似/河床/框定/图像囚禁/看见为/意义即用法）	A01/A02/A05/E02/E03/R02/R03	守住”心智模型”术语边界、解释审视为何需要”硌脚的石头”、诊断心智模型失配为”图像囚禁”。
Polanyi 默会知识	A03/S01/S02/E01	”会问”与”判断力”是默会的、教不会——降负荷设计的认识论代价是剥夺默会知识的练习机会。
福柯规训/生命政治	A06	自动化偏见不是用户缺陷，是产品主动”生产”的用户主体性——PM 不是中立工具提供者。
Rick 未读对手框架（破 echo chamber）：Melnikoff & Bargh《The Mythical Number Two》、Gigerenzer 生态理性、Lucy Suchman 情境行动、Hutchins 分布式认知、Borgmann 装置范式、Selinger 道德外包	A01/A02/A03/A04/A05/A06/G01/G02/S01/S02/E01/E02/R01	逼问本专题盲点：双系统是否可证伪、启发式是否一律是偏差、认知是否只在脑内、deskilling 损失的是否不止技能。

§7 验收档案

评议流程（照搬 0411 工程化流水线）：ground → draft（六模块并行起草）→ critique（六维 + 事实接地逐节点找茬）→ revise（按 issue 单修订 + 修订日志）→ 独立 grounding 校验 pass（逐条抽取事实声明判定已接地/需接地/疑似编造）→ synthesize（本总览 + README + 跨节点编织 + 三清单）。各节点修订日志均已记录 R1 改了什么，且载重 arXiv 引用经 WebFetch 直接核实（2603.11821 Rosbach 7%、2604.04721 Liu 10 分钟 RCT、2310.13544 Dhuliawala 过度自信+出错、2509.08514 Beck N=2784、2306.16507 Horowitz&Kahn U 型、2412.06593 Lou&Sun、2602.00947 Reddy Keyhole、2512.09085 Pauketat、2508.06352 Meske）。

SABCD 六维自评

维度	出版线	本专题自评	依据
S 结构	≥8	8.3	六模块互补、依赖链清晰、三条阅读路径可导航；S01 旗舰最厚、S03 收口整合补齐架构剖面三件套（S01 账本 + S02 查表 + S03 原则整合）；依赖图无占位。
A 判断密度	≥8	8.2	每节有反共识带数字判断（7% 改对为错、4±1 而非 7±2、10 分钟即退化、50–82% 接受率），非综述转写。
B 边界含量	≥7.5	8.0	每节显式承担赌注（“双系统是隐喻不是脑区""LLM 直接实证仍少，依赖自动化偏见间接迁移”）。
C 认识论自觉	≥8	8.0	区分事实/推测/赌注，〔待核实〕标注规范（medRxiv 50–82% 标条件性数据、ScienceDirect nudge 标摘要级）。
D 可演进性	≥8.5	8.4	双链密度高、修订日志齐全；起草期链名不一致死链已于 0426 QC pass 全部就地修净（见 §9 台账），S03 已落盘并接入双链。2026-06-11 P3.4 校链：0418 审阅瓶颈专题已迁入 04AI（`04T 专题库/F1 评测与度量/0418 审阅瓶颈系统化专题`），原 11 处〔跨专题待落盘〕降级文本已全部恢复为真 `0418 总览` 双链。
E 对手拷问能力	≥7	8.1	对 Melnikoff&Bargh、Gigerenzer、Suchman、Hutchins 等真实对手框架给”接受+边界”而非反驳。

诚实综合分 ≈ 8.0 / 10（已过出版线 7.8；对手立场 E=8.1≥8、failure scenario 充足、bias 砍除充足均达标；S03 收口整合落盘 + 起草期死链全清后，S 升至 8.3、D 升至 8.2，综合分由 7.85 上调至 8.0；进一步上探取决于 0418 迁入后补齐 11 处跨专题双链）。

对手立场接入清单（≥8 处，全部点名真实可追溯立场）

Melnikoff & Bargh (2018, TiCS)：双系统结构上不可证伪 → A01/A02/G01/G02/S01/E03/R03 接受其批评、降级为设计隐喻。
Gerd Gigerenzer 生态理性：把启发式一律当偏差是 Kahneman 范式傲慢 → A05/S02/E03 接受+标”AI 破坏了生态有效性前提”边界。
Lucy Suchman《Plans and Situated Actions》(1987)：交互是情境即兴非计划执行 → E01/G01/S01 接受其拷问稳定心智模型的预设。
Edwin Hutchins《Cognition in the Wild》(1995) 分布式认知 → E02 接受”认知不只在脑内”、CLT 管单点上限/分布式管系统增益分工。
Caetano et al. (2024, arXiv:2412.16892) 8-gulf 扩展派 → A04 接受复杂场景需扩展、坚持 2-gulf 对日常 PM 杠杆率更高。
Dietvorst et al. (2015, JEP:General) 算法厌恶 → S02 接受偏差双向、坚持目标是校准非单向降信任。
Albert Borgmann 装置范式 + Evan Selinger 道德外包 → A06 逼问 deskilling 损失的不止技能。
业界乐观派”AI=下一个计算器” → A06/S01 接受认知卸载常态、坚持”计算器无留存 KPI、AI 商业模式主动奖励依赖”的不对称。
minimalist”自然语言是终极界面/AI 不需要 UI” → E01/E02/G02 接受执行端红利、坚持评估端判断负荷未被计入。

failure scenario 清单（≥5 处）

A02/A05/S02：缓解矩阵在低风险高频、专家闭环、对抗性用户三类场景失效。
A03：纯娱乐沉浸式、异步 Agent 场景下”4 块阈值/砍外在”建议要打折。
E01/A04：专家读熟悉领域长输出时理解负荷反低，负荷管理须分人群。
G01/G02/A05：LUI”缩小执行鸿沟”在用户不知该问什么的冷启动场景反而升高。
R01：高风险低容错域 RTLX 不够、需上生理测量；被试知道被测会产生需求特征。

confirmation-bias 砍除清单（≥5 处）

A06/G02/S01/E03/R01：早期反复引 GitClear 翻倍/Liu 10 分钟当”AI 必然让人变弱”的正面证据=bias，补入 Peng et al. (2023) Copilot 提升初学者效率反例，并区分 RCT（强）vs 相关性观察（弱）。
A03：增生负荷争议（Kalyuga 2011 呼吁取消、Sweller 2019 弱化），核心论证刻意只依赖无争议的”外在负荷”。
R01/R02/R03：早期把”新版 TLX 更低/更快确认”当胜利=bias，补”接受 AI 错误率更高是更糟”的护栏纪律。
A02/E03：习得性无助类比 Seligman 厌恶刺激，AI 是正强化驱动，机制可能不同——显式标为类比赌注。
S01/E02：CLT 从教育迁移到即时消费场景，增生负荷近乎失效——只保外在负荷这条稳健分量。

§8 关联节点（双链密度 ≥20，全部真实名）

本专题节点（17 节点全部落盘）

升级对照的既有节点（c/m/p/概念卡，经核实存在）

c01 - 认知重构：从确定性系统到概率系统（认知理论底座的系统侧对偶）
p302 - 七种 AI 交互设计模式
p303 - 克服空白画布综合症
p304 - 防御性 UX：对抗延迟与幻觉
p305 - 信任架构与可解释性设计
p308 - 多模态与脱离屏幕的交互（Baddeley 双通道应用）
m207 - Agent 产品化：场景推演与失败模式（HITL 断点设计）
m209 - 推理成本控制手册（压缩呈现的 token 成本转移）
幻觉、c13 - 幻觉的不可消除性、c14 - 模型评估体系与 Goodhart 陷阱、Agent

跨专题 / 导航

审阅瓶颈专题（认知负荷的另一半硬币）
0114认识论、0117社会学（跨域思想资源入口）
AI PM 知识图谱·总索引、索引、仪表盘

_认知科学系统化专题·总览