_认知科学系统化专题·总览
认知科学系统化专题 · 总览(MOC)
本专题 = 04AI 产品设计模块(p302–p309)之下的认知理论底座。p3xx 回答”AI 产品该怎么设计”,本专题回答”用户的大脑为什么会这样反应”。读完,你能在面试桌、选型会、复现台上 30 秒说清:为什么照搬 GUI 假设到概率系统必崩,以及该从认知科学的哪一层动手。
§0 序:那堵墙
设想一个 PM 会遇到的选型会场景:一个团队兴奋地展示他们的 AI 助手——一个能生成无限方案、无限解释、无限备选的对话框。Demo 很惊艳。可一旦有人追问”用户一次能看懂几个方案、能审完几段解释”,全场就该沉默了。他们把”AI 能生成多少”当成了产品力,却忘了墙的另一边:用户的工作记忆被生物结构钉死在约 4 个组块上,几十年没变;用户的审视带宽(System 2)是稀缺且昂贵的。AI 的供给侧无限,用户的需求侧恒定——这条裂缝,就是那堵墙。
撞墙的根因只有一个:他们把图形界面(GUI)三十年沉淀的设计假设——同样操作给同样结果、出错就是 bug、状态可见可验证——原封不动搬到了一个概率系统上。 而概率系统恰恰违反了这些隐性假设里最核心的几条。假设被违反,建立在假设之上的”最佳实践”会静默失效:不报错,但用户的认知在你看不见的地方崩塌——盲信流畅的幻觉、被首版输出锚死、把概率工具当确定工具用、十分钟就开始技能退化。
本专题的反共识立场:AI 交互比传统 GUI 更依赖认知科学,不是程度问题,是性质问题。 解药不是更长的 UX checklist,而是一套能解释”为什么这条最佳实践在 AI 上不成立”的认知理论底座。这就是 0426 专题要建的东西。
§1 专题定位:为什么认知科学配独立建一个专题号
用 SHARED_CONTEXT §2 的四条选题判据逐条论证(满足前三条全部 + 第四条为真):
| 判据 | 是否满足 | 论证 |
|---|---|---|
| ① 中心性(影响 ≥3 个 PM 决策链节点) | ✅ | 认知底座直接决定 p303(输入构想)、p304(防御性 UX)、p305(信任架构)三个设计模块的”为什么有效”;并横切选型、复现、合规三类决策。 |
| ② 误解深度(业界定义互相矛盾、系统性滑变) | ✅ | “心智模型""System 1/2”等术语在 AI 话语里发生维特根斯坦式语义滑变——研究者说 AI 的”mental model”时其实指行为预测而非认知状态(Yin et al. 2025, arXiv:2510.02660);连 258 篇 CHI 论文都把 LLM 推理”去语境化”误当工具(Mothilal et al. 2025, arXiv:2510.22978)。 |
| ③ 速变性(24 个月内 ≥1 次格式塔切换) | ✅ | 2022 生成式大模型把”同一输入→不同输出”从异常态变成正常态——交互认知史上的一次 Kuhn 式不可通约范式切换(详见 G01)。 |
| ④ 学了就能用 | ✅ | 读完即得三条可立即落地的判断力:拆负荷分层(不是看总量)、按风险校准 System 2 触发(不是加提示)、把心智模型校准建模成可测的误用率实验(不是写文档)。 |
升高的抽象层:c/m/p 单维节点是”设计模式”(怎么做)。本专题升高一层到认知理论底座(人脑为什么会以特定方式失灵)——它不复述任何设计模式,只供给每个设计决策可溯源的认知理由。最关键的跨模块桥接是补上 c01 → p304、c01 → p305 的直接认知链路:从”系统为什么是概率的”(c01)到”用户的脑子为什么会被概率系统搞乱”(本专题)到”设计该怎么应对”(p3xx)。
§2 模块全景
graph TD
subgraph 概念辨析["01 概念辨析(横向·是什么)"]
A01[A01 概念谱系] --> A02[A02 双系统·接受]
A01 --> A03[A03 认知负荷·呈现]
A01 --> A04[A04 心智模型·概率vs确定]
A02 --> A05[A05 锚定效应]
A02 --> A06[A06 自动化偏见·习得性无助]
end
subgraph 代际演化["02 代际演化(纵向·从哪来·横切)"]
G01[G01 代际谱系总图] --> G02[G02 五代逐代详解]
end
subgraph 架构剖面["03 架构剖面(解剖·由什么组成)"]
S01[S01 认知负荷六层剖面★旗舰]
S02[S02 偏差×交互对照矩阵]
S03[S03 认知友好设计全景·收口整合]
S01 --> S03
S02 --> S03
end
subgraph 实例剖解["04 实例剖解(病理·现实怎么走样)"]
E01[E01 对话框负荷剖解]
E02[E02 Generative UI·Artifact]
E03[E03 锚定与心智模型失配案例]
end
subgraph 复现指南["05 复现指南(操作·自己怎么动手)"]
R01[R01 测认知负荷] --> R02[R02 设计降负荷呈现]
R01 --> R03[R03 心智模型校准实验]
end
概念辨析 依赖链> 架构剖面
架构剖面 依赖链> 实例剖解
实例剖解 依赖链> 复现指南
代际演化 -.横切时间维.-> 概念辨析
代际演化 -.横切时间维.-> 架构剖面
矩阵含义:六模块按 SHARED_CONTEXT §3 的标准骨架排布——概念(横向)→ 架构(解剖)→ 实例(病理)→ 复现(操作) 是主依赖链;代际演化(纵向)横切整条链,给每个认知机制一个”在第几代成为核心问题”的时间坐标;阅读指南(本总览 + README)反向编织成多条可读路径。01 概念辨析是全专题的认知词典,A01 是其谱系入口,A02–A06 各深挖一支(双系统/负荷/心智模型/锚定/偏见),其余模块全部回链到这六支。
§3 六模块逐一介绍
01 概念辨析(A01–A06)|收录什么:认知科学里真正与 AI 交互相关的四支理论的辨析与深挖。解决:“是什么”——把双系统、认知负荷、心智模型、认知偏差从笼统名词拆成可操作判断。何时读:求职速通、想建立认知词典时第一站。
- A01:四分支谱系总图 + 反共识判断”AI 比 GUI 更依赖认知科学是性质问题”。
- A02:流畅诱发 System 1 盲信、负荷挤占审视、按风险校准 System 2 触发;双侧失衡(盲信 vs 算法厌恶)。
- A03:Miller/Cowan 容量定律(4±1 而非 7±2)+ Sweller 三元负荷(砍外在、分段内在、慎增生)。
- A04:Norman 三角 + 执行/评估鸿沟反向拉扯 + 四种确定系统心智模型迁移误用。
- A05:首版输出=概率系统的结构性风险;重生成≠解锚、免责≠解锚。
- A06:依赖陷阱三阶段(自动化偏见→技能退化→习得性无助);好用即有害的留存-伦理两难。
02 代际演化(G01–G02)|收录什么:HCI 五代交互范式的认知谱系。解决:“从哪来”——每代改变的不是”友好度”,而是对用户大脑下的认知假设;瓶颈只会搬家不会消失。何时读:想看清”对话式 AI/生成式不是终点而是认知陷阱密集爆发期”时。
- G01:五代(CLI→GUI→触屏→对话式→生成式)认知假设/消除瓶颈/制造新瓶颈/反例四列表,以 Kuhn 不可通约性反线性进步史。
- G02:逐代五件套(代表交互→认知依据→瓶颈→被下代超越的接口→AI 新挑战)。
03 架构剖面(S01–S03)|收录什么:把认知负荷与偏差拆成可替换的分层堆栈与对照矩阵。解决:“由什么组成”——p3xx 设计模式底下的认知账本。何时读:做架构评审、想要一张能贴墙的查表时。
- S01★旗舰最厚:六层剖面(L1 输入构想→L2 输出理解→L3 可信判断→L4 选项决策→L5 记忆维持→L6 技能保持)+ 三个致命层间耦合点。
- S02:流畅性/锚定/自动化/确认/可得性 × 交互场景 × 缓解设计的三轴查表矩阵。
- S03★收口整合:把五支认知机制凝练成五条设计原则(P1 校准 System 2 / P2 控负荷 / P3 扶心智 / P4 防锚定 / P5 保技能),核心增量是显式冲突矩阵 + 按风险排序规则(降负荷 vs 保技能长期对立、防锚定 vs 流畅直接冲突),并与 p302–p305 做”认知底座 vs 设计模式”总对照。原则清单只是入场券,冲突排序才是真功夫。
04 实例剖解(E01–E03)|收录什么:真实产品/系统里用户走偏的现场。解决:“现实怎么走样”——病理学切片。何时读:想看理论如何落到 ChatGPT 对话框、Claude Artifact、病理学 7% 改对为错的真实案例时。
- E01:剖 ChatGPT 式对话框三段账单——构想负荷(表达焦虑)+ 理解负荷 + 判断负荷(信任焦虑)。
- E02:剖结构件如何用外显降外在负荷,及”用精致结构掩盖概率性”的暗面。
- E03:四个可追溯案例(病理学锚定 7%、LLM 自身被锚、过度置信信任崩塌、10 分钟降表现)。
05 复现指南(R01–R03)|收录什么:PM 当天就能动手跑的测量与实验。解决:“自己怎么动手”——从理论到仪表盘。何时读:想验证”我的设计真降负荷了吗/真扶正心智模型了吗”时。
- R01:任务时间 + 错误率(分两类)+ NASA-TLX 三件套 + 三份模板;核心反共识”主观负荷≠客观表现,打架处有金子”。
- R02:四步法(审计→分层→结构默认值→A/B)+ 呈现模板 + 带”植入错误检出率”护栏的实验设计。
- R03:诊断鸿沟→注入校准干预(体验性反例为核心)→测误用率前后差的实验闭环 + 可抄的登记表/onboarding 脚本/埋点清单。
06 阅读指南:本 _总览(MOC)+ README(三路径 + ≥10 题自测 + 反方对话训练,另出)。
§4 与现有节点的关系(升级对照表)
本专题不复述任何旧节点的事实基础,只做”补缺/纠偏/对话/深化/奠基”五类升级。最关键的桥接是补上 c01 → p304/p305 的直接认知链路(此前都是隐性的)。
| 旧节点 | 本专题哪些节点 | 升级类型 | 具体做了什么 |
|---|---|---|---|
| c01 | A01/A04/A05/A06/G01/G02/S01/S02/E01/E02/E03/R01/R02/R03(全专题) | 深化 + 用户侧对偶 | c01 论证”系统侧为什么是概率的”;本专题论证”用户认知侧为什么被概率系统搞乱”——同一范式跃迁的一体两面。 |
| p302 | A01/S01/S02/E02/R01 | 奠基 | p302 是设计模式总览,本专题是其认知理论根基;E02 为其中 Generative UI 模式补可证伪的外在负荷净值底座。 |
| p303 | A03/S01(L1)/E01/R02 | 奠基 + 失效边界 | p303 的渐进式揭示/场景化入口,其有效性溯源到”砍外在负荷”;E01 补出”脚手架砍不动内在负荷”这条失效边界。补 p303→c01 的回链根源(表达焦虑的底层=概率系统)。 |
| p304 | A02/A04/A05/A06/S01(L2-L3)/S02/E01/E03/R01 | 提供底座 + 补 c01 直接回链 | p304 的置信度外显/优雅降级/分段确认,本专题解释它们”为什么有效”=是否真激活了 System 2、定向补给 L3。补全 p304 缺失的 c01 §1.1 直接回链。 |
| p305 | A02/A04/A05/A06/S01(L3,L6)/S02/E03/R01/R03 | 升格定位 + 补 c01 直接回链 | A04 把 p305 从”UX 模式”升格为”认识论补偿装置”;S01 指出其 HITL 断点兼作对抗 L6 技能退化的强制练习点。补全 p305 §3.5.1 应在 c13 之后加 c01 §1.1 直接回链。 |
| 0418 审阅瓶颈系列(专题) | A02/A03/A06/G01/S01/S02/E01/E02/R01/R02/R03 | 深化 + 操作化 + 提供底座 | 0418 诊断”审阅是 AI 协作瓶颈、根因是认知负荷”;本专题给它补理论底座(Sweller 三元/Cowan 4±1)、给操作化仪器(R01-R03),并把它定位为 S01 耦合点一(L2 挤占 L3)的特例。 |
| 幻觉 | A01/A04/A05/A06/S01/S02/E01/E02/E03/R01/R03 | 补缺(风险链另一半) | 幻觉=“AI 会出错”;本专题=“人为什么会信错的 AI”,两者合起来才是完整风险链。 |
§5 三条阅读起点(详表见 README)
- 求职速通路径(面试桌 30 秒火力):A01 → G01 → S01 → S02。拿到”认知底座 vs 设计模式两层思维”+“分层论 vs 总量论”+“按风险校准 System 2”三把面试利器。
- 决策链路径(选型会/设计评审):A04 → S01 → E01 / E02 → R02。从”评估鸿沟为什么爆炸”到”六层负荷账本”到”具体怎么重设计”。
- 紧迫度路径(高风险品类/安全合规,对 Rick 的安全+国际化业务最相关):A05 → A06 → E03 → R01 / R03。从”7% 改对为错的责任红线”到”怎么测、怎么校准”。
§6 跨域思想资源调度(不留空 invocation)
每个调度都在对应节点的”跨域呼应”段落具体展开了它如何改变一个技术判断,绝非装饰性点名。
| 跨域资源 | 调度位置 | 在该节点的具体作用(改变了什么判断) |
|---|---|---|
| Kahneman 双系统(System 1/2) | A01/A02/G02/S01/S02/E01 | 把”接受 vs 审视”从意愿/知识问题还原为注意力资源调度问题——审视不能靠呼吁,只能靠结构。 |
| Sweller 认知负荷 + Miller/Cowan 容量 | A03/S01/E01/E02/R01/R02 | 把”信息太多”从 IA/极简主义问题升级为”砍外在/分段内在/慎增生”的分性质处理;设计阈值取 Cowan 4±1 而非 Miller 7±2。 |
| Norman 心智模型 + 执行/评估鸿沟 | A01/A04/G01/G02/E01/E03/R03 | 揭示 AI 缩窄执行鸿沟却拓宽评估鸿沟——防御性 UX 不是锦上添花,是填评估鸿沟的结构必需。 |
| Tversky 锚定效应 | A05/G02/S01/S02/E03 | 首版输出不只锚定数值,更锚定”问题的语法”——真正的设计权力在”用什么框架接住问题的第一下”。 |
| 自动化偏见(Parasuraman & Manzey;Skitka) | A06/S02/E03/R01 | 专家也不免疫、单靠练习无法克服——缓解责任在界面端不在用户端;7% 是责任红线不是体验问题。 |
| Kuhn 范式不可通约性 | G01 | 把 HCI 史从”越来越友好”的辉格史改写为范式更替——范式选择是任务匹配,不是版本竞赛。 |
| 维特根斯坦(家族相似/河床/框定/图像囚禁/看见为/意义即用法) | A01/A02/A05/E02/E03/R02/R03 | 守住”心智模型”术语边界、解释审视为何需要”硌脚的石头”、诊断心智模型失配为”图像囚禁”。 |
| Polanyi 默会知识 | A03/S01/S02/E01 | ”会问”与”判断力”是默会的、教不会——降负荷设计的认识论代价是剥夺默会知识的练习机会。 |
| 福柯规训/生命政治 | A06 | 自动化偏见不是用户缺陷,是产品主动”生产”的用户主体性——PM 不是中立工具提供者。 |
| Rick 未读对手框架(破 echo chamber):Melnikoff & Bargh《The Mythical Number Two》、Gigerenzer 生态理性、Lucy Suchman 情境行动、Hutchins 分布式认知、Borgmann 装置范式、Selinger 道德外包 | A01/A02/A03/A04/A05/A06/G01/G02/S01/S02/E01/E02/R01 | 逼问本专题盲点:双系统是否可证伪、启发式是否一律是偏差、认知是否只在脑内、deskilling 损失的是否不止技能。 |
§7 验收档案
评议流程(照搬 0411 工程化流水线):ground → draft(六模块并行起草)→ critique(六维 + 事实接地逐节点找茬)→ revise(按 issue 单修订 + 修订日志)→ 独立 grounding 校验 pass(逐条抽取事实声明判定已接地/需接地/疑似编造)→ synthesize(本总览 + README + 跨节点编织 + 三清单)。各节点修订日志均已记录 R1 改了什么,且载重 arXiv 引用经 WebFetch 直接核实(2603.11821 Rosbach 7%、2604.04721 Liu 10 分钟 RCT、2310.13544 Dhuliawala 过度自信+出错、2509.08514 Beck N=2784、2306.16507 Horowitz&Kahn U 型、2412.06593 Lou&Sun、2602.00947 Reddy Keyhole、2512.09085 Pauketat、2508.06352 Meske)。
SABCD 六维自评
| 维度 | 出版线 | 本专题自评 | 依据 |
|---|---|---|---|
| S 结构 | ≥8 | 8.3 | 六模块互补、依赖链清晰、三条阅读路径可导航;S01 旗舰最厚、S03 收口整合补齐架构剖面三件套(S01 账本 + S02 查表 + S03 原则整合);依赖图无占位。 |
| A 判断密度 | ≥8 | 8.2 | 每节有反共识带数字判断(7% 改对为错、4±1 而非 7±2、10 分钟即退化、50–82% 接受率),非综述转写。 |
| B 边界含量 | ≥7.5 | 8.0 | 每节显式承担赌注(“双系统是隐喻不是脑区""LLM 直接实证仍少,依赖自动化偏见间接迁移”)。 |
| C 认识论自觉 | ≥8 | 8.0 | 区分事实/推测/赌注,〔待核实〕标注规范(medRxiv 50–82% 标条件性数据、ScienceDirect nudge 标摘要级)。 |
| D 可演进性 | ≥8.5 | 8.4 | 双链密度高、修订日志齐全;起草期链名不一致死链已于 0426 QC pass 全部就地修净(见 §9 台账),S03 已落盘并接入双链。2026-06-11 P3.4 校链:0418 审阅瓶颈专题已迁入 04AI(04T 专题库/F1 评测与度量/0418 审阅瓶颈系统化专题),原 11 处〔跨专题待落盘〕降级文本已全部恢复为真 0418 总览 双链。 |
| E 对手拷问能力 | ≥7 | 8.1 | 对 Melnikoff&Bargh、Gigerenzer、Suchman、Hutchins 等真实对手框架给”接受+边界”而非反驳。 |
诚实综合分 ≈ 8.0 / 10(已过出版线 7.8;对手立场 E=8.1≥8、failure scenario 充足、bias 砍除充足均达标;S03 收口整合落盘 + 起草期死链全清后,S 升至 8.3、D 升至 8.2,综合分由 7.85 上调至 8.0;进一步上探取决于 0418 迁入后补齐 11 处跨专题双链)。
对手立场接入清单(≥8 处,全部点名真实可追溯立场)
- Melnikoff & Bargh (2018, TiCS):双系统结构上不可证伪 → A01/A02/G01/G02/S01/E03/R03 接受其批评、降级为设计隐喻。
- Gerd Gigerenzer 生态理性:把启发式一律当偏差是 Kahneman 范式傲慢 → A05/S02/E03 接受+标”AI 破坏了生态有效性前提”边界。
- Lucy Suchman《Plans and Situated Actions》(1987):交互是情境即兴非计划执行 → E01/G01/S01 接受其拷问稳定心智模型的预设。
- Edwin Hutchins《Cognition in the Wild》(1995) 分布式认知 → E02 接受”认知不只在脑内”、CLT 管单点上限/分布式管系统增益分工。
- Caetano et al. (2024, arXiv:2412.16892) 8-gulf 扩展派 → A04 接受复杂场景需扩展、坚持 2-gulf 对日常 PM 杠杆率更高。
- Dietvorst et al. (2015, JEP:General) 算法厌恶 → S02 接受偏差双向、坚持目标是校准非单向降信任。
- Albert Borgmann 装置范式 + Evan Selinger 道德外包 → A06 逼问 deskilling 损失的不止技能。
- 业界乐观派”AI=下一个计算器” → A06/S01 接受认知卸载常态、坚持”计算器无留存 KPI、AI 商业模式主动奖励依赖”的不对称。
- minimalist”自然语言是终极界面/AI 不需要 UI” → E01/E02/G02 接受执行端红利、坚持评估端判断负荷未被计入。
failure scenario 清单(≥5 处)
- A02/A05/S02:缓解矩阵在低风险高频、专家闭环、对抗性用户三类场景失效。
- A03:纯娱乐沉浸式、异步 Agent 场景下”4 块阈值/砍外在”建议要打折。
- E01/A04:专家读熟悉领域长输出时理解负荷反低,负荷管理须分人群。
- G01/G02/A05:LUI”缩小执行鸿沟”在用户不知该问什么的冷启动场景反而升高。
- R01:高风险低容错域 RTLX 不够、需上生理测量;被试知道被测会产生需求特征。
confirmation-bias 砍除清单(≥5 处)
- A06/G02/S01/E03/R01:早期反复引 GitClear 翻倍/Liu 10 分钟当”AI 必然让人变弱”的正面证据=bias,补入 Peng et al. (2023) Copilot 提升初学者效率反例,并区分 RCT(强)vs 相关性观察(弱)。
- A03:增生负荷争议(Kalyuga 2011 呼吁取消、Sweller 2019 弱化),核心论证刻意只依赖无争议的”外在负荷”。
- R01/R02/R03:早期把”新版 TLX 更低/更快确认”当胜利=bias,补”接受 AI 错误率更高是更糟”的护栏纪律。
- A02/E03:习得性无助类比 Seligman 厌恶刺激,AI 是正强化驱动,机制可能不同——显式标为类比赌注。
- S01/E02:CLT 从教育迁移到即时消费场景,增生负荷近乎失效——只保外在负荷这条稳健分量。
§8 关联节点(双链密度 ≥20,全部真实名)
本专题节点(17 节点全部落盘)
- A01 认知科学与 AI 交互概念谱系
- A02 双系统理论与 AI 接受
- A03 认知负荷理论与 AI 信息呈现
- A04 心智模型形成·概率系统 vs 确定系统
- A05 锚定效应与 AI 输出
- A06 自动化偏见与学习性无助
- G01 HCI 认知范式代际谱系总图
- G02 交互认知范式代际演化详解
- S01 AI 交互的认知负荷分层剖面(★旗舰)
- S02 认知偏差 × AI 交互对照矩阵
- S03 认知友好 AI 设计全景(★收口整合:五原则 + 冲突矩阵 + 按风险排序)
- E01 对话框交互的认知负荷剖解
- E02 Generative UI 与 Artifact 的认知设计剖解
- E03 AI 锚定与心智模型失配案例剖解
- R01 测一个 AI 界面的认知负荷
- R02 设计降认知负荷的 AI 呈现
- R03 心智模型校准实验
升级对照的既有节点(c/m/p/概念卡,经核实存在)
- c01 - 认知重构:从确定性系统到概率系统(认知理论底座的系统侧对偶)
- p302 - 七种 AI 交互设计模式
- p303 - 克服空白画布综合症
- p304 - 防御性 UX:对抗延迟与幻觉
- p305 - 信任架构与可解释性设计
- p308 - 多模态与脱离屏幕的交互(Baddeley 双通道应用)
- m207 - Agent 产品化:场景推演与失败模式(HITL 断点设计)
- m209 - 推理成本控制手册(压缩呈现的 token 成本转移)
- 幻觉、c13 - 幻觉的不可消除性、c14 - 模型评估体系与 Goodhart 陷阱、Agent
跨专题 / 导航
- 审阅瓶颈专题(认知负荷的另一半硬币)
- 0114认识论、0117社会学(跨域思想资源入口)
- AI PM 知识图谱·总索引、索引、仪表盘