R

_认知科学系统化专题·总览

创建 2026-06-07 更新 2026-06-12 3 条双链 认知科学 专题 AI 整理

认知科学系统化专题 · 总览(MOC)

本专题 = 04AI 产品设计模块(p302p309)之下的认知理论底座。p3xx 回答”AI 产品该怎么设计”,本专题回答”用户的大脑为什么会这样反应”。读完,你能在面试桌、选型会、复现台上 30 秒说清:为什么照搬 GUI 假设到概率系统必崩,以及该从认知科学的哪一层动手。


§0 序:那堵墙

设想一个 PM 会遇到的选型会场景:一个团队兴奋地展示他们的 AI 助手——一个能生成无限方案、无限解释、无限备选的对话框。Demo 很惊艳。可一旦有人追问”用户一次能看懂几个方案、能审完几段解释”,全场就该沉默了。他们把”AI 能生成多少”当成了产品力,却忘了墙的另一边:用户的工作记忆被生物结构钉死在约 4 个组块上,几十年没变;用户的审视带宽(System 2)是稀缺且昂贵的。AI 的供给侧无限,用户的需求侧恒定——这条裂缝,就是那堵墙。

撞墙的根因只有一个:他们把图形界面(GUI)三十年沉淀的设计假设——同样操作给同样结果、出错就是 bug、状态可见可验证——原封不动搬到了一个概率系统上。 而概率系统恰恰违反了这些隐性假设里最核心的几条。假设被违反,建立在假设之上的”最佳实践”会静默失效:不报错,但用户的认知在你看不见的地方崩塌——盲信流畅的幻觉、被首版输出锚死、把概率工具当确定工具用、十分钟就开始技能退化。

本专题的反共识立场:AI 交互比传统 GUI 更依赖认知科学,不是程度问题,是性质问题。 解药不是更长的 UX checklist,而是一套能解释”为什么这条最佳实践在 AI 上不成立”的认知理论底座。这就是 0426 专题要建的东西。


§1 专题定位:为什么认知科学配独立建一个专题号

用 SHARED_CONTEXT §2 的四条选题判据逐条论证(满足前三条全部 + 第四条为真):

判据是否满足论证
① 中心性(影响 ≥3 个 PM 决策链节点)认知底座直接决定 p303(输入构想)、p304(防御性 UX)、p305(信任架构)三个设计模块的”为什么有效”;并横切选型、复现、合规三类决策。
② 误解深度(业界定义互相矛盾、系统性滑变)“心智模型""System 1/2”等术语在 AI 话语里发生维特根斯坦式语义滑变——研究者说 AI 的”mental model”时其实指行为预测而非认知状态(Yin et al. 2025, arXiv:2510.02660);连 258 篇 CHI 论文都把 LLM 推理”去语境化”误当工具(Mothilal et al. 2025, arXiv:2510.22978)。
③ 速变性(24 个月内 ≥1 次格式塔切换)2022 生成式大模型把”同一输入→不同输出”从异常态变成正常态——交互认知史上的一次 Kuhn 式不可通约范式切换(详见 G01)。
④ 学了就能用读完即得三条可立即落地的判断力:拆负荷分层(不是看总量)、按风险校准 System 2 触发(不是加提示)、把心智模型校准建模成可测的误用率实验(不是写文档)。

升高的抽象层:c/m/p 单维节点是”设计模式”(怎么做)。本专题升高一层到认知理论底座(人脑为什么会以特定方式失灵)——它不复述任何设计模式,只供给每个设计决策可溯源的认知理由。最关键的跨模块桥接是补上 c01 → p304、c01 → p305 的直接认知链路:从”系统为什么是概率的”(c01)到”用户的脑子为什么会被概率系统搞乱”(本专题)到”设计该怎么应对”(p3xx)。


§2 模块全景

graph TD
    subgraph 概念辨析["01 概念辨析(横向·是什么)"]
        A01[A01 概念谱系] --> A02[A02 双系统·接受]
        A01 --> A03[A03 认知负荷·呈现]
        A01 --> A04[A04 心智模型·概率vs确定]
        A02 --> A05[A05 锚定效应]
        A02 --> A06[A06 自动化偏见·习得性无助]
    end
    subgraph 代际演化["02 代际演化(纵向·从哪来·横切)"]
        G01[G01 代际谱系总图] --> G02[G02 五代逐代详解]
    end
    subgraph 架构剖面["03 架构剖面(解剖·由什么组成)"]
        S01[S01 认知负荷六层剖面★旗舰] 
        S02[S02 偏差×交互对照矩阵]
        S03[S03 认知友好设计全景·收口整合]
        S01 --> S03
        S02 --> S03
    end
    subgraph 实例剖解["04 实例剖解(病理·现实怎么走样)"]
        E01[E01 对话框负荷剖解] 
        E02[E02 Generative UI·Artifact]
        E03[E03 锚定与心智模型失配案例]
    end
    subgraph 复现指南["05 复现指南(操作·自己怎么动手)"]
        R01[R01 测认知负荷] --> R02[R02 设计降负荷呈现]
        R01 --> R03[R03 心智模型校准实验]
    end

    概念辨析 依赖链> 架构剖面
    架构剖面 依赖链> 实例剖解
    实例剖解 依赖链> 复现指南
    代际演化 -.横切时间维.-> 概念辨析
    代际演化 -.横切时间维.-> 架构剖面

矩阵含义:六模块按 SHARED_CONTEXT §3 的标准骨架排布——概念(横向)→ 架构(解剖)→ 实例(病理)→ 复现(操作) 是主依赖链;代际演化(纵向)横切整条链,给每个认知机制一个”在第几代成为核心问题”的时间坐标;阅读指南(本总览 + README)反向编织成多条可读路径。01 概念辨析是全专题的认知词典,A01 是其谱系入口,A02–A06 各深挖一支(双系统/负荷/心智模型/锚定/偏见),其余模块全部回链到这六支。


§3 六模块逐一介绍

01 概念辨析(A01–A06)|收录什么:认知科学里真正与 AI 交互相关的四支理论的辨析与深挖。解决:“是什么”——把双系统、认知负荷、心智模型、认知偏差从笼统名词拆成可操作判断。何时读:求职速通、想建立认知词典时第一站。

  • A01:四分支谱系总图 + 反共识判断”AI 比 GUI 更依赖认知科学是性质问题”。
  • A02:流畅诱发 System 1 盲信、负荷挤占审视、按风险校准 System 2 触发;双侧失衡(盲信 vs 算法厌恶)。
  • A03:Miller/Cowan 容量定律(4±1 而非 7±2)+ Sweller 三元负荷(砍外在、分段内在、慎增生)。
  • A04:Norman 三角 + 执行/评估鸿沟反向拉扯 + 四种确定系统心智模型迁移误用。
  • A05:首版输出=概率系统的结构性风险;重生成≠解锚、免责≠解锚。
  • A06:依赖陷阱三阶段(自动化偏见→技能退化→习得性无助);好用即有害的留存-伦理两难。

02 代际演化(G01–G02)|收录什么:HCI 五代交互范式的认知谱系。解决:“从哪来”——每代改变的不是”友好度”,而是对用户大脑下的认知假设;瓶颈只会搬家不会消失。何时读:想看清”对话式 AI/生成式不是终点而是认知陷阱密集爆发期”时。

  • G01:五代(CLI→GUI→触屏→对话式→生成式)认知假设/消除瓶颈/制造新瓶颈/反例四列表,以 Kuhn 不可通约性反线性进步史。
  • G02:逐代五件套(代表交互→认知依据→瓶颈→被下代超越的接口→AI 新挑战)。

03 架构剖面(S01–S03)|收录什么:把认知负荷与偏差拆成可替换的分层堆栈与对照矩阵。解决:“由什么组成”——p3xx 设计模式底下的认知账本。何时读:做架构评审、想要一张能贴墙的查表时。

  • S01旗舰最厚:六层剖面(L1 输入构想→L2 输出理解→L3 可信判断→L4 选项决策→L5 记忆维持→L6 技能保持)+ 三个致命层间耦合点。
  • S02:流畅性/锚定/自动化/确认/可得性 × 交互场景 × 缓解设计的三轴查表矩阵。
  • S03收口整合:把五支认知机制凝练成五条设计原则(P1 校准 System 2 / P2 控负荷 / P3 扶心智 / P4 防锚定 / P5 保技能),核心增量是显式冲突矩阵 + 按风险排序规则(降负荷 vs 保技能长期对立、防锚定 vs 流畅直接冲突),并与 p302–p305 做”认知底座 vs 设计模式”总对照。原则清单只是入场券,冲突排序才是真功夫。

04 实例剖解(E01–E03)|收录什么:真实产品/系统里用户走偏的现场。解决:“现实怎么走样”——病理学切片。何时读:想看理论如何落到 ChatGPT 对话框、Claude Artifact、病理学 7% 改对为错的真实案例时。

  • E01:剖 ChatGPT 式对话框三段账单——构想负荷(表达焦虑)+ 理解负荷 + 判断负荷(信任焦虑)。
  • E02:剖结构件如何用外显降外在负荷,及”用精致结构掩盖概率性”的暗面。
  • E03:四个可追溯案例(病理学锚定 7%、LLM 自身被锚、过度置信信任崩塌、10 分钟降表现)。

05 复现指南(R01–R03)|收录什么:PM 当天就能动手跑的测量与实验。解决:“自己怎么动手”——从理论到仪表盘。何时读:想验证”我的设计真降负荷了吗/真扶正心智模型了吗”时。

  • R01:任务时间 + 错误率(分两类)+ NASA-TLX 三件套 + 三份模板;核心反共识”主观负荷≠客观表现,打架处有金子”。
  • R02:四步法(审计→分层→结构默认值→A/B)+ 呈现模板 + 带”植入错误检出率”护栏的实验设计。
  • R03:诊断鸿沟→注入校准干预(体验性反例为核心)→测误用率前后差的实验闭环 + 可抄的登记表/onboarding 脚本/埋点清单。

06 阅读指南:本 _总览(MOC)+ README(三路径 + ≥10 题自测 + 反方对话训练,另出)。


§4 与现有节点的关系(升级对照表)

本专题不复述任何旧节点的事实基础,只做”补缺/纠偏/对话/深化/奠基”五类升级。最关键的桥接是补上 c01 → p304/p305 的直接认知链路(此前都是隐性的)。

旧节点本专题哪些节点升级类型具体做了什么
c01A01/A04/A05/A06/G01/G02/S01/S02/E01/E02/E03/R01/R02/R03(全专题)深化 + 用户侧对偶c01 论证”系统侧为什么是概率的”;本专题论证”用户认知侧为什么被概率系统搞乱”——同一范式跃迁的一体两面。
p302A01/S01/S02/E02/R01奠基p302 是设计模式总览,本专题是其认知理论根基;E02 为其中 Generative UI 模式补可证伪的外在负荷净值底座。
p303A03/S01(L1)/E01/R02奠基 + 失效边界p303 的渐进式揭示/场景化入口,其有效性溯源到”砍外在负荷”;E01 补出”脚手架砍不动内在负荷”这条失效边界。补 p303→c01 的回链根源(表达焦虑的底层=概率系统)。
p304A02/A04/A05/A06/S01(L2-L3)/S02/E01/E03/R01提供底座 + 补 c01 直接回链p304 的置信度外显/优雅降级/分段确认,本专题解释它们”为什么有效”=是否真激活了 System 2、定向补给 L3。补全 p304 缺失的 c01 §1.1 直接回链。
p305A02/A04/A05/A06/S01(L3,L6)/S02/E03/R01/R03升格定位 + 补 c01 直接回链A04 把 p305 从”UX 模式”升格为”认识论补偿装置”;S01 指出其 HITL 断点兼作对抗 L6 技能退化的强制练习点。补全 p305 §3.5.1 应在 c13 之后加 c01 §1.1 直接回链。
0418 审阅瓶颈系列(专题)A02/A03/A06/G01/S01/S02/E01/E02/R01/R02/R03深化 + 操作化 + 提供底座0418 诊断”审阅是 AI 协作瓶颈、根因是认知负荷”;本专题给它补理论底座(Sweller 三元/Cowan 4±1)、给操作化仪器(R01-R03),并把它定位为 S01 耦合点一(L2 挤占 L3)的特例。
幻觉A01/A04/A05/A06/S01/S02/E01/E02/E03/R01/R03补缺(风险链另一半)幻觉=“AI 会出错”;本专题=“人为什么会信错的 AI”,两者合起来才是完整风险链。

§5 三条阅读起点(详表见 README)

  1. 求职速通路径(面试桌 30 秒火力):A01G01S01S02。拿到”认知底座 vs 设计模式两层思维”+“分层论 vs 总量论”+“按风险校准 System 2”三把面试利器。
  2. 决策链路径(选型会/设计评审):A04S01E01 / E02R02。从”评估鸿沟为什么爆炸”到”六层负荷账本”到”具体怎么重设计”。
  3. 紧迫度路径(高风险品类/安全合规,对 Rick 的安全+国际化业务最相关):A05A06E03R01 / R03。从”7% 改对为错的责任红线”到”怎么测、怎么校准”。

§6 跨域思想资源调度(不留空 invocation)

每个调度都在对应节点的”跨域呼应”段落具体展开了它如何改变一个技术判断,绝非装饰性点名。

跨域资源调度位置在该节点的具体作用(改变了什么判断)
Kahneman 双系统(System 1/2)A01/A02/G02/S01/S02/E01把”接受 vs 审视”从意愿/知识问题还原为注意力资源调度问题——审视不能靠呼吁,只能靠结构。
Sweller 认知负荷 + Miller/Cowan 容量A03/S01/E01/E02/R01/R02把”信息太多”从 IA/极简主义问题升级为”砍外在/分段内在/慎增生”的分性质处理;设计阈值取 Cowan 4±1 而非 Miller 7±2。
Norman 心智模型 + 执行/评估鸿沟A01/A04/G01/G02/E01/E03/R03揭示 AI 缩窄执行鸿沟却拓宽评估鸿沟——防御性 UX 不是锦上添花,是填评估鸿沟的结构必需。
Tversky 锚定效应A05/G02/S01/S02/E03首版输出不只锚定数值,更锚定”问题的语法”——真正的设计权力在”用什么框架接住问题的第一下”。
自动化偏见(Parasuraman & Manzey;Skitka)A06/S02/E03/R01专家也不免疫、单靠练习无法克服——缓解责任在界面端不在用户端;7% 是责任红线不是体验问题。
Kuhn 范式不可通约性G01把 HCI 史从”越来越友好”的辉格史改写为范式更替——范式选择是任务匹配,不是版本竞赛。
维特根斯坦(家族相似/河床/框定/图像囚禁/看见为/意义即用法)A01/A02/A05/E02/E03/R02/R03守住”心智模型”术语边界、解释审视为何需要”硌脚的石头”、诊断心智模型失配为”图像囚禁”。
Polanyi 默会知识A03/S01/S02/E01”会问”与”判断力”是默会的、教不会——降负荷设计的认识论代价是剥夺默会知识的练习机会。
福柯规训/生命政治A06自动化偏见不是用户缺陷,是产品主动”生产”的用户主体性——PM 不是中立工具提供者。
Rick 未读对手框架(破 echo chamber):Melnikoff & Bargh《The Mythical Number Two》、Gigerenzer 生态理性、Lucy Suchman 情境行动、Hutchins 分布式认知、Borgmann 装置范式、Selinger 道德外包A01/A02/A03/A04/A05/A06/G01/G02/S01/S02/E01/E02/R01逼问本专题盲点:双系统是否可证伪、启发式是否一律是偏差、认知是否只在脑内、deskilling 损失的是否不止技能。

§7 验收档案

评议流程(照搬 0411 工程化流水线):ground → draft(六模块并行起草)→ critique(六维 + 事实接地逐节点找茬)→ revise(按 issue 单修订 + 修订日志)→ 独立 grounding 校验 pass(逐条抽取事实声明判定已接地/需接地/疑似编造)→ synthesize(本总览 + README + 跨节点编织 + 三清单)。各节点修订日志均已记录 R1 改了什么,且载重 arXiv 引用经 WebFetch 直接核实(2603.11821 Rosbach 7%、2604.04721 Liu 10 分钟 RCT、2310.13544 Dhuliawala 过度自信+出错、2509.08514 Beck N=2784、2306.16507 Horowitz&Kahn U 型、2412.06593 Lou&Sun、2602.00947 Reddy Keyhole、2512.09085 Pauketat、2508.06352 Meske)。

SABCD 六维自评

维度出版线本专题自评依据
S 结构≥88.3六模块互补、依赖链清晰、三条阅读路径可导航;S01 旗舰最厚、S03 收口整合补齐架构剖面三件套(S01 账本 + S02 查表 + S03 原则整合);依赖图无占位。
A 判断密度≥88.2每节有反共识带数字判断(7% 改对为错、4±1 而非 7±2、10 分钟即退化、50–82% 接受率),非综述转写。
B 边界含量≥7.58.0每节显式承担赌注(“双系统是隐喻不是脑区""LLM 直接实证仍少,依赖自动化偏见间接迁移”)。
C 认识论自觉≥88.0区分事实/推测/赌注,〔待核实〕标注规范(medRxiv 50–82% 标条件性数据、ScienceDirect nudge 标摘要级)。
D 可演进性≥8.58.4双链密度高、修订日志齐全;起草期链名不一致死链已于 0426 QC pass 全部就地修净(见 §9 台账),S03 已落盘并接入双链。2026-06-11 P3.4 校链:0418 审阅瓶颈专题已迁入 04AI(04T 专题库/F1 评测与度量/0418 审阅瓶颈系统化专题),原 11 处〔跨专题待落盘〕降级文本已全部恢复为真 0418 总览 双链。
E 对手拷问能力≥78.1对 Melnikoff&Bargh、Gigerenzer、Suchman、Hutchins 等真实对手框架给”接受+边界”而非反驳。

诚实综合分 ≈ 8.0 / 10(已过出版线 7.8;对手立场 E=8.1≥8、failure scenario 充足、bias 砍除充足均达标;S03 收口整合落盘 + 起草期死链全清后,S 升至 8.3、D 升至 8.2,综合分由 7.85 上调至 8.0;进一步上探取决于 0418 迁入后补齐 11 处跨专题双链)。

对手立场接入清单(≥8 处,全部点名真实可追溯立场)

  1. Melnikoff & Bargh (2018, TiCS):双系统结构上不可证伪 → A01/A02/G01/G02/S01/E03/R03 接受其批评、降级为设计隐喻。
  2. Gerd Gigerenzer 生态理性:把启发式一律当偏差是 Kahneman 范式傲慢 → A05/S02/E03 接受+标”AI 破坏了生态有效性前提”边界。
  3. Lucy Suchman《Plans and Situated Actions》(1987):交互是情境即兴非计划执行 → E01/G01/S01 接受其拷问稳定心智模型的预设。
  4. Edwin Hutchins《Cognition in the Wild》(1995) 分布式认知 → E02 接受”认知不只在脑内”、CLT 管单点上限/分布式管系统增益分工。
  5. Caetano et al. (2024, arXiv:2412.16892) 8-gulf 扩展派 → A04 接受复杂场景需扩展、坚持 2-gulf 对日常 PM 杠杆率更高。
  6. Dietvorst et al. (2015, JEP:General) 算法厌恶 → S02 接受偏差双向、坚持目标是校准非单向降信任。
  7. Albert Borgmann 装置范式 + Evan Selinger 道德外包 → A06 逼问 deskilling 损失的不止技能。
  8. 业界乐观派”AI=下一个计算器” → A06/S01 接受认知卸载常态、坚持”计算器无留存 KPI、AI 商业模式主动奖励依赖”的不对称。
  9. minimalist”自然语言是终极界面/AI 不需要 UI” → E01/E02/G02 接受执行端红利、坚持评估端判断负荷未被计入。

failure scenario 清单(≥5 处)

  • A02/A05/S02:缓解矩阵在低风险高频、专家闭环、对抗性用户三类场景失效。
  • A03:纯娱乐沉浸式、异步 Agent 场景下”4 块阈值/砍外在”建议要打折。
  • E01/A04:专家读熟悉领域长输出时理解负荷反低,负荷管理须分人群。
  • G01/G02/A05:LUI”缩小执行鸿沟”在用户不知该问什么的冷启动场景反而升高。
  • R01:高风险低容错域 RTLX 不够、需上生理测量;被试知道被测会产生需求特征。

confirmation-bias 砍除清单(≥5 处)

  • A06/G02/S01/E03/R01:早期反复引 GitClear 翻倍/Liu 10 分钟当”AI 必然让人变弱”的正面证据=bias,补入 Peng et al. (2023) Copilot 提升初学者效率反例,并区分 RCT(强)vs 相关性观察(弱)。
  • A03:增生负荷争议(Kalyuga 2011 呼吁取消、Sweller 2019 弱化),核心论证刻意只依赖无争议的”外在负荷”。
  • R01/R02/R03:早期把”新版 TLX 更低/更快确认”当胜利=bias,补”接受 AI 错误率更高是更糟”的护栏纪律。
  • A02/E03:习得性无助类比 Seligman 厌恶刺激,AI 是正强化驱动,机制可能不同——显式标为类比赌注。
  • S01/E02:CLT 从教育迁移到即时消费场景,增生负荷近乎失效——只保外在负荷这条稳健分量。

§8 关联节点(双链密度 ≥20,全部真实名)

本专题节点(17 节点全部落盘)

升级对照的既有节点(c/m/p/概念卡,经核实存在)

跨专题 / 导航

  • 审阅瓶颈专题(认知负荷的另一半硬币)
  • 0114认识论、0117社会学(跨域思想资源入口)
  • AI PM 知识图谱·总索引、索引、仪表盘