A01 认知科学与 AI 交互概念谱系 · 知识库

为 AI 交互设计选一套认知理论底座，本质是在回答一个被大多数 PM 跳过的前置问题：用户的脑子在用 AI 时，到底处于哪种工作模式？ 本节点不讲任何具体的交互设计模式（那是 p302 - 七种 AI 交互设计模式到 p309 - 特殊品类交互设计要点的事），只做一件事——把认知科学里真正与 AI 交互相关的四个分支（双系统、认知负荷、心智模型、认知偏差）摆成一张可导航的谱系图，并论证一个反共识判断：AI 交互比传统 GUI 更依赖认知科学，不是程度问题，而是性质问题。本专题的视角框架是「认知底座 → 设计模式」的两层结构：p3xx 是设计模式，本专题是其下的认知理论根基。

§0 为什么是「认知科学谱系」而不是「UX 最佳实践清单」

先挡掉一个默认的错误框架。绝大多数 AI 产品团队处理交互问题的方式，是去翻 Nielsen Norman Group 的文章、抄竞品的 UI、攒一份”AI 产品设计 checklist”。这条路在 GUI 时代足够用——因为 GUI 的交互假设（用户点按钮、系统给确定反馈、状态可见可验证）已经被三十年实践固化成了隐性常识，你不需要懂底层认知科学，照搬最佳实践就能做出能用的产品。

这正是判断主轴所在：把 GUI 的设计假设照搬到概率系统上，是当前 AI 产品最普遍、最隐蔽的认知错误。 因为这些假设不写在任何 checklist 里——它们是空气，是你呼吸但看不见的前提。而 AI 系统恰恰违反了这些前提中最核心的几条（见 c01 - 认知重构：从确定性系统到概率系统：同一输入→概率性输出、输出是置信区间而非单一值）。当底层假设被违反，建立在假设之上的最佳实践就会静默失效——不报错，但用户的认知会在你看不见的地方崩塌。

所以我们需要的不是更长的 checklist，而是能解释”为什么这条最佳实践在 AI 上不成立”的理论。理论的作用是让隐性假设显性化，让你在抄竞品之前先问一句：“这个设计依赖的认知假设，在概率系统下还成立吗？“——这是 checklist 永远给不了的判断力。

§1 四个分支：与 AI 交互相关的认知科学谱系

认知科学是个庞大领域，但与 AI 交互直接相关的只有四支。我用「用户认知的时间轴」来组织它们——从一次 AI 交互开始的瞬间，到长期反复使用后的能力变化：

graph TD
    A[用户面对 AI 输出] --> B[双系统理论<br/>System 1 快接受 vs System 2 审视]
    A --> C[认知负荷理论<br/>工作记忆 4±1 容量限制]
    B --> D[心智模型<br/>用户对系统如何运作的内部表征]
    C --> D
    D --> E[认知偏差<br/>锚定 / 自动化偏差 / 技能退化]
    B --> E
    style A fill:#e8e8e8
    style B fill:#d4e6f1
    style C fill:#d5f5e3
    style D fill:#fdebd0
    style E fill:#fadbd8

分支	核心问题	奠基人物与著作	对 AI 交互的含义
双系统理论	用户何时快接受 AI、何时审视	Kahneman《Thinking, Fast and Slow》(2011)；术语首创 Stanovich (1999)	产品要校准 System 1↔System 2 的切换时机
认知负荷	AI 信息呈现塞了多少进工作记忆	Miller (1956)、Sweller (1988/1994)、Cowan (2001 修正为 4±1)	单屏可见组块 ≤4–5，分步呈现
心智模型	用户对”AI 怎么运作”建了什么内部表征	Norman《Some Observations on Mental Models》(1983)、《The Design of Everyday Things》(1988/2013)	概率系统的心智模型天然不稳定
认知偏差	反复用 AI 后判断如何系统性走偏	Tversky & Kahneman (1974, Science)；Parasuraman & Manzey (2010)	锚定、自动化偏差、技能退化

这张表的每一行，都对应本专题后续一个或多个节点的深挖。这里只做”谱系定位”，不展开。

§2 双系统：用户对 AI 输出的两种处理模式

Kahneman 在《Thinking, Fast and Slow》(Farrar, Straus and Giroux, 2011) 普及的 System 1（快、自动、模式识别、情绪驱动）与 System 2（慢、有意识、分析、受工作记忆限制）框架，是理解”用户怎么对待 AI 输出”的最直接工具。

[!note] 术语精确性 “System 1/2”术语其实由 Keith Stanovich 在 1999 年首创，Kahneman 才是普及者。更重要的是：Kahneman 本人明确警告这两个系统并非大脑中真实的独立结构，只是有用的隐喻（来源：imotions.com “System 1 and System 2: Facts and Fictions”）。Evans & Stanovich (2013, Perspectives on Psychological Science) 后来把术语改为 Type 1/Type 2，以避免被误读为大脑里两个模块。在 AI 交互写作里调用这个框架，必须守住它是”应用性隐喻”这条边界。

映射到 AI 交互：

用户行为	主导系统	表现
快速采纳 AI 建议、跳过审查	System 1	自动化偏差、启发式信任（“AI 生成的，应该没问题”）
主动核实来源、反问逻辑	System 2	批判性审视（但也可能滑向算法厌恶式的过度否定）
时间压力、复杂任务下	System 1 占优	偏差加剧

产品的核心任务是校准切换：在低风险、需要效率的场景让 System 1 顺畅接受；在高风险、需要准确的场景制造”减速点”激活 System 2。这正是 p304 - 防御性 UX：对抗延迟与幻觉的分段确认、p305 - 信任架构与可解释性设计的 HITL 确认断点的认知学根据——它们是”激活 System 2”的具体手段，本节点是它们的理论出处。

§3 心智模型：概率系统打破了 Norman 的稳定假设

Norman 在《Some Observations on Mental Models》(1983, 收录于 Gentner & Stevens 编 Mental Models) 与《The Design of Everyday Things》(1988/2013) 中区分了三类模型：设计模型（设计者脑中的构想）、用户心智模型（用户交互中构建的内部表征）、系统意象（产品外观与反馈传达的一切信号）。Norman 1983 年就指出心智模型往往是不完整、自相矛盾、不稳定的。

关键在于 Norman 的两个鸿沟概念（执行鸿沟 / 评估鸿沟，由 Hutchins, Hollan & Norman 1985/1986 提出）在 AI 系统下发生了非对称变形：

[!important] AI 缩窄执行鸿沟、拓宽评估鸿沟 Yuexi Chen 的 UMD 博士论文 (2025) 系统论证了一个核心悖论：AI 通过自然语言交互缩小了执行鸿沟（用户更容易表达意图），却同时拓宽了评估鸿沟——AI 输出可能不准确或不可信，用户难以判断哪些可用（来源：Chen, UMD Dissertation, 2025, drum.lib.umd.edu，单一来源，待同行评审期刊转化）。

这就是为什么概率系统的心智模型天然不稳定：在确定性系统里，出错是异常态，用户可归因于 bug，心智模型保持稳定；在概率系统里，出错是正常分布内事件，用户难以归因，心智模型反复被打碎重建。Dhuliawala et al. (EMNLP 2023, arXiv:2310.13544) 进一步发现”overconfident + wrong”（高置信但出错）对信任的破坏性远大于”underconfident + correct”，且信任恢复极慢。这直接定义了 p305 - 信任架构与可解释性设计为何要追求”校准信任”而非”最大化信任”。

§4 认知负荷：AI 信息呈现的容量天花板

Miller (1956, Psychological Review) 的 7±2 早已被 Cowan (2001, Behavioral and Brain Sciences) 修正——剔除复述与长时记忆辅助后，工作记忆的真实注意焦点容量约为 4±1 个组块。Sweller 的认知负荷理论 (1988/1994) 把负荷拆成内在、外在、增生三类，其中外在负荷（信息呈现方式造成的无关耗费）是设计者唯一可直接控制的优化重点。

AI 交互在这里有个特殊陷阱：为了对抗心智模型不稳定，产品倾向于”多解释”——展示推理链、置信度、来源引用——但解释本身消耗工作记忆。这就是 XAI 领域的”透明度悖论”（来源：近期 XAI/HCI 研究，arXiv:2508.06352 等）：过度解释造成认知过载，反而损害理解。p305 - 信任架构与可解释性设计的”折叠式推理面板""分层透明度”正是对这一负荷约束的设计应答——默认只给结论，进阶用户按需展开。

§5 认知偏差：长期使用后判断的系统性走偏

前三支讲的是”一次交互内”的认知，认知偏差讲的是”反复使用后”的认知漂移。三个对 AI PM 最致命：

锚定效应（Tversky & Kahneman, 1974, Science）：AI 的首次输出会锚定用户后续判断。Rosbach et al. (2026, arXiv:2603.11821) 在 28 名病理学专家实验中测得 7% 自动化偏差率——专家原本判断正确，却因接受错误 AI 建议改了答案。
自动化偏差（Parasuraman & Manzey, 2010, Human Factors）：无批判地采纳自动化建议，专家也不免疫，单靠练习无法克服。Horowitz & Kahn (2023, arXiv:2306.16507, 9 国 9000 人) 发现 AI 知识”中等者”偏差最强，呈 Dunning-Kruger 式 U 型曲线。
技能退化（Bainbridge 1983「Ironies of Automation」；Seligman 习得性无助）：Liu et al. (2026, arXiv:2604.04721, n=1222 RCT) 发现仅约 10 分钟 AI 辅助交互后，参与者独立任务表现显著变差、更易放弃。

[!warning] 边界与赌注把这些偏差框架”应用”到 LLM 交互，目前大多是间接援引——直接以 System 1/2 为框架研究 LLM 交互的实验论文仍少，自动化偏差文献是最贴近的实证基础但属间接迁移。本节点赌的是：这些经典认知机制在 AI 场景下性质相同、强度可能更大；如果未来证明”AI 交互产生了全新的、经典框架无法覆盖的认知模式”，本谱系需要扩支。

§6 对手框架回应：双系统是否可证伪

接受 + 边界，不是反驳。 业界最强的反方来自 Melnikoff & Bargh (2018, Trends in Cognitive Sciences, 《The Mythical Number Two》, DOI:10.1016/j.tics.2018.02.001)：他们论证双系统框架结构上抗反驳——预测失败时总能诉诸”系统间干扰”或”第三因素”，且”自动性”并非统一构念。Stanovich 与 Kahneman 本人都已劝阻使用 System 1/2 标签，因为实践者把它误解成大脑里两个模块，催生了神经营销等伪科学。

接受：作为严格的认知科学理论，双系统确实定义松散、难以统一证伪，这一批评成立。边界：本专题不把双系统当作神经实在论的理论，而当作PM 的设计启发式——它的价值不在于”准确描述大脑”,而在于”给设计师一个可操作的切换框架”。一个隐喻只要能让你做出”这个场景该不该制造减速点”的判断，它对 PM 就是有用的。我们要的是判断力，不是神经学真理。这与 c01 - 认知重构：从确定性系统到概率系统对待概率框架的态度一致：框架是工具，不是本体。

§7 跨域呼应：维特根斯坦的「家族相似」与术语滑变

[!note] 跨域调度认知科学这四支的术语——尤其”心智模型""系统”——正在 AI 话语里发生维特根斯坦意义上的语义滑变。Yin et al. (2025, arXiv:2510.02660) 尖锐指出：当研究者说 AI 的”mental model”或”theory of mind”时，讨论的其实是行为预测，而非真正的认知状态；LLM 在心智理论测试中的”成功”来自行为模仿，被混淆成真实认知。

维特根斯坦的「家族相似」（family resemblance）告诉我们：一个词在不同语境下的用法之间只有交叉重叠的相似性，没有共同本质。“心智模型”用在”用户脑中对系统的表征”（Norman 本义）和”AI 对世界的内部表征”（拟人化用法）上，是两个家族成员——共享部分相似性，但绝非同一概念。PM 必须守住这条术语边界：当 PR 文案说”我们的 AI 有心智模型”时，那是营销修辞，不是认知科学陈述。混淆二者，会让你在产品决策里把”行为像懂”误当成”真的懂”，从而高估系统、低估幻觉风险（详见幻觉）。这正是认识论自觉在 AI PM 工作中的具体落地（关联 0114认识论、0117社会学对知识建构的讨论）。

§8 PM 决策启示

面试桌：被问”AI 产品和传统产品的设计差异”，不要答”AI 更智能”——答”传统 GUI 的设计假设建立在确定性反馈上，AI 是概率系统，违反了这些隐性假设，所以必须从认知科学底座重审每条 UX 最佳实践，而不是照搬”。这一句话就显出你有”认知底座 vs 设计模式”的两层思维。
选型会：评估任何”AI 辅助决策”功能时，先问三个认知问题：它把用户推向 System 1 还是 System 2？它给工作记忆塞了几个组块？反复使用会不会导致技能退化？
复现台：做用户测试时，不只测”任务完成率”，要测”心智模型准确度”和”过度依赖/不足依赖”——这两个变量决定了概率系统的长期成败（Eigner & Händler, 2024, arXiv:2402.17385）。

§9 与已有节点的关系

本节点对照 c01 - 认知重构：从确定性系统到概率系统，做的是补缺 + 升高抽象层：c01 从”系统侧”论证 AI 是概率系统（同一输入→概率分布采样），本节点从”用户认知侧”论证人脑面对概率系统时的处理机制根本不同于面对确定系统——两者是同一范式跃迁的一体两面。c01 解释”系统为什么是概率的”,本节点解释”用户的脑子为什么会被概率系统搞乱”。

本节点也对照 p302 - 七种 AI 交互设计模式到 p305 - 信任架构与可解释性设计，做的是奠基：p3xx 是设计模式，本专题是其认知理论根基。同时升级对照 0418 审阅瓶颈节点对认知负荷的讨论——0418 在”代码审阅”这一具体场景观察到认知负荷瓶颈，本节点把它上提为”AI 信息呈现的普遍负荷管理”理论问题（不复述 0418 的具体场景数据）。

§10 关联节点

核心（必读）

c01 - 认知重构：从确定性系统到概率系统——系统侧的范式跃迁，本节点是其用户认知侧对偶
p305 - 信任架构与可解释性设计——校准信任的认知学落地
p304 - 防御性 UX：对抗延迟与幻觉——激活 System 2 的具体手段
幻觉——评估鸿沟拓宽的根源
AI PM 知识图谱·总索引

延伸（可选）

p302 - 七种 AI 交互设计模式、p303 - 克服空白画布综合症——设计模式层
Agent——Agent 异步交互对心智模型的额外冲击
0114认识论、0117社会学——术语滑变与知识建构的跨域底座

修订日志

2026-06-07 R1：首稿。建立四分支谱系（双系统/认知负荷/心智模型/认知偏差），确立”认知底座 vs 设计模式”两层框架，判断主轴=照搬 GUI 假设到概率系统，升级对照 c01/p3xx/0418，对手框架回应 Melnikoff & Bargh 2018 双系统可证伪批评，跨域调度维特根斯坦家族相似辨术语滑变。