G02 交互认知范式代际演化详解

本节点要解决的问题：G01 HCI 认知范式代际谱系总图给了一张”人机交互的认知范式逐代演化”总图，但总图是压缩视图——它告诉你”有几代”，没告诉你每一代究竟靠哪种代表交互成立、它的认知科学依据是什么、瓶颈卡在认知系统的哪个部件、又是被下一代的什么东西超越的，以及到了 AI 这一代冒出了哪些前几代根本不存在的认知新挑战。本节点把那张图逐代展开，每一代用代表交互 → 认知科学依据（带人物/著作/年份）→ 认知瓶颈 → 被下代超越的具体接口 → AI 时代回看的认知新挑战五件套钉死。

这里要先立一条不可让步的写作纪律：拒绝”一代更比一代认知友好”的线性进步叙事。每一代的”超越”都在降低某一类认知成本的同时，悄悄打开了一个上一代不存在的认知陷阱。命题摆在前面——交互范式演化史不是认知负荷的单调下降史，而是”负荷在 System 1 与 System 2 之间反复转移”的拉锯史。本专题是 p302 - 七种 AI 交互设计模式等设计模式的认知科学底座：p3xx 告诉你”该怎么设计”，本节点告诉你”为什么人脑在每一代界面上都会以特定方式失灵”。

§0 为什么用”认知系统调度”这根轴，而不是”界面技术代际”

读到”交互范式代际演化”，PM 脑子里第一个跳出的框架通常是界面技术史：命令行 → 图形界面 → 触控 → 语音 → 对话式 LUI。这条轴很顺，但它在本专题里会误导，必须先挡掉。

界面技术轴测量的是”输入输出介质换了几次”——它的轴是技术形态。但本专题的核心命题是另一回事：界面真正变的，是它强迫人脑调度哪个认知系统、调度多少。命令行不是”落后的输入方式”，它是一种把全部负荷压给 System 2（有意识、分析性、受工作记忆约束）的契约；对话式界面也不是”自然先进”，它是一种诱导 System 1（快速、自动、启发式信任）抢先接管判断的契约。技术形态相同的两个界面，认知调度可以截然相反；技术形态不同的两代，认知陷阱可以同构。

所以本节点换一根轴：这一代交互，把认知负荷主要压在 System 1 还是 System 2，以及它有没有给用户留出”切换闸”。这个 System 1 / System 2 框架来自 Daniel Kahneman 的 Thinking, Fast and Slow（Farrar, Straus and Giroux, 2011），但术语本身更早由 Keith Stanovich 在 1999 年提出（来源：imotions.com 对双系统理论谱系的梳理；Evans & Stanovich, Perspectives on Psychological Science, 2013）。我用它的核心理由是：它能解释界面技术轴解释不了的事——为什么”更自然、更省力”的对话式界面，反而比生硬的命令行更容易让人接受错误输出。答案是：省的是 System 2 的力，省掉的恰恰是审视。

[!warning] 框架的边界：双系统是隐喻，不是脑区必须当场标注赌注：Kahneman 本人明确警告过，System 1/2 不是大脑里真实的两个独立结构，而是有用的隐喻（来源：imotions.com）。更尖锐的批评来自 David Melnikoff & John Bargh 的《The Mythical Number Two》（Trends in Cognitive Sciences, 2018, DOI:10.1016/j.tics.2018.02.001），核心指控是双系统框架结构上抗反驳——预测失败时总能诉诸”系统间干扰”来解释，因而不可证伪。我在本节点用双系统作为叙事脚手架而非神经学断言；凡能换成更可操作的概念（工作记忆容量、自动化偏差率）处，我都给出后者作为接地。这是本专题第一处显式承担的”我可能错在哪”。

[!note] 与界面技术轴不是替代，是正交界面技术轴是”介质换了什么”的供给侧视角；认知系统调度轴是”人脑被要求做什么”的需求侧视角。一个语音界面如果设计成”念出来就执行”（无确认断点），它对 System 2 的剥夺可以比一个命令行更严重——这正是”代际不等于认知进步”的根因。

§1 第一代：命令行时代——全部负荷压给 System 2

代表交互：CLI、shell 命令、早期编程环境（1970s–1980s）。用户必须凭记忆精确输入语法，机器零容错地执行。这是 Donald Norman 意义上执行鸿沟（gulf of execution）极宽的界面——用户的意图与系统可操作性之间隔着一整本手册（执行鸿沟/评估鸿沟术语首创于 Hutchins, Hollan & Norman, Human-Computer Interaction Vol.1, 1985；书章版见 User-Centered System Design, 1986）。

认知科学依据：命令行把几乎全部认知负荷压在 System 2 与工作记忆上。用户得同时在脑中保持命令语法、参数顺序、当前状态——这正撞上 George Miller 的 7±2 容量上限（“The Magical Number Seven, Plus or Minus Two”, Psychological Review, 1956），甚至撞上 Nelson Cowan 更严格的”约 4±1 个组块”焦点容量（“The magical number 4 in short-term memory”, Behavioral and Brain Sciences, 2001）。命令行的学习曲线陡峭，本质是它要求把大量操作从 System 2 的费力执行，通过反复练习自动化为 System 1 的肌肉记忆（这条”练习→自动化”路径正是 Sweller 认知负荷理论里图式建构的核心，Sweller, Cognitive Science, 1988）。

认知瓶颈：工作记忆被语法记忆占满，留给”我到底想干什么”的资源所剩无几。新手的内在负荷（intrinsic load）与外在负荷（extraneous load，来自语法呈现方式）双高（三类负荷定义见 Sweller, Learning and Instruction, 1994）。瓶颈是可发现性（discoverability）为零——你不知道系统能做什么，除非你已经知道。

被下代超越的具体接口：可见性。当操作从”凭记忆敲出来”变成”在屏幕上看见再点”，System 2 的记忆负荷被外包给了视觉。GUI 用”识别（recognition）替代回忆（recall）“——这是认知心理学最稳的一条原则，也是 Norman 系统意象（system image）思想的直接产品化。

AI 时代回看的认知新挑战：几乎没有。命令行的”笨”豁免了它最致命的认知陷阱——它从不在你形成判断之前替你给答案，因此结构上不存在锚定效应（Tversky & Kahneman, “Judgment under Uncertainty”, Science, 1974）、不存在自动化偏差。命令行执行你的指令，不”建议”你该想什么。这个豁免权，从第三代起被永久丢失。

[!warning] 反例：命令行并非”原始而该被淘汰” 进步主义叙事会说命令行弱爆了。但今天最重度的 AI 用户——工程师——大规模回到了命令行式的 Claude Code、Cursor CLI。原因恰恰是：命令行的高 System 2 负荷在专家手里反转为优势——精确、可复现、零歧义。对已把语法自动化进 System 1 的专家，命令行的”负荷”已不存在，剩下的只有控制力。第一代的认知成本是新手税，不是绝对劣势。

§2 第二代：图形界面时代——用识别替代回忆，把负荷搬给视觉系统

代表交互：WIMP（窗口/图标/菜单/指针）、桌面隐喻、所见即所得编辑器（1984 Macintosh 起进入主流）。用户不再回忆命令，而是在可见选项中识别并点击。

认知科学依据：GUI 的认知红利来自三处。其一，识别 < 回忆——再认所需的工作记忆远低于自由回忆，菜单把”你能做什么”显式摆出，执行鸿沟被大幅压窄（Norman 的核心设计命题）。其二，双通道并行——图标走视觉通道、提示文字走语言通道，按 Baddeley & Hitch 的工作记忆多成分模型（The Psychology of Learning and Motivation, 1974），视空画板与语音环路相对独立，合理的图文搭配可并行利用两条通道而不互相挤占（这正是后来 Mayer 多媒体学习原则的理论根基）。其三，外在负荷可被设计——Sweller 三类负荷里，外在负荷是设计者唯一能直接削减的，GUI 的整个历史就是一部削减外在负荷的工程史。

认知瓶颈：GUI 把负荷从记忆搬到了视觉搜索与选择。当菜单项暴涨，选择本身成了成本——这撞上 Hick 定律（选择时间随选项数对数增长）。“功能臃肿（feature bloat）“的本质是外在负荷反扑：每多一个按钮，都是对所有用户工作记忆的一次小额征税。这一代的认知病灶是评估鸿沟（gulf of evaluation）仍在——你点了，但系统现在到底什么状态、做对了没有，常常要靠你自己解读。

被下代超越的具体接口：表达带宽。GUI 的菜单是有限离散空间——你只能做设计者预先放上去的事。当用户的意图超出菜单格子（“把这段改得更正式但别太僵”），WIMP 就卡死了。触控与移动端先压缩了一轮（直接操作、手势），但真正掀翻 GUI 表达上限的，是自然语言界面（LUI）——把离散菜单换成连续语言空间。

AI 时代回看的认知新挑战：GUI 时代埋下的”识别替代回忆”红利，在 LUI 里被反转回去了——见 §4。GUI 的可发现性是它最大的功绩，而对话框恰恰丢掉了这一功绩，制造了”空白画布综合症”（p303 - 克服空白画布综合症正是为修这个倒退而生）。

[!note] 对手框架回应：GUI 没有过时，它在 AI 时代回来了业界一种声音认为”未来全是对话，GUI 会消失”。接受它对的部分——纯命令式 GUI 确实在让位。标注本专题坚持的边界：GUI 的认知原则（识别>回忆、双通道、外在负荷可控）不会过时，只会被重新封装。最强的 AI 产品（Cursor 的 diff 视图、Perplexity 的来源卡片、生成式 UI）都是”用 LUI 接收意图、用 GUI 呈现结果”的混血——因为结果的审阅离不开 GUI 给视觉系统的低负荷支撑。预测”GUI 消失”的人，混淆了输入范式与输出范式。

§3 第三代：图形直接操作的成熟与”建议者”萌芽——AI 第一次抢在判断之前出现

代表交互：搜索引擎的自动补全、IDE 的 IntelliSense、拼写/语法高亮、推荐系统、GitHub Copilot 早期的 ghost text（2021）。机器开始主动预测并先于用户给出内容——灰色预览文字直接出现在光标后。

认知科学依据：这一代第一次系统性地动用了 System 1。补全建议利用的是人脑的模式补全本能——看见一个高度合理的续写，接受它几乎不耗 System 2。这正是 Kahneman 所说”认知放松（cognitive ease）“：流畅、合理、省力的东西，System 1 默认判为真。Copilot 的 ghost text 是一次精妙的认知设计——它把”生成”伪装成”补全”，让接受一个 AI 产出感觉像在完成自己的想法，而非审阅外来内容。

认知瓶颈：这一代埋下了后两代才爆炸的雷——锚定效应第一次结构性进场。Tversky & Kahneman（1974）证明，一个无关的初始数字都能显著拖拽后续估计（低锚组 25% vs 高锚组 45%，差 20 个百分点）。当 AI 抢在你独立判断前给出一个续写，它就成了锚——你后续的思考是从这个锚出发”调整不足”，而非从零自由生成。瓶颈不再是负荷过高，而是负荷过低导致的审视缺位：建议太省力，省掉的恰是 System 2 的核查。

被下代超越的具体接口：颗粒度与自主性。当 AI 从”补全一行/一个查询”变成”一次产出一整个工件（一封邮件、一个多文件 PR、一份报告）“,逐项的二元接受/拒绝接口直接崩溃——你不可能对 288 行的生成逐行按 Tab。颗粒度一变大，第三代的轻量审阅接口就过载，逼出第四代。

AI 时代回看的认知新挑战：这一代是分水岭。从此**“AI 先于人的独立判断出现”成为常态**，锚定效应与自动化偏差从此内生于交互结构，而非偶发 bug。这正是 p304 - 防御性 UX：对抗延迟与幻觉与 p305 - 信任架构与可解释性设计必须存在的根本理由——它们不是锦上添花，是在修第三代结构性打开的认知漏洞。

[!note] 对手框架回应：建议接受率不是没用，是被错配了增长团队会说”接受率是我们唯一能规模化埋点的信号”。接受它对的部分——接受率作为采纳意愿的代理有效，是 p302 - 七种 AI 交互设计模式数据飞轮的合理输入。标注边界：接受率作为判断质量代理是失效的，因为高接受率既可能是 AI 好，也可能是 System 1 的认知放松在橡皮图章，两者在日志里长得一样。单看接受率，等于给 automation bias 发奖。

§4 第四代：对话式界面（LUI）时代——表达鸿沟被填平，评估鸿沟被撑爆

代表交互：ChatGPT 式对话框、多轮自然语言交互（2022 年底起主流化）。用户用自然语言表达任意意图，AI 用自然语言回应任意内容。

认知科学依据：这是 Norman 双鸿沟框架在 AI 时代最精确的一次扩展。Yuexi Chen 的博士论文（University of Maryland, 2025）系统论证了一个核心悖论：AI 通过自然语言交互缩小了执行鸿沟（用户更容易表达意图），却同时撑大了评估鸿沟——AI 输出可能不准确或不可信，用户难以判断哪些可用（来源：drum.lib.umd.edu, Chen 2025 学位论文）。这是确证的理论扩展，但目前仍是单一来源、待同行评审期刊转化〔以学位论文标注〕。

认知账本上，第四代是一次负荷的偷换：输入端，自然语言把 System 2 的语法负荷降到近零（这是真红利）；但输出端，因为 AI 文本流畅自信，触发 Kahneman 的认知放松，用户默认用 System 1 快速接受——而正确审视一段可能含幻觉的长文本，需要的恰恰是被省掉的 System 2。Dhuliawala et al.（EMNLP 2023, arXiv:2310.13544）的关键发现：高置信但出错（overconfident + wrong）对信任的破坏，远大于低置信但正确；少数几次置信度与准确率不匹配就会严重损害信任，且恢复极慢。

认知瓶颈：评估鸿沟。用户对一个概率性系统建立心智模型，比对确定性系统难得多——这是与 c01 - 认知重构：从确定性系统到概率系统的直接对接。确定性系统出错是异常态，用户可归因为 bug，心智模型保持稳定；概率性系统出错是分布内的正常事件，用户难以归因，心智模型反复失稳（Holstein & Satzger, arXiv:2510.08104, 2025 指出 AI 协作需要领域模型+信息处理模型+互补感知模型三类心智模型共同演化，而传统确定系统只需前两类且稳定）。瓶颈从”我说不清楚”（执行）反转为”我看不出来对不对”（评估）。

被下代超越的具体接口：对话框本身的线性单流。当任务变成长程、多步、需要并行审阅多个中间产物时，单一聊天流成了瓶颈——一切挤在一个时间轴上，违背 Cowan 约 4 个组块的焦点容量。Mohan Reddy（arXiv:2602.00947, 2026）正是采用 Cowan 的 4 块上限为聊天界面的认知过载建模（O = max(0, m − v − W)），据此提出 Generative UI、Infinite Canvas 等突破对话框的设计模式——这指向第五代。

AI 时代回看的认知新挑战：这一代是认知陷阱的密集爆发期。

拟人化扭曲心智模型：Pauketat et al.（CHI 2026, arXiv:2512.09085，7 项研究 N=3076）发现，激活用户对 AI 的”感知意识（sentience）“认知，比激活”自主性”产生更强的道德归因——界面的拟人化设计会系统性扭曲用户对系统真实能力的心智模型。
自动化偏差的奠基与放大：自动化偏差（automation bias）的奠基研究是 Skitka, Mosier & Burdick（International Journal of Human-Computer Studies, 1999）——用户倾向接受自动化建议、折扣矛盾信息。AI 文本把这一偏差放大：医疗场景中，当 LLM 输出含一个错误细节时，幻觉接受相关风险被显著放大（medRxiv 2025）。Beck et al.（arXiv:2509.08514, 2025, N=2,784）更反直觉：要求用户纠错反而降低参与度、提高对错误建议的接受率——纠错的额外认知成本激活了 System 1 的省力策略；且个体对 AI 的态度是绩效最强预测因子，超过人口统计变量，怀疑者检测错误更可靠。

[!warning] failure scenario：本节点”LUI 缩小执行鸿沟”的结论何时失效在用户根本不知道该问什么的冷启动场景，LUI 的执行鸿沟不降反升——空白对话框比一个有菜单的 GUI 更让人无措（这就是 p303 - 克服空白画布综合症处理的”表达焦虑”）。所以”LUI 填平执行鸿沟”只在用户已有明确意图时成立，对探索性、不知道边界的新用户失效。

§5 第五代：Agent 与多界面协作时代——负荷从”审单条”变成”审一群”

代表交互：Agent 自治执行、生成式 UI、Infinite Canvas、多 Agent 协作面板、异步任务 Dashboard（2024 起成形）。AI 不再一问一答，而是接管一段流程、产出大量并行中间物。

认知科学依据：第五代试图用界面设计把第四代撑爆的评估负荷重新压回工作记忆容量内。Reddy（arXiv:2602.00947, 2026）的 Generative UI / Infinite Canvas 正是据 Cowan 4 块上限设计的——把信息切成”任意时刻焦点内 ≤4 个组块”的呈现。这是认知负荷理论里外在负荷削减思想在 Agent 时代的延续。同时它引入了 p305 - 信任架构与可解释性设计的折叠式推理面板、分层透明度（默认只给结论+高确定步骤，进阶用户按需展开）——这是对”透明度悖论”的应对：过度解释本身会造成认知过载（XAI/HCI 研究，arXiv:2508.06352 等）。

认知瓶颈：审阅带宽。当一个 Agent 一次改 12 个文件、或多个 Agent 并行跑，人类的审阅注意力成了绝对瓶颈——这是 p304 - 防御性 UX：对抗延迟与幻觉异步 UI 与置信度外显要解决的问题。更深的病灶是 Lisanne Bainbridge 的”自动化的反讽”（“Ironies of Automation”, Automatica, 1983）在 AI 时代复活：系统越可靠，人越少练习手动审视；一旦系统出错，最需要人接管时，人恰恰最生疏。

被下代超越的具体接口：尚在演化中，无定论。可能的方向是从”人审 Agent 产物”转向”Agent 审 Agent、人只审异常”（confidence-gated 自动执行，只把中等置信区间吐给人——本专题与 p305 - 信任架构与可解释性设计共享这一设计直觉）。但这把人推得离回路更远，加剧 Bainbridge 反讽。

AI 时代回看的认知新挑战：技能退化与习得性无助。这是前四代都不存在、第五代才结构性出现的全新陷阱。Liu et al.（arXiv:2604.04721, 2026, RCT, N=1,222）的关键发现：仅约 10 分钟的 AI 辅助交互后，用户独立执行同类任务时表现显著变差、更易放弃——AI 使人预期”立即得到答案”，剥夺了”自己克服挑战”的练习机会，而持久力（persistence）是技能习得的基础。这与 Seligman（1972/1975）的习得性无助框架行为上吻合（持续依赖 AI → 相信独立思考无效 → 放弃尝试）。

[!warning] confirmation-bias 砍除：别把”技能退化”当成已定论的因果本节点容易顺手把”AI 致技能退化”写成铁律——这是 bias，必须补反例。Liu 2026 是 RCT 证据，但 GitClear（2024，1.53 亿行代码）的代码搅动率翻倍只是相关性观察，非因果；且 Peng et al.（2023, MIT/Copilot 实验）发现 AI 辅助提升初学者学习效率。“习得性无助”类比也有边界：Seligman 的经典机制来自”无法逃脱的厌恶刺激”，而 AI 依赖是正强化驱动（轻松得到答案），机制可能根本不同，需要更精确的理论区分。结论应是”AI 在’替代练习’而非’辅助练习’时才致退化”，而非”AI 必然致退化”。

§6 跨域呼应：从”工具延伸”到”认知殖民”——Bainbridge 与控制论的拷问

把五代演化连起来看，浮现出一个超出认知心理学的问题，需要调度一个 Rick 未必熟、但能逼问本专题盲点的对手框架：Lisanne Bainbridge 的”自动化的反讽”（1983）及其背后的控制论传统。

Bainbridge 的洞见不是”自动化让人变懒”这种道德判断，而是一个结构性悖论：自动化接管的总是常规部分，留给人的总是异常处理——但异常处理恰恰最需要靠常规练习维持的技能。把它接到本专题：第二、四、五代每一次”降低认知负荷”的善意设计，都在系统性地剥夺人维持判断力所需的练习。这意味着认知负荷理论里”削减外在负荷”这条神圣原则，在 AI 时代有一个被忽视的阴暗面——过度削减负荷 = 取消练习 = 长期技能退化。Sweller 削减外在负荷是为了腾出资源给学习；但 AI 削减负荷常常是为了让用户不学也能用，二者目的相反。

这把判断改变了：本专题不能简单地把”低认知负荷”当作设计美德。一个负责任的 AI 交互设计，必须在”省力”与”保留必要的认知摩擦（productive friction）“之间校准——这正是 p305 - 信任架构与可解释性设计里”在工作流中制造减速点、增加主动确认”的认知科学依据。详见 0117社会学对技术与技能关系的讨论与 0114认识论对默会知识的处理。

§7 PM 决策启示

面试：被问”AI 产品的交互设计原则”，别答”自然、简洁、智能”。答这根轴——“每一代界面都在 System 1/2 之间转移负荷，对话式界面最大的风险是它省掉的恰是审视。我的设计目标不是最低认知负荷，是把负荷精确放在该放的系统上”。这一句就把你和背诵 Norman 的人区分开。
选型/设计：评估一个 AI 交互方案，问三件事——(1) 它把负荷压给 System 1 还是 2？(2) 它有没有给用户留切换闸（确认断点/置信度外显）？(3) 它在长期是替代练习还是辅助练习？三问对应锚定、自动化偏差、技能退化三大陷阱。
复现/埋点：别只埋接受率。接受率与”接受后回滚/纠错率”必须配对——单看接受率就是在奖励橡皮图章（见 §3 对手回应）。

§8 与已有节点的关系

对 c01 - 认知重构：从确定性系统到概率系统：深化 + 对话。c01 讲”AI 为什么是概率性的”（认识论前提），本节点讲”这个概率性如何在每一代交互界面上具体造成评估鸿沟与心智模型失稳”（认知后果）。不复述 c01 的范式论证。
对 p302 - 七种 AI 交互设计模式 / p303 - 克服空白画布综合症 / p304 - 防御性 UX：对抗延迟与幻觉 / p305 - 信任架构与可解释性设计：底座 + 溯源。p3xx 是设计模式（怎么做），本节点是它们的认知理论根基（为什么人脑在这里会失灵）。p303 修的是 §4 的执行鸿沟反扑，p304/p305 修的是 §3 起结构性打开的锚定与自动化偏差。不复述 p3xx 的设计清单。
对 0418 审阅瓶颈专题的 A06 自动化偏见与审阅疲劳：升级对照。0418 从”审阅带宽”产业视角谈自动化偏见与认知负荷，本节点从”双系统调度”认知科学视角给它底座——两者是同一现象的产业切面与认知切面，互为补充，不复述对方的产业数据。

§9 关联节点

核心（必读）

延伸（可选）

修订日志

R1（2026-06-07）：首稿。建立”认知系统调度”主轴（替代界面技术轴），五代逐代展开（命令行→GUI→建议者→LUI→Agent），每代钉死五件套；接地 Kahneman 2011 / Miller 1956 / Cowan 2001 / Sweller 1988-1994 / Baddeley&Hitch 1974 / Norman&Hutchins&Hollan 1985 / Tversky&Kahneman 1974 / Skitka 1999 / Bainbridge 1983 / Seligman 1972 等经典，及 Chen 2025 / Dhuliawala 2023 / Pauketat 2026 / Beck 2025 / Liu 2026 / Reddy 2026 等近期实证；加入 Melnikoff&Bargh 2018 双系统不可证伪批评作为框架边界；配齐对手回应（GUI 不会消失、接受率被错配）、failure scenario（LUI 对冷启动失效）、confirmation-bias 砍除（技能退化非定论因果）；跨域调度 Bainbridge 自动化反讽逼问”低负荷=设计美德”的盲点。
2026-06-11 P3.4 校链：0418 审阅瓶颈专题已迁入 04AI，§“跨域呼应”对 0418 A06 的〔跨专题待落盘，0418 仍在 staging〕降级文本恢复为真 0418 总览 双链。