A04 注意力分配的隐性算法

与 AI 协作时，人的注意力到底在哪里被消耗？不是”我用了多少 AI”，而是”AI 把我的注意力从哪里挪到了哪里”——本节用注意力调度（attention scheduling）这个框架，主张一个反共识的判断：在 power user 的 AI 工作流里，注意力不是被 AI 节省的，而是被 AI 重新分配的；而且这种再分配遵循一套连本人都未必能口头说清的隐性算法——它可观察、可建模、且是真实瓶颈（接 0418 审阅瓶颈专题的延长线）。把这套隐性算法显式化，正是自我民族志在”AI 使用”这个题材上独一无二的价值。

§0 为什么是”注意力调度”框架，而不是”生产力提升”框架

读者脑中的默认框架是生产力账本：AI 帮我写，所以我省下时间，净产出上升。这个框架在 power user 身上系统性失真，必须先挡掉。

生产力账本把”省下的写作时间”记为收益，却把”省下的时间被注意力转移吃掉”记为零。真实情况是：当生成成本趋近于零，注意力的稀缺性不降反升——因为现在你要审的东西变多了，而审阅几乎无法被 AI 代劳（这是 0418 审阅瓶颈专题的核心命题）。所以正确的会计单位不是”时间”，而是”注意力的去向”。

我选”注意力调度”而非另外两个邻近框架，理由如下：

候选框架	它会怎么描述 AI 协作	为什么不够用
生产力提升（time-saving）	“AI 替我干活，我省时间”	把注意力当成无限资源，看不见审阅瓶颈，对 power user 失真最严重
认知卸载（cognitive offloading）	“我把记忆/计算外包给 AI”	只描述”卸载什么”，不描述”卸载后注意力流向哪”——缺少调度维度
注意力调度（本节）	“AI 改变了我注意力在生成/审阅/重导三态之间的分配比例与切换频率”	把注意力当成有限、可被调度、有切换成本的资源——能解释审阅为何成为瓶颈，且可建模

“注意力调度”是操作系统的隐喻：CPU（你的注意力）是单核的、可抢占的，AI 是一堆并发进程不断抛出待处理的中断（生成结果、待审 diff、偏题输出）。问题不是 CPU 算得快不快，而是调度策略对不对、上下文切换贵不贵。 这正是 power user 与普通用户的真正分野——普通用户被 AI 的中断牵着走，power user 在设计自己的调度器。

§1 三态模型：生成 / 审阅 / 重导

把 AI 协作中的注意力拆成三个互斥状态，是本节的最小建模单元：

stateDiagram-v2
    [*] --> 生成: 发起/委托
    生成 --> 审阅: AI 产出
    审阅 --> 重导: 判定偏离
    审阅 --> 生成: 判定可用, 发起下一段
    重导 --> 生成: 修正约束后重发
    审阅 --> [*]: 接受并落盘

生成态（Generation）：注意力在”如何让 AI 产出我要的东西”——写 prompt、设约束、调度 skill。成本特征：前置投入高（设计指令），但单位产出的边际注意力低。
审阅态（Review）：注意力在”AI 产出对不对、好不好、要不要”。成本特征：几乎无法委托、与产出量成正比、是真实瓶颈。这是 0418 审阅瓶颈专题锚定的状态。
重导态（Redirect）：注意力在”AI 偏了，我怎么把它拉回来”——诊断偏离原因、修补约束、决定是局部修还是推倒重来。成本特征：切换成本最高，因为它要求同时持有”我原本要什么”和”AI 实际给了什么”两个表征做 diff。

判断密度落点：三态中，只有生成态的成本被 AI 显著降低；审阅态成本随产出量线性上升；重导态成本几乎不变甚至上升（因为更强的模型产出更”像对的”，诊断偏离更难）。这就解释了一个反直觉现象——AI 越强，注意力越累。这与 Parasuraman & Manzey（2010, Human Factors, “Complacency and Bias in Human Use of Automation”）描述的自动化情境一脉相承：自动化降低了执行成本，却把人的负担转移到了监督上，而监督是注意力密集的。

§2 隐性算法：可观察的调度规则

“隐性算法”不是比喻噱头，而是一个可证伪的主张：power user 的注意力调度遵循稳定的、可从行为中反推的规则，即便本人未必能口头陈述。 这正是 Polanyi 意义上的默会知识——“我们知道的比我们能说出的多”（参见 Polanyi 默会知识与提示工程的认识论张力）。自我民族志的任务，就是把这套调度器从行为里逆向工程出来。

从 Rick 本工厂项目（0412-0423，本身就是一个可观察的 meta-case）的真实产物里，可以反推出至少四条候选调度规则：

候选规则	可观察证据（本工厂/vault 真实产物）	待 Rick 内省验证的部分
R1 沙盒优先于审阅：把审阅推迟到”批量产出落定后”再集中进行，而非逐条实时审	vault CLAUDE.md 原则四”三步 ingestion”：AI 产出一律先入 `_ai_review/` 沙盒，Rick 审后才 move（见 PKM 设计哲学与演化史）	集中审 vs 实时审的主观体感差异，是注意力策略还是仅是流程产物？
R2 元层干预优于实例级修补：注意力优先投向”改 prompt/记忆/架构”这类一次投入、长期复用的杠杆点，而非逐条改输出	过拟合诊断用 ML 术语做元层干预（AI 记忆过拟合与泛化能力）；memory 从 blocklist → allowlist 的治理转型（Claude routines 调研与 memory allowlist 设计）	何时选择”修这一条”vs”改生成器”？这个开关的触发条件是什么？
R3 over-design 自检：注意力会周期性地从”建设”切到”审视自己建的东西是不是太多了”	12-agent → v1.4 主动塌缩，A/B/C/D 判别框架（见 PKM 设计哲学与演化史）；trip-structure skill 的 over-design → 收敛轨迹（trip-structure skill）	这种自检是定期触发、阈值触发，还是疲劳触发？
R4 现场即问的注意力前移：在田野现场把 AI 当作”即时分析器”，把本该事后做的审阅/分析压到现场	0412-0423 旅途中实时调度 trip-discover / intellectual-lens，现场对话直接产出升格笔记（如 NMAAHC 深度导览与 AI 表达元批评）	现场即问是否改变了旅行/田野体验的深度或方向感？

[!warning] 接地纪律上表左栏（证据）是文件、对话、时间戳可查的可观察行为；右栏是需要 Rick 内省才能确认的主观调度依据。本节绝不替 Rick 编造右栏的内容——把它显式留为待填，正是自我民族志的诚实做法（不把研究者的内省伪装成已知事实）。

〔Rick 待填：上面四条候选规则，哪些是你真实的调度习惯，哪些是 agent 从产物里过度归纳的”假规则”？请就每条标注”成立/部分成立/不成立”，并补一句你实际的决策依据。〕

§3 切换成本：调度器最贵的隐藏开销

三态模型最容易被忽略的是态与态之间的切换成本。注意力不是无损切换的：从”生成态”切到”审阅态”，要把脑子从”我想要什么”切换到”它给了什么”；这是两种几乎相反的认知姿态（发散 vs 收敛、创造 vs 批判）。

操作系统里，上下文切换要保存/恢复寄存器；人的注意力切换要保存/恢复”意图表征”。频繁的小批次交互（生成一段、审一段、再生成）= 高频上下文切换 = 寄存器反复存取的开销，可能吃掉所有”生成提速”的收益。这给出一个可操作的设计原则，也解释了为何 R1（沙盒优先、批量审阅）是理性的：批处理（batch）优于交互式（interactive），因为它摊薄了切换成本。 vault 的”三步 ingestion”在事后看，正是一个降低注意力切换频率的调度优化——无论 Rick 当初是否如此自觉。

判断主轴在此显形：90% 的 AI 协作低效，不在生成质量，而在切换调度上的三个错位——

症状	为什么会错	正确做法	真实反例
每生成一小段就立刻审，全程在两态间高频跳	误以为”及时审”=高质量；实则切换成本吃掉收益，且每次审都是浅审	攒成批，进入”审阅模式”一次性深审（R1 沙盒优先）	三步 ingestion：先批量入 `_ai_review/`，再集中审（PKM 设计哲学与演化史）
输出偏了就在审阅态里”手动改成对的”	把重导误当审阅，注意力耗在缝补单个产物，不改生成器	切到重导态，诊断偏离的结构性原因，改 prompt/约束/记忆（R2）	过拟合诊断：不改单条输出，改记忆解耦”偏好”与”审美”（AI 记忆过拟合与泛化能力）
持续扩建 AI 协作系统，从不回看是否过度工程	缺少”审视建设本身”的元态，调度器只有建设没有自检	周期性触发 over-design 自检（R3），按”是否需要独立 context 隔离”裁剪	12-agent → 5 sub-agent + 6 skill 的 v1.4 塌缩

§4 产品 PM 视角补盲：调度器是可设计的产品界面

跳出”工程效率”视角，注意力调度有三个产品层的”看走眼”点：

用户心理模型错位：大多数 AI 产品的交互设计默认”交互式聊天”，把用户钉死在高频切换的小批次模式里。这对 power user 是反优化的——他们需要的是 batch 友好的界面（沙盒、暂存区、批量审阅视图）。Obsidian + _ai_review/ 沙盒之所以好用，恰恰因为它无意中提供了一个 batch 调度容器。产品机会：为”注意力批处理”而非”对话流畅度”设计的 AI 工作台。
审阅成本的不可见性：产品仪表盘普遍统计”生成了多少 token / 节省了多少时间”，几乎没有产品统计”用户在审阅上花了多少注意力”。这制造了一个度量盲区——把成本最高的状态当成零成本。Anthropic 对百万级 Claude 对话的隐私保护分析、OpenRouter（2026）对逾百万亿 token 交互的分析（来源：OpenRouter “State of AI” 报告），都偏重生成侧的量化，审阅侧的注意力消耗在行为日志里几乎是不可见的——这正是 usage log 分析的已知局限：日志记录行为，不记录审阅时的认知负荷与意图。
合规与责任边界：当注意力从生成滑向”接受”，责任归属变得模糊。三步 ingestion 的沙盒隔离（AI 写权限不直接污染主区）在产品层是一种责任分配机制——它强制审阅态发生，把”接受”变成一个显式动作而非默认行为。这对任何高 stakes 的 AI-augmented 工作流都是可迁移的设计模式。

§5 对手框架回应：extended mind 与”注意力本就是分布式的”

最强的反方来自认知哲学的 extended mind 论题（Clark & Chalmers, 1998, “The Extended Mind”, Analysis, 58(1)）。其主张：认知过程本就不局限于颅内，工具（笔记本、计算器、乃至 AI）在满足某些条件时是认知系统的真正组成部分，而非外部辅助。按此立场，“注意力在我和 AI 之间分配”是个伪问题——根本没有一条清晰的”我/AI”边界，注意力本就是分布在人-工具耦合系统里的。

[!note] 接受 + 边界 接受的部分：extended mind 的洞察是对的——把 AI 当成”外部工具”而非”认知系统的一部分”，会低估耦合之深。Rick 的 skill 设计（把 procedural knowledge 文档化封装进 Skill 系统的本质）正是在主动地把认知功能外置到耦合系统里，这是 extended mind 的活样本。 坚持的边界：但 extended mind 化解不掉审阅瓶颈。即便认知是分布式的，“判断 AI 产出对不对”这个功能至今无法外置——它必须由人的注意力承担（否则就是让 AI 审 AI，循环论证）。Clark & Chalmers 的”对等原则”（parity principle）要求外置部分与内部部分功能对等，而审阅恰恰是那个不对等的功能：你可以把记忆、计算、生成外包给耦合系统，但把”信任校准”（trust calibration, Lee & See, 2004, Human Factors）外包出去，就等于放弃了调度权。所以注意力分配不是伪问题，而是耦合系统里唯一不能被进一步分布出去的那个核。 我赌的是什么：我赌”审阅这一态在可见未来不可委托”。如果出现了可信的”AI 审 AI 且人能验证元规则”的机制（amplified oversight 方向，参见 Jain, Bridgers, Janzer et al., 2025, arXiv:2510.26518 “Human-AI Complementarity: A Goal for Amplified Oversight”，DeepMind Safety Research），这个赌注会部分失效——届时注意力会从”逐条审”上移到”审审阅规则”，三态模型需要加一个”元审阅态”（Jain, Bridgers, Janzer et al. 2025 的实证发现支持这一方向：组合人类与 AI 评分优于任一单独方案，但呈现方式不当会诱发过度依赖）。

failure scenario：三态模型在”低 stakes、可丢弃产出”场景下会失真——比如用 AI 头脑风暴一次性创意，审阅态可以坍缩到近乎零（反正都是草稿）。此时注意力调度退化为纯生成态，本节的瓶颈论不成立。

§6 跨域呼应：从 extended mind 到注意力的政治经济学

承上节，extended mind 给了本节最关键的认识论升级：它把”注意力分配”从一个人因工程问题，重构成一个”认知系统边界在哪里”的哲学问题。 一旦承认 AI 是认知系统的一部分，“注意力的隐性算法”就不再是”人如何使用工具”，而是”分布式认知系统如何调度它唯一的串行瓶颈资源”——这个重构直接改变了我们对 R1-R4 的解读：它们不是 Rick 的个人习惯，而是任何深度人-AI 耦合系统都会演化出的调度策略，Rick 只是把它显式化得比别人早。

再叠一层社会学视角（链入 0117社会学）：注意力是稀缺资源，谁定义”什么值得审”就掌握了权力。AI 通过决定”先生成什么、怎么呈现待审项”，实际上在为人的注意力排序——这是一种隐性的议程设置。Rick 的 memory allowlist 治理（Claude routines 调研与 memory allowlist 设计）从这个角度看，是一次夺回注意力议程权的行动：通过控制 AI 记住什么，控制 AI 会把什么推到审阅队列的前面。这就是为什么”调度器是谁设计的”是个权力问题，而不只是效率问题。

§7 PM 决策启示

面试怎么用：当被问”AI 会不会取代 PM”，不要答”不会，因为创造力”。答：“AI 把成本从生成转移到了审阅与重导，而这两态恰恰是 PM 的核心——判断什么值得做、把跑偏的方向拉回来。AI 越强，这两态越值钱。“（带框架、带反直觉判断）
选型怎么用：评估 AI 工具时，别只比生成质量，要问”它的交互模式是 batch 友好还是 interactive 强制”。一个强制高频切换的工具，对 power user 是负优化。把 §3 的切换成本表当作选型 checklist。
复现怎么用：搭自己的 AI 工作流时，第一优先级不是接最强的模型，而是建一个降低注意力切换频率的调度容器（沙盒 + 批量审阅 + 元层干预入口）——即把 R1/R2 工程化。vault 的三步 ingestion 是一个可抄的最小模板。

§8 与已有节点的关系

对 0418 审阅瓶颈专题：深化。0418 锚定”审阅是瓶颈”这一事实；本节点把它放进”生成/审阅/重导”三态模型里，给出瓶颈的结构性位置与可建模的调度规则，并把 Rick 的审阅行为列为该命题的一手数据来源。不复述 0418 的瓶颈论证。
对 Polanyi 默会知识与提示工程的认识论张力：对话。Polanyi 节点讲”提示工程是把默会知识显式化的尝试”；本节点把同一认识论张力用到注意力调度上——隐性算法正是注意力层面的默会知识，自我民族志是它的显式化工具。
对 0414 Claude Code 体感专题（邻接专题，尚未在 vault 落成可链接的 synthesis 节点）：对照升级。0414 是 Rick 使用 Claude Code 的一手体感记录；本节点把那种”体感”抽象成可建模的三态调度，体感是数据，三态模型是从数据里逆向出的结构。
对 0422 民族志方法专题（邻接专题，尚未在 vault 落成可链接的 synthesis 节点）：方法论对接。0422 给出民族志/自我民族志的方法学基础（厚描述、反身性、Anderson 2006 分析式五特征）；本节点是该方法在”注意力”这一具体对象上的一次落地，R1-R4 的”可观察证据 + 待填内省”结构正是分析式自我民族志”完整成员研究者 + 分析性反身性”的实操。
对 Skill 系统的本质：补缺。Skill 节点讲”为什么要把能力封装成 skill”；本节点补上”封装 skill 是一种把注意力从重导态前移到生成态的调度优化”这一注意力会计视角。

§9 关联节点

核心（必读）

0418 审阅瓶颈专题 — 本节点的事实锚，审阅为何是真实瓶颈
Polanyi 默会知识与提示工程的认识论张力 — 隐性算法的认识论基础
0422 民族志方法专题（邻接专题，待落库）— 把隐性算法显式化的方法学
Skill 系统的本质 — 封装作为注意力调度优化
PKM 设计哲学与演化史 — 三步 ingestion / over-design 自检的一手史料

延伸（可选）

0414 Claude Code 体感专题（邻接专题，待落库）— 注意力体感的一手数据
AI 记忆过拟合与泛化能力 — R2 元层干预的真实案例
Claude routines 调研与 memory allowlist 设计 — 注意力议程权的夺回
trip-structure skill — R3 over-design 自检的微观轨迹
NMAAHC 深度导览与 AI 表达元批评 — R4 现场即问的产物证据
AI PM 知识图谱·总索引 — 回到知识图谱主入口

修订日志

R0（2026-06-07）：首稿。建立”生成/审阅/重导”三态模型 + 隐性算法四规则（R1-R4，可观察证据 + Rick 待填内省）；判断主轴落在切换成本三错位；对手框架接入 extended mind（Clark & Chalmers 1998，接受+边界+赌注）；跨域呼应 extended mind → 注意力政治经济学；与 0418/0422/0414/Polanyi/Skill 五节点显式升级对照。已核实：Jain, Bridgers, Janzer et al. 2025 arXiv:2510.26518（WebFetch 验证，DeepMind Safety Research）。待 Rick 填项 1 处（§2 四规则的真伪标注）。