p307. Copilot → Autopilot 光谱：AI 控制权分配框架

AI 产品的用户控制权不是”有或无”的二元选择，而是一个连续光谱。理解光谱上的不同位置及其对应的产品形态，是做产品定位决策的关键框架。

3.7.1 五个层级

层级	名称	AI 角色	用户角色	信任需求	典型产品
L0	工具	被动执行用户每一步指令	完全控制	零	计算器、传统搜索
L1	建议者	提供建议，用户决定是否采纳	决策 + 执行	低	Copilot 补全、拼写检查
L2	协作者	起草完整输出，用户审核修改	审核 + 修改	中	ChatGPT、Notion AI 写作
L3	代理人	自主执行多步骤任务，关键节点请示用户	监督 + 审批	高	Cursor Agent、Devin
L4	自治体	完全自主执行，仅在完成后汇报	事后审计	极高	自动化交易系统、CI/CD

注：L3 的”代理人”模式是当前 Agent 产品的主战场（c10 和 m206）。L4 目前仅在错误成本极低、可自动验证的特定领域落地（如代码测试、数据处理）。

错误后果越严重，应越靠近 L0-L1（用户强控制）

这与 m207 §2.4.4 HITL 断点设计框架直接联动——操作可逆性是设置人工干预断点的核心判断维度。

任务越结构化，AI 越有可能可靠地自主执行

原因：开放式任务中，AI 输出的质量无法用自动化手段验证（没有”正确答案”），必须依赖人类的主观判断。强制 L3–L4 自主执行开放式任务，会导致大量用户不满意但没有明确的纠错方式。

专业用户能更好地判断 AI 输出的质量

这也解释了为什么 Cursor（面向开发者）能推 L3 Agent，而医疗 AI 产品仍停在 L1–L2：用户识别错误的能力是决定层级上限的关键因素。

随着 AI 层级提升，用户的核心技能可能因为缺乏练习而退化（见 p301 §3.1.1 自动化悖论）。

设计建议：

成熟的 AI 产品不会把层级固定死，而是根据上下文动态调整。

用户初次使用时默认 L1（仅建议），随着使用时长和反馈数据的积累，逐步解锁 L2–L3 能力：

新用户
  ↓ [使用 1 周，采纳率 > 60%]
解锁：L2 协作者模式（AI 起草完整文档）
  ↓ [使用 1 月，主动纠错率 < 10%]
解锁：L3 代理人模式（AI 自主执行低风险任务）

需要的数据支撑：采纳率、撤销率、人工纠错率、任务完成率——这些指标既是产品质量的衡量（m207 §2.4.5 Agent 评估），也是触发层级升级的依据（p306 数据飞轮）。

同一个 Agent 在低风险操作时 L3 自主执行，遇到高风险操作（涉及金钱、隐私、不可逆操作）自动降级到 L1 请求人工确认：

Agent 执行任务
  → 读取文件    → L3（自动执行）
  → 分析数据    → L3（自动执行）
  → 起草邮件    → L2（展示草稿，用户确认）
  → 发送邮件    → L1（需要用户主动点击发送）
  → 转账付款    → L1+（二次确认 + 短信验证）

模型内部置信度高（校准良好，c13 §13.4 校准问题）时 L2 展示（直接给出答案），置信度低时降级为 L1（给出多个选项让用户选择）：

模型置信度 > 0.9 → 直接展示最优答案（L2）
模型置信度 0.6–0.9 → 展示答案 + 置信度标注
模型置信度 < 0.6 → 展示多个候选让用户选择（L1）

这需要后端将模型的 logprobs 信息传递给前端——一个具体的工程接口需求，PM 需要在产品设计阶段就提出。