p307 - Copilot 到 Autopilot 光谱
p307. Copilot → Autopilot 光谱:AI 控制权分配框架
AI 产品的用户控制权不是”有或无”的二元选择,而是一个连续光谱。理解光谱上的不同位置及其对应的产品形态,是做产品定位决策的关键框架。
3.7.1 五个层级
| 层级 | 名称 | AI 角色 | 用户角色 | 信任需求 | 典型产品 |
|---|---|---|---|---|---|
| L0 | 工具 | 被动执行用户每一步指令 | 完全控制 | 零 | 计算器、传统搜索 |
| L1 | 建议者 | 提供建议,用户决定是否采纳 | 决策 + 执行 | 低 | Copilot 补全、拼写检查 |
| L2 | 协作者 | 起草完整输出,用户审核修改 | 审核 + 修改 | 中 | ChatGPT、Notion AI 写作 |
| L3 | 代理人 | 自主执行多步骤任务,关键节点请示用户 | 监督 + 审批 | 高 | Cursor Agent、Devin |
| L4 | 自治体 | 完全自主执行,仅在完成后汇报 | 事后审计 | 极高 | 自动化交易系统、CI/CD |
注:L3 的”代理人”模式是当前 Agent 产品的主战场(c10 和 m206)。L4 目前仅在错误成本极低、可自动验证的特定领域落地(如代码测试、数据处理)。
3.7.2 层级选择的决策维度
维度一:错误成本
错误后果越严重,应越靠近 L0-L1(用户强控制)
| 错误成本 | 层级建议 | 示例 |
|---|---|---|
| 可逆且无外部影响 | L2–L3 可行 | 文档草稿、代码建议(未部署) |
| 可逆但影响他人 | L3 但关键步骤设确认断点 | 发送草稿邮件(可撤回) |
| 不可逆且影响外部 | L0–L2,必须人工确认 | 发送正式邮件、金融转账、数据库操作 |
这与 m207 §2.4.4 HITL 断点设计框架 直接联动——操作可逆性是设置人工干预断点的核心判断维度。
维度二:任务结构化程度
任务越结构化,AI 越有可能可靠地自主执行
- 高度结构化(填表、格式转换、单元测试生成)→ L3–L4 可行
- 中等结构化(代码实现、报告撰写)→ L2–L3 合适
- 开放式(创意写作、战略规划、价值判断)→ L1–L2 更合适
原因:开放式任务中,AI 输出的质量无法用自动化手段验证(没有”正确答案”),必须依赖人类的主观判断。强制 L3–L4 自主执行开放式任务,会导致大量用户不满意但没有明确的纠错方式。
维度三:用户专业度
专业用户能更好地判断 AI 输出的质量
- 专业用户(工程师审查代码建议、医生审查诊断辅助)→ L2–L3 可行,因为专业用户能发现 AI 的错误
- 非专业用户(普通用户使用医疗 AI、法律建议 AI)→ 更需要 L1,因为他们缺乏识别 AI 错误的能力,幻觉风险被放大
这也解释了为什么 Cursor(面向开发者)能推 L3 Agent,而医疗 AI 产品仍停在 L1–L2:用户识别错误的能力是决定层级上限的关键因素。
自动化悖论的产品设计含义
随着 AI 层级提升,用户的核心技能可能因为缺乏练习而退化(见 p301 §3.1.1 自动化悖论)。
设计建议:
- 在专业技能培养场景(教育、职业培训),有意在 L3 自动化之外保留 L1 练习模式
- 在生产工具场景,让用户选择自己的自动化层级(学习者模式 vs 专家模式)
- 监控用户是否在某些场景完全停止主动参与(可能是过度自动化的信号)
3.7.3 动态升降级
成熟的 AI 产品不会把层级固定死,而是根据上下文动态调整。
基于信任积累的升级
用户初次使用时默认 L1(仅建议),随着使用时长和反馈数据的积累,逐步解锁 L2–L3 能力:
新用户
↓ [使用 1 周,采纳率 > 60%]
解锁:L2 协作者模式(AI 起草完整文档)
↓ [使用 1 月,主动纠错率 < 10%]
解锁:L3 代理人模式(AI 自主执行低风险任务)
需要的数据支撑:采纳率、撤销率、人工纠错率、任务完成率——这些指标既是产品质量的衡量(m207 §2.4.5 Agent 评估),也是触发层级升级的依据(p306 数据飞轮)。
基于风险的动态降级
同一个 Agent 在低风险操作时 L3 自主执行,遇到高风险操作(涉及金钱、隐私、不可逆操作)自动降级到 L1 请求人工确认:
Agent 执行任务
→ 读取文件 → L3(自动执行)
→ 分析数据 → L3(自动执行)
→ 起草邮件 → L2(展示草稿,用户确认)
→ 发送邮件 → L1(需要用户主动点击发送)
→ 转账付款 → L1+(二次确认 + 短信验证)
基于模型置信度调整
模型内部置信度高(校准良好,c13 §13.4 校准问题)时 L2 展示(直接给出答案),置信度低时降级为 L1(给出多个选项让用户选择):
模型置信度 > 0.9 → 直接展示最优答案(L2)
模型置信度 0.6–0.9 → 展示答案 + 置信度标注
模型置信度 < 0.6 → 展示多个候选让用户选择(L1)
这需要后端将模型的 logprobs 信息传递给前端——一个具体的工程接口需求,PM 需要在产品设计阶段就提出。
相关概念卡:Agent 与工具调用、幻觉与校准、Softmax 模块一关联:c10 Agent 可靠性困境、c13 校准问题 模块二关联:m206 Agent 产品化、m207 HITL 断点设计 上一章:p306 数据飞轮 下一章:p308 多模态与脱屏交互