R

p307 - Copilot 到 Autopilot 光谱

创建 2026-05-13 更新 2026-05-16 8 条双链 共创

p307. Copilot → Autopilot 光谱:AI 控制权分配框架

AI 产品的用户控制权不是”有或无”的二元选择,而是一个连续光谱。理解光谱上的不同位置及其对应的产品形态,是做产品定位决策的关键框架。

3.7.1 五个层级

层级名称AI 角色用户角色信任需求典型产品
L0工具被动执行用户每一步指令完全控制计算器、传统搜索
L1建议者提供建议,用户决定是否采纳决策 + 执行Copilot 补全、拼写检查
L2协作者起草完整输出,用户审核修改审核 + 修改ChatGPT、Notion AI 写作
L3代理人自主执行多步骤任务,关键节点请示用户监督 + 审批Cursor Agent、Devin
L4自治体完全自主执行,仅在完成后汇报事后审计极高自动化交易系统、CI/CD

:L3 的”代理人”模式是当前 Agent 产品的主战场(c10m206)。L4 目前仅在错误成本极低、可自动验证的特定领域落地(如代码测试、数据处理)。

3.7.2 层级选择的决策维度

维度一:错误成本

错误后果越严重,应越靠近 L0-L1(用户强控制)

错误成本层级建议示例
可逆且无外部影响L2–L3 可行文档草稿、代码建议(未部署)
可逆但影响他人L3 但关键步骤设确认断点发送草稿邮件(可撤回)
不可逆且影响外部L0–L2,必须人工确认发送正式邮件、金融转账、数据库操作

这与 m207 §2.4.4 HITL 断点设计框架 直接联动——操作可逆性是设置人工干预断点的核心判断维度。

维度二:任务结构化程度

任务越结构化,AI 越有可能可靠地自主执行

  • 高度结构化(填表、格式转换、单元测试生成)→ L3–L4 可行
  • 中等结构化(代码实现、报告撰写)→ L2–L3 合适
  • 开放式(创意写作、战略规划、价值判断)→ L1–L2 更合适

原因:开放式任务中,AI 输出的质量无法用自动化手段验证(没有”正确答案”),必须依赖人类的主观判断。强制 L3–L4 自主执行开放式任务,会导致大量用户不满意但没有明确的纠错方式。

维度三:用户专业度

专业用户能更好地判断 AI 输出的质量

  • 专业用户(工程师审查代码建议、医生审查诊断辅助)→ L2–L3 可行,因为专业用户能发现 AI 的错误
  • 非专业用户(普通用户使用医疗 AI、法律建议 AI)→ 更需要 L1,因为他们缺乏识别 AI 错误的能力,幻觉风险被放大

这也解释了为什么 Cursor(面向开发者)能推 L3 Agent,而医疗 AI 产品仍停在 L1–L2:用户识别错误的能力是决定层级上限的关键因素。

自动化悖论的产品设计含义

随着 AI 层级提升,用户的核心技能可能因为缺乏练习而退化(见 p301 §3.1.1 自动化悖论)。

设计建议

  • 在专业技能培养场景(教育、职业培训),有意在 L3 自动化之外保留 L1 练习模式
  • 在生产工具场景,让用户选择自己的自动化层级(学习者模式 vs 专家模式)
  • 监控用户是否在某些场景完全停止主动参与(可能是过度自动化的信号)

3.7.3 动态升降级

成熟的 AI 产品不会把层级固定死,而是根据上下文动态调整。

基于信任积累的升级

用户初次使用时默认 L1(仅建议),随着使用时长和反馈数据的积累,逐步解锁 L2–L3 能力:

新用户
  ↓ [使用 1 周,采纳率 > 60%]
解锁:L2 协作者模式(AI 起草完整文档)
  ↓ [使用 1 月,主动纠错率 < 10%]
解锁:L3 代理人模式(AI 自主执行低风险任务)

需要的数据支撑:采纳率、撤销率、人工纠错率、任务完成率——这些指标既是产品质量的衡量(m207 §2.4.5 Agent 评估),也是触发层级升级的依据(p306 数据飞轮)。

基于风险的动态降级

同一个 Agent 在低风险操作时 L3 自主执行,遇到高风险操作(涉及金钱、隐私、不可逆操作)自动降级到 L1 请求人工确认:

Agent 执行任务
  → 读取文件    → L3(自动执行)
  → 分析数据    → L3(自动执行)
  → 起草邮件    → L2(展示草稿,用户确认)
  → 发送邮件    → L1(需要用户主动点击发送)
  → 转账付款    → L1+(二次确认 + 短信验证)

基于模型置信度调整

模型内部置信度高(校准良好c13 §13.4 校准问题)时 L2 展示(直接给出答案),置信度低时降级为 L1(给出多个选项让用户选择):

模型置信度 > 0.9 → 直接展示最优答案(L2)
模型置信度 0.6–0.9 → 展示答案 + 置信度标注
模型置信度 < 0.6 → 展示多个候选让用户选择(L1)

这需要后端将模型的 logprobs 信息传递给前端——一个具体的工程接口需求,PM 需要在产品设计阶段就提出。

相关概念卡:Agent 与工具调用幻觉与校准Softmax 模块一关联:c10 Agent 可靠性困境c13 校准问题 模块二关联:m206 Agent 产品化m207 HITL 断点设计 上一章:p306 数据飞轮 下一章:p308 多模态与脱屏交互