R

G01 Rick 的 AI 使用代际演化总图

创建 2026-06-07 更新 2026-06-11 0 条双链 自我民族志 专题 AI 整理

G01 Rick 的 AI 使用代际演化总图

一个极端 power user 的 AI 使用方式,在不到一年里从”向 chatbot 问问题”演化到”设计一座多 agent 知识生产工厂”——本节点要回答的问题是:这串代际跃迁,到底是工具更强了,还是使用者的能力结构变了? 框架是一句反共识的判断主轴:使用代际的每一次跃迁,映射的不是模型能力的跃迁,而是使用者”把什么外包给 AI”这一委托边界的重划。 本节点是 0423 自我民族志专题的纵向总图(synthesis),用 Rick 自己的 vault 真实产物(skill 设计史、memory 治理档案、协作架构演化)+ 本次专题工厂(0412–0423 的多 agent 知识生产)作为可观察的 meta-case,给后续各分代节点提供时间骨架。

[!warning] 接地纪律(本节点的认识论底线) 本图只敢断言可观察的东西:文件、对话存档、时间戳、skill 的迭代轨迹、本工厂的运作结构。凡需要 Rick 内省才能确证的——信任校准、注意力分配、“那一刻在想什么”——一律留 〔Rick 待填〕 结构化模板,绝不替他编造。这正是分析式自我民族志(Anderson 2006)的诚实要求:研究者是完整成员(CMR),但反身性不等于代替自己的过去发言。


§0 为什么是”委托边界”这个框架,而不是”能力进步史”

写代际演化最容易掉进的坑,是写成”GPT-3.5 → Claude Opus 一代更比一代强、所以 Rick 用得越来越深”的线性进步史(宪章 §7 明令禁止)。这个框架是错的,原因有三:

  1. 它把因果搞反了。 模型变强是行业的外生变量,对所有用户一视同仁;但绝大多数用户停在”chatbot 问答”层,模型再强也不会自动把他们推到”设计 multi-agent 工厂”。代际跃迁的真正驱动,是使用者愿意把哪一类认知劳动委托出去——这是内生于使用者的能力结构,不是外生于模型的参数量。
  2. 它无法解释塌缩。 2026-05-21 Rick 主动把 12-agent 架构塌缩为 5 sub-agent + 6 skill(v1.3→v1.4,可观察)。如果代际是”越复杂越先进”,塌缩就是退步。但在委托边界框架里,塌缩是判断力的进步:他学会了识别”哪些委托是真需要 context 隔离的,哪些是 over-engineering”。
  3. 它遮蔽了能力的可证伪性。 “更强”无法证伪;“委托边界右移”可以——你可以指出某次跃迁后 Rick 反而收回了委托(如过拟合诊断后要求 AI 删记忆),这正是边界在双向移动的证据。

所以本图的纵轴不是”模型能力”,而是委托深度:从”委托一次问答”→“委托一段流程的执行”→“委托一个角色的判断”→“委托一整条流水线的协调”。横轴是时间。每一代的标志,是一类新的认知劳动被划进委托圈——同时往往有一类旧委托被收回。


§1 五代谱系:可观察的轨迹

下表是本专题各分代节点的索引骨架。每一代的”标志产物”均为 vault 中可直接 Read 的真实文件或对话存档(日期戳可查);每一代的”委托了什么/收回了什么”是基于产物的分析;“〔Rick 待填〕“是需要他内省补的体感。

代际近似时间窗委托深度标志性可观察产物(vault 实据)新委托出去的认知劳动同期收回/约束的委托
G0 chatbot 问答~2023–2024〔Rick 待填起点〕单次问答〔Rick 待填:最早的对话存档日期〕信息检索、解释、草稿(尚无元层约束)
G1 prompt 工程~2026-03 起可考单次产出的质量控制20260305-AI产品经理知识图谱框架设计:两次主动改写 prompt 约束(撤数量上限保完备;把”PM 视角”具化为”当你面对 X 决策时”场景题)“如何提问”本身拒绝知识复述,强制挂钩产品判断
G2 skill 生态2026-03-31 ~ 04-05一段可复用流程的执行trip 五件套(discover/evaluate/macro/structure/qa)系统设计(20260401-行程规划-Skill-系统设计);trip-structure skill over-design→收敛(2026-04-03,skill-creator 元 skill 重写);intellectual-lens skill 竞品输出对照法迭代(2026-04-05)procedural knowledge 的封装与触发对 skill 自身做 over-design 检验(trip-structure 被拉回)
G3 记忆系统2026-03-23 ~ 05-13跨会话的状态与偏好治理过拟合诊断两轮干预(20260323-避免记忆过拟合保持泛化能力);blocklist→allowlist 转型 + 反向删旧记忆(20260513-Claude-routines-调研与-memory对话归档设计长期上下文的维护主动收回:要求 AI 删除排除式记忆条目;“泛化≠平均化”约束审美基底
G4 多 agent 工厂2026-04-12 ~ 04-23 及之后一整条知识生产流水线的协调本专题工厂(0412–0423):旅途现场触发 AI 对话→存档(99Archive/9910 claude 对话存档/,20260412–20260423 约 40+ 条)→SABCD 评级→升格为 ~40 个节点(美国史 + 旅行两类);架构演化 8→11→12 角色 v1.3(2026-05-18)→塌缩 5 sub-agent+6 skill v1.4(2026-05-21,A/B/C/D 判别框架)角色分工、并行度、流水线编排主动收回:12-agent over-engineering 自我挑战,只保留真需 context 隔离者为 agent

[!note] 一个用 ML 术语做元层提示的细节 G3 最值得记的不是”用了记忆功能”,而是 Rick 用过拟合/泛化这对机器学习术语,作为操作语对 AI 做元层干预(2026-03-23 档案可查)。这是 power user 的标志:他不在 object level 调输出,而在 meta level 调 AI 对他的模型。委托边界框架在这里有了具体证据——他委托 AI 维护长期偏好,又警觉到这份委托会让 AI”过拟合”他的旧审美,于是反向收回部分委托。委托与收回是同一动作的两面。


§2 当下位置:G4 不是终点,是一次”塌缩后的再扩张”

Rick 现在站在 G4 内部一个特定位置:经历过一次膨胀(12 agent)并主动塌缩(v1.4)之后的再设计期。 这个位置的判断特征,是他已经能对”AI 协作架构本身”运用 over-design 检验——这正是 G2 时期对单个 skill(trip-structure)做过的事,在 G4 升格到了整座架构的尺度。能力在沿着同一条”识别过度工程”的轴重复出现,但作用对象的抽象层每代抬高一级:G2 检验一个 skill,G4 检验一个 agent 班子。这是”使用代际跃迁映射能力跃迁”最硬的一处可观察证据——同一种判断力,在更高抽象层上复用。

[!warning] 这里必须留白,不能编造 G4 的主观体感——“write-first 多 agent 流水线”运行时的决策感、塌缩决策到底是认知疲劳/架构美感/还是纯效率驱动——文件里看不到。

〔Rick 待填:v1.3→v1.4 塌缩那一刻,你的真实驱动是什么?是觉得 12 个 agent 维护太累(疲劳),还是觉得它”不对称、不优雅”(美感),还是算过 token/延迟账(效率)?三者占比?〕

〔Rick 待填:write-first(旅途先产原始对话、回来再批量 pipeline 处理)相比实时逐条处理,认知负担上有没有可感差异?〕


§3 判断主轴:5 个 90% 的人会在代际叙事里搞错的点

这是区分”PM 顶刊”与”成长故事流水账”的命门。每点带 症状 → 为什么会错 → 正确做法 → 真实反例。

错位 1:把”用了更强的模型”当成”进入了更高代际”。

  • 症状:因为换了 Opus 4.x 就觉得自己升级了。
  • 为什么会错:模型能力是外生的、对所有人相同;代际是使用者委托边界的内生变化(§0)。
  • 正确做法:问”我这次比上次多委托/收回了哪类认知劳动?”
  • 真实反例:G3 的 allowlist 转型发生时,模型没换代,变的是 Rick 对记忆委托的治理结构(2026-05-13 档案)。

错位 2:把代际读成单调递增的进步史。

  • 症状:默认 G4 > G3 > … > G0,越后越好。
  • 为什么会错:v1.4 塌缩证明”更复杂”常是退步;委托边界是双向移动的。
  • 正确做法:每一代都标注它收回了什么委托(见 §1 表最后一列)。
  • 真实反例:G4 的 12→5 agent 塌缩(2026-05-21);G3 的反向删记忆。

错位 3:把可观察的产物当成内省的证据。

  • 症状:看到”Rick 设计了 5 个 skill”就推断”Rick 信任 skill 多过手动”。
  • 为什么会错:产物证明做过什么,不证明感受/动机。混淆二者是自我民族志最常见的造假(Anderson 2006 的 narrative visibility 要求研究者可见,但不许编造)。
  • 正确做法:可观察的如实分析,内省的留 〔Rick 待填〕
  • 真实反例:本图全篇——凡涉及信任/注意力/动机处,一律留白。

错位 4:把”设计了某 skill/架构”等同于”在用它”。

  • 症状:把 AI PM 知识图谱框架设计完成,就算它在指导学习决策。
  • 为什么会错:设计史可观察,使用频率与弃用情况文件里不全可见。
  • 正确做法:分开记”设计事件”与”使用事件”,后者多需 Rick 补。
  • 真实反例:〔Rick 待填:AI PM 知识图谱框架设计完后,是否真的用于学习决策,还是停在设计层?哪些 trip skill 旅行中高频触发、哪些实际被弃用?〕

错位 5:把单一案例(Rick)的代际路径当成普适路线图。

  • 症状:“所有人都会从 chatbot 走到 multi-agent 工厂”。
  • 为什么会错:Rick 是极端 power user / lead user(von Hippel 1986:需求超前、能从自造解决方案获益),其路径恰恰因不可代表而有研究价值,不是因可推广。
  • 正确做法:声明”个案 ≠ 普遍规律”,把价值定位在揭示一种可能的能力演化机制,而非统计常态。
  • 真实反例:Chatterji 等(NBER w34255, 2025《How People Use ChatGPT》)发现 70% 的消费端使用与工作无关、停在轻量问答层——绝大多数用户根本不会离开 G0/G1。

§4 产品 PM 视角补盲:代际图的三个非工程盲点

工程视角只看”委托了什么劳动”。PM 视角必须补三个看走眼的点:

  1. 用户心理模型:G0→G1 的跨越,对绝大多数用户卡在”不知道可以对 AI 提元层要求”。Rick 之所以早早跳过,是因为他有 PM 的”需求重述”习惯(撤数量上限、把视角具化为场景题)。产品启示:让普通用户进入 G1 的,不是更强模型,而是把”如何提问”显性化的脚手架(如建议性 prompt、追问引导)。
  2. 委托的信任成本曲线:每深一代,用户要让渡的控制权更多(G4 让 agent 自己跑流水线)。但信任不是免费的——Rick 在 vault CLAUDE.md 原则四里设计了三步 ingestion 沙盒(AI 产出先入 _ai_review/,审阅后才 move),本质是用流程把”高委托”的风险关进笼子。产品启示:高自动化产品的采纳瓶颈不是能力,是”出错可回滚”的护栏设计。
  3. 脱技能化的商业边界:G3/G4 越往深委托,越逼近”认知卸载是否=技能萎缩”的开放争议(Kim 2026《Consumer Psychology Review》综述;arXiv:2601.17055 三波纵向研究称高难任务独立解题信心随 AI 使用下降〔该具体效应仍属早期证据,需审慎〕)。产品启示:power-user 工具的长期留存,要平衡”替你做”与”让你仍会做”。

§5 对手框架回应:接受 + 边界

对手立场一:Delamont(加的夫大学,2007/2012)——自我民族志缺乏学术严谨,是 navel-gazing(自我沉溺)。 接受她对的部分:本图研究对象就是作者本人,确实存在自我美化、把偶然路径叙述成必然演化的风险。坚持的边界:本图把可证伪性焊在结构里——所有代际标志都是第三方可 Read 的 vault 文件与时间戳,不是回忆;所有内省一律留白不编造。这不是 navel-gazing,是 Anderson(2006)意义上的分析式自我民族志:完整成员(CMR)+ 分析性反身性 + 致力于可迁移的理论(委托边界框架)。赌注:如果有人查证某条对话存档不存在或日期对不上,本图该条作废。

对手立场二:von Hippel 的 lead user 方法批评(Franke & Lüthje 2020)——极少数领先用户的路径代表性存疑,忽视沉默大多数。 接受:完全成立。Rick 的五代路径绝不能外推成普适路线图(见错位 5)。边界:本图的价值主张从不是”代表性”,而是”前沿可能性”——lead user 的意义正在于他先于市场遭遇并自造解决方案,提供的是机制样本而非分布样本。把它当统计常态用是误用;当作”高委托使用在能力上需要什么前提条件”的探针用,是正用。

Rick 未读对手框架引入(破 echo chamber):

  • Leon Anderson 的分析式 vs Ellis/Bochner 的唤起式之争:本图刻意选了 Anderson 的分析式路线(要理论、要可迁移),而非 Ellis 的唤起式(要情感共鸣、verisimilitude 栩栩如生为效度)。这是个赌注——若读者觉得本图”只有框架没有温度、读不到 Rick 这个人”,那是分析式路线的代价,也是 Ellis 会打的点。本图接受这个代价:在一座以判断密度为验收线的知识库里,分析式优先。
  • Parasuraman & Manzey(2010)automation complacency:他们证明过度依赖自动化连训练和指令都消不掉。这逼问本图一个盲点——Rick 设计 ingestion 沙盒(§4),是否也只是”看起来在防过度依赖”的姿态,实际审阅时仍会 complacent 地放行 AI 产出?〔Rick 待填:SABCD 评级 14 条 S 级 vs 182 条 C 级时,你的判断依据是什么?审阅 AI 产出时,有没有”懒得细看就放行”的时刻?〕

failure scenario 显式标注:

  • 本图”委托边界右移=能力跃迁”的结论,在委托是被动跟随而非主动判断的场景下失效:如果 Rick 用 multi-agent 只因为它是新潮流(而非判断出需要 context 隔离),那 G4 就不是能力跃迁,只是 hype 跟风。区分二者的唯一证据是塌缩——他主动塌缩过,所以本图判断它是主动的。但这条证据不能保证未来每次扩张都是主动的。

confirmation-bias 砍除:

  • 本图早期叙事天然偏向把每一代写成”Rick 越来越牛”。砍除:必须并列收回的委托(删记忆、塌缩 agent),并承认 G0→G1 的早期路径基本不可考、只能靠〔Rick 待填〕,不能为了叙事完整而编造一个漂亮的起点。

§6 跨域呼应:Polanyi 默会知识与”委托边界”的认识论张力

调度 Polanyi 默会知识与提示工程的认识论张力。Polanyi 的核心命题是”我们知道的,多于我们能说出的”(tacit knowing)。这对本图的”委托边界”框架是一记直接拷问:Rick 能委托给 AI 的,恰恰是他能显式化(articulate)的那部分认知劳动;他无法显式化的默会判断,理论上无法被委托。

这改变了对代际跃迁的判断:每一代委托边界右移,本质是 Rick 把一块原本默会的判断显式化为可执行的规则(skill 的 procedural knowledge 封装、memory 的 allowlist 规则、agent 的 A/B/C/D 判别框架)。所以代际演化的真正引擎,不是”AI 更强”,而是使用者把自己的默会知识不断外化为可委托的形式——这与 Skill 系统的本质 完全咬合:skill 就是默会流程的显式化容器。

但张力在于:Polanyi 警告,强行把默会知识全部显式化会损毁知识本身(拆解一张脸的每个特征反而认不出这张脸)。这给本图一个边界——G4 的高度自动化,可能正在逼近”把不该显式化的判断也外包出去”的危险区。这正是 §4 第 3 点脱技能化争议的认识论根源。〔Rick 待填:有没有某类判断,你试过写成 skill/rule 却发现写出来就走样、最后宁可手动做?那就是你的默会知识在抵抗显式化。〕


§7 PM 决策启示:面试 / 选型 / 复现三类落地

  • 面试桌:被问”你怎么用 AI”时,不答”我用得很熟”,答委托边界框架——“我把 AI 使用拆成五代,判断一个人/团队在哪一代,看他主动委托和主动收回了哪类认知劳动,而不是看他用什么模型。” 30 秒展示一个可证伪的判断框架,而非工具清单。
  • 选型会:评估一个 AI 工具/平台时,问”它支持哪一代的委托?“——只支持 G0/G1(聊天框)的工具,对 power user 是天花板;支持 G3/G4(持久记忆、agent 编排)的,才值得为高委托付费。但要配 §4 第 2 点的护栏检验:高委托无回滚 = 不可采纳。
  • 复现台:要把自己从 G1 推到 G2/G3,复现路径不是”等更强模型”,而是”找一个反复做的流程,把它显式化为 skill”(§6 Polanyi)。这是可操作的、与模型无关的能力建设动作。

§8 与已有节点的关系

  • 对照 Claude Code 体感(0414):0414 记录的是单次工具使用的体感(一个 power user 在一个工具里的即时感受);本图把它升级为跨工具、跨时间的代际框架——0414 是 G4 内部某一格的快照,本图是整张图。做的是深化
  • 对照 审阅瓶颈专题(0418,Rick 审阅行为是其一手数据):0418 聚焦”审阅”这一个动作的瓶颈;本图指出审阅正是 G4 高委托下”收回控制权”的护栏机制(§4 第 2 点 ingestion 沙盒)。0418 是本图 G4 代的关键一手数据源。做的是对话(互为证据)。
  • 对照民族志方法(0422):0422 立的是民族志方法论的一般框架;本图是把它应用于自身的自我民族志实例,并显式选择 Anderson 分析式路线(§5)。做的是落地
  • 对照 Skill 系统的本质:该节点讲 skill 是什么;本图给出 skill 在使用者能力演化中的位置——G2 是把默会流程显式化的代际。做的是补缺(提供时间维度)。
  • 对照 Polanyi 默会知识与提示工程的认识论张力:该节点立认识论张力;本图把它用作代际引擎的解释器(§6)。做的是调用深化
  • 不复述以上节点的事实基础,仅建立升级对照。

§9 关联节点

核心(必读)

延伸(可选)

  • Claude Code(G4 工具体感,对照 0414)
  • Agent(G4 委托对象的概念辨析)
  • 0114认识论(默会/显式知识的认识论入口)
  • 0117社会学(lead user / 使用模式的社会学视角)
  • 人类学(自我民族志的学科母体)
  • 民族志(方法论母节点,对照 0422)

修订日志

  • R1(2026-06-07):首稿。建立五代谱系(G0–G4)骨架、委托边界判断主轴、5 错位、3 对手框架回应(Delamont / von Hippel + Anderson/Ellis、Parasuraman 引入)、Polanyi 跨域呼应、与 0414/0418/0422 升级对照。所有内省点留 〔Rick 待填〕 模板(共 7 处),未编造 Rick 感受/动机。待办:G0 起点日期、塌缩驱动归因、write-first 体感、AI PM 图谱实际使用、SABCD 评级内部标准、默会知识抵抗显式化案例需 Rick 内省补;arXiv:2601.17055 与脱技能化具体效应数字标〔早期证据/需审慎〕,入库前可再核。