R

0框架

创建 2026-03-24 更新 2026-05-16 5 条双链 共创

AI 产品经理系统性知识图谱 v2(修订版)

设计原则: 从”按知识领域分类”转向”按PM决策场景分类”。每个模块的存在理由是回答一个具体的产品决策问题,而非覆盖一个学术知识域。

与v1的核心差异:

  1. 技术底层模块大幅瘦身,只保留直接影响产品决策的技术认知
  2. 工程化与产品设计按场景重组,不再人为割裂
  3. 新增”度量与实验”独立模块(v1最大盲区)
  4. 新增”竞品拆解方法论”模块(从观察者到牌桌玩家的跳板)
  5. 新增跨模块”决策耦合层”,处理真实产品决策的多维度博弈
  6. 新增”AI PM工作操作系统”(工作方式,非知识储备)

模块架构总览

┌─────────────────────────────────────────────────────────┐
│            跨模块决策耦合层 (Cross-Module Layer)           │
│     真实产品决策 = 技术约束 × 体验影响 × 成本结构 × 合规风险    │
└───────┬──────┬──────┬──────┬──────┬──────┬───────────────┘
        │      │      │      │      │      │
   ┌────┴┐ ┌──┴──┐ ┌─┴──┐ ┌┴───┐ ┌┴───┐ ┌┴────┐
   │ M0  │ │ M1  │ │ M2 │ │ M3 │ │ M4 │ │ M5  │
   │技术  │ │产品  │ │度量 │ │商业 │ │竞品 │ │风险  │
   │素养  │ │架构  │ │实验 │ │战略 │ │拆解 │ │合规  │
   └─────┘ └─────┘ └────┘ └────┘ └────┘ └─────┘
                                                
   ┌─────────────────────────────────────────────┐
   │     底座:AI PM 工作操作系统 (Operating System)  │
   │      PRD写法 / 协作语言 / AB实验 / 日常节奏      │
   └─────────────────────────────────────────────┘

模块 0:AI 技术素养(Technology Literacy)

模块 0:AI 技术底层逻辑与模型范式解析

定位

回答的核心问题: 这个需求在物理上能不能做?成本量级是什么?

这不是一个”学到精通”的模块,而是一个”建立判断直觉”的模块。目标是让你在听到技术团队说”这个做不了”或”这个很简单”时,能判断对方是在说事实还是在推诿/低估。

与v1的差异

v1的模块一深度过剩(KV Cache的字节级推演、Softmax概率插值的数学本质、PRM的树搜索机制)。这些内容对AI PM的日常决策帮助有限,但消耗大量学习时间。v2只保留直接影响产品决策的技术认知,其余降级为”知道存在、能听懂术语”即可。

子章节

0.1 概率思维基础(保留,但压缩)

  • 核心认知跃迁:从确定性系统到概率分布系统
  • “过拟合”和”欠拟合”的产品体验映射(保留,这是直接影响需求定义的)
  • 幻觉的不可消除性(保留结论和产品含义,砍掉Softmax数学推导)
  • 砍掉的内容: 监督/无监督学习的学术分类、分类vs回归的抽象定义——这些对产品决策没有直接帮助

0.2 算力约束与成本直觉(保留核心,砍掉推演细节)

  • Prefill vs Decode的本质差异 → 直接映射为:输入Token贵还是输出Token贵?长Prompt的成本后果是什么?
  • KV Cache → 直接映射为:上下文窗口越长,并发越低,成本越高。产品要不要支持100K上下文,这是一个成本决策
  • TTFT vs TPOT → 直接映射为:用户等首字的时间和看到内容流出的速度,分别受什么约束
  • 砍掉的内容: 显存带宽的具体数值计算、PagedAttention的实现原理、Speculative Decoding的验证机制——知道存在即可

0.3 架构选型的产品含义(保留对比表,砍掉原理细节)

  • Dense Transformer / MoE / SSM 的产品适用场景对比(保留)
  • 每种架构的成本-延迟-能力 trade-off(保留)
  • 砍掉的内容: 注意力机制的数学公式、MoE路由机制的工程细节、SSM隐状态向量的物理意义

0.4 多模态与端侧(保留趋势判断,砍掉生成机制差异)

  • 原生多模态 vs 管线串联对延迟的影响(保留,直接影响语音产品设计)
  • 端侧部署的可行性边界(保留,影响产品架构选型)
  • 砍掉的内容: 自回归vs扩散模型的数学差异、VLM导航的技术细节

0.5 后训练与数据墙(保留战略含义,压缩技术细节)

  • 核心判断:基础模型趋同,后训练(SFT/RLHF)是产品差异化的主战场
  • PM能插手的环节:SFT的场景定义、偏好数据的采集设计、评估标准的制定
  • 合成数据的战略意义(保留概念,砍掉具体Pipeline设计——那是工程师的活)
  • 砍掉的内容: PPO/GRPO算法细节、Constitutional AI的技术实现、DPO的数学公式

扩展Prompt设计(v2修订)

你是一位有丰富产品合作经验的AI技术负责人。我是一个正在转型AI领域的产品经理,
有3年互联网PM经验但没有AI实战经验。

请帮我建立"AI技术素养"——不是让我成为半个工程师,而是让我具备以下能力:
1. 听到技术方案时,能判断其成本量级和可行性边界
2. 写PRD时,能预判技术约束对产品体验的影响
3. 和算法工程师讨论时,能用对方听得懂的语言描述产品需求

对于每个知识点,请用这个格式:
- 【一句话本质】用一句话说清楚这个概念的核心
- 【产品决策影响】这个技术事实会在什么产品决策场景中出现
- 【判断直觉】当工程师提到这个概念时,我应该追问什么问题
- 【不需要深入的部分】哪些细节可以留给工程师,PM知道存在即可

拒绝任何与产品决策无关的纯技术深挖。如果某个概念对PM决策没有直接影响,
请直接标注"了解术语即可"并跳过。

模块 1:AI 产品架构决策(Product Architecture Decisions)

定位

回答的核心问题: 面对这个业务需求,技术上应该怎么做(Prompt Engineering / RAG / 微调 / Agent),产品上应该怎么设计交互?

这是v1的模块二(工程化)和模块三(产品设计)按决策场景重组后的结果。核心改动:不再把”RAG的技术链路”和”RAG产品的交互设计”分开讲,而是作为一个完整的决策单元。

子章节

1.1 技术选型决策矩阵

PM面对一个需求时的第一个决策:用什么技术路径实现?

决策维度Prompt EngineeringRAG微调 (SFT/LoRA)Agent
知识更新频率静态或低频高频/实时低频(重新训练成本高)依赖外部工具实时获取
领域专业深度通用知识足够需要垂直知识库需要改变模型行为模式需要多步骤复杂任务
数据安全要求低(数据过API)中(知识库可私有化)高(数据不出域)视工具链而定
成本结构最低中(向量DB+检索)高(训练+部署)最高(多次调用)
延迟容忍度最低延迟中(检索+生成)低延迟高延迟(多步骤)
上线速度小时级周级月级周-月级
典型场景客服话术、格式化输出企业知识问答、法律检索垂直领域专家、风格定制自动化工作流、数据分析

决策不是非此即彼的: 成熟的AI产品几乎都是组合方案。例如:RAG + Prompt Engineering(检索后用精细Prompt控制输出格式),或 微调 + RAG(用微调建立领域语感,用RAG注入实时知识)。

1.2 RAG 产品的完整决策链(技术+产品一体化)

不再把RAG拆成”技术链路”和”产品体验”两个模块,而是按决策顺序一路打通:

  • 分块策略选择 → 直接决定用户看到的答案粒度和准确度
    • 选择依据:文档类型、用户查询模式、答案长度预期
    • PM需要判断的:粒度太细答案碎片化,太粗检索命中率低——这是产品决策不是纯技术决策
  • 检索架构选择(稀疏/稠密/混合) → 直接决定什么类型的问题能被回答
    • 专有名词多的场景(法律条文、产品型号)必须保留关键词检索
    • 用户表达模糊的场景必须依赖语义检索
    • PM需要判断的:目标用户的提问模式是精确的还是模糊的?
  • 重排序(Reranker) → 决定用户看到的第一个答案是不是最相关的
    • 这是RAG产品体验的生死线,但常被工程团队低估
  • 引用溯源与可信度展示(产品层) → 用户凭什么信任AI给出的答案?
    • 引用标注设计、来源链接、置信度信号
    • 检索失败时的降级策略:承认”我没找到相关信息” vs 硬答(体验与信任的trade-off)
  • 反馈闭环设计(产品层) → 如何用用户行为数据持续优化检索质量?
    • 用户点击了哪个引用来源、是否触发了”重新搜索”、答案被复制还是被忽略

1.3 Agent 架构的产品化决策

Agent不是一个技术方案,而是一种产品形态选择。PM需要决策的核心问题:

  • 自主性边界: 这个Agent在什么范围内可以自主行动,什么时候必须请求用户确认?
    • 低风险操作(信息查询)→ 自动执行
    • 中风险操作(发送邮件)→ 生成草稿,用户确认后执行
    • 高风险操作(资金操作)→ 只能提供建议,不能执行
  • 失败模式设计(最容易被忽视的部分):
    • 工具调用失败 → 重试策略 + 降级方案 + 用户通知
    • 规划错误(走错路径)→ 如何让用户纠正而不需要从头开始
    • 长时间执行 → 进度展示、中途取消、部分结果保存
  • 多Agent协同的产品逻辑:
    • 角色分工设计(Planner / Executor / Reviewer)
    • 对用户的呈现方式:透明展示协作过程 vs 只展示最终结果
    • 类比:这是组织架构设计,不是纯技术问题

1.4 交互范式的场景化选择

不再笼统地讲”对话式 vs 非对话式”,而是按场景给出交互形态选择:

场景特征最佳交互形态案例
用户意图明确,需要精确执行行内补全 / 命令式GitHub Copilot Tab键采纳、Notion AI的”/“命令
用户意图模糊,需要探索对话式 + 引导ChatGPT、Perplexity
高频重复任务自动化工作流 + 审批节点Zapier AI、企业RPA
创意生成,需要迭代画布式 + 变体选择Midjourney V变体、Figma AI
长文档处理侧边栏 + 行内标注Cursor、Google Docs AI
实时辅助(无屏幕)语音 + 触觉反馈穿戴设备、车载AI

1.5 防御性UX设计清单

针对AI产品的两个固有缺陷(非确定性 + 高延迟),提供可直接落地的设计清单:

  • 延迟管理: 流式输出、骨架屏、“AI正在查阅资料…”状态外显、进度预估
  • 幻觉管理: 置信度标识、引用来源、“此回答可能不准确”提示的触发条件设计
  • 纠错交互: 局部重新生成、分段确认、用户编辑后的模型学习
  • 降级策略: 模型超时→缓存回答、模型拒答→转人工、检索失败→承认+建议替代查询

扩展Prompt设计(v2修订)

你是一位同时精通AI工程和产品设计的首席产品架构师,主导过多个千万DAU的AI产品。
请帮我建立"AI产品架构决策"能力。

核心要求:
1. 对于每个技术选型(RAG/微调/Agent),不要把技术实现和产品设计分开讲。
   请按"决策链"的顺序:业务需求→技术选型→实现约束→交互设计→度量方式,一路打通。

2. 用一个具体的商业场景(如"出海企业的多语言客服系统")作为贯穿线索,
   推演从0到1的完整产品架构决策过程。在每个决策节点,指出:
   - PM需要做什么判断
   - 需要向工程师问什么问题
   - 这个决策会如何影响后续的成本、体验和可扩展性

3. 特别展开Agent的失败模式设计。大部分AI产品教程只讲Agent怎么work,
   请重点讲Agent怎么fail,以及PM该如何设计兜底机制。

4. 提供一份"AI产品防御性UX设计清单",可直接作为PRD附件使用。

模块 2:AI 产品度量与实验(Metrics & Experimentation)

定位

回答的核心问题: 这个AI功能上线后,怎么知道它是好是坏?怎么持续改进?

这是v1完全缺失的模块,也是AI PM日常工作中占比最高的活动之一。

为什么需要独立模块

AI产品的度量和传统互联网产品有三个根本性差异:

  1. 非确定性输出: 同一个输入,模型可能给出不同输出。你无法像传统产品那样用”功能是否正常工作”来衡量
  2. 双轨指标体系: 必须同时追踪模型性能指标和业务指标,且两者的关系是非线性的(幻觉率从5%→3%可能业务指标没变化,从3%→1%可能带来跃升)
  3. 数据飞轮效应: 产品的度量数据本身就是模型改进的训练数据,度量设计和模型迭代是一个闭环

子章节

2.1 AI 产品核心指标体系

模型性能指标(技术侧):

  • 任务完成率 (Task Completion Rate):用户的请求是否被正确执行
  • 幻觉率 → 映射为”人工接管率 (Human Takeover Rate)”
  • 首字延迟 (TTFT) 和生成速度 (TPOT)
  • 检索命中率 (Hit Rate) 和排序质量 (MRR)(RAG产品专用)

业务体验指标(产品侧):

  • 采纳率 (Acceptance Rate):用户是否使用了AI生成的结果
  • 编辑距离 (Edit Distance):用户在AI输出基础上做了多少修改
  • 重试率 (Retry Rate):用户触发”重新生成”的频率
  • 会话深度 (Session Depth):用户和AI交互了几轮才完成任务
  • 逃逸率 (Escape Rate):用户在AI功能中放弃,转向手动完成的比例

商业结果指标(业务侧):

  • 效率提升量化:使用AI前后完成同一任务的时间对比
  • 成本相关:单次交互的算力成本 (COGS per interaction)、LTV/CAC
  • 留存与付费转化

2.2 指标间的因果链与阈值效应

  • 不是所有模型性能提升都会转化为业务指标改善
  • 阈值效应:某些场景下,准确率必须跨过一个门槛(如95%)才会引发用户行为变化
  • 感知质量 vs 实际质量的分离(和你滴滴案例的”感知安全 ≠ 实际安全”是同构问题)
  • 如何建立”模型指标→产品指标→业务指标”的归因链条

2.3 AI 产品的AB实验设计

  • 传统AB实验的假设(确定性输出、独立样本)在AI产品中不完全成立
  • 模型版本切换的实验设计:如何控制变量(Prompt变化 vs 模型变化 vs 检索策略变化)
  • 长尾case的处理:AI产品的问题往往集中在少数极端场景,均值指标可能掩盖严重问题
  • “好的AI”的定义是场景依赖的:同一个模型输出,在创意场景是优点(发散),在合规场景是灾难(不精确)

2.4 数据飞轮的工程设计

  • 隐式反馈采集:采纳/拒绝、编辑修改、停留时长、复制行为
  • 显式反馈采集:点赞/点踩的交互设计、重新生成的触发机制
  • 反馈数据→训练数据的转化管道:如何把前端交互数据清洗为可用于SFT/RLHF的标注数据
  • 冷启动期的数据策略:没有用户反馈数据时怎么办(合成数据 + 人工标注 + 内部dogfooding)

2.5 评估体系搭建实操

  • 离线评估 vs 在线评估的分工
  • LLM-as-a-Judge的搭建逻辑与已知偏见(位置偏见、冗长偏见)
  • 人工评估的标注指南设计(标注一致性 > 标注量)
  • 回归测试:模型升级后如何确保旧场景不退化

扩展Prompt设计

你是一位在头部AI公司(如字节跳动/Anthropic)主导过AI产品度量体系搭建的
数据驱动型产品负责人。请帮我建立"AI产品度量与实验"能力。

核心要求:
1. 给出一套完整的AI产品指标体系框架,分为模型性能层、产品体验层和商业结果层。
   对每个指标,说明:定义、采集方式、适用场景、常见陷阱。

2. 用一个具体案例(如"企业级RAG知识库问答产品"),推演从上线到迭代优化的完整度量流程。
   重点说明:模型准确率提升X%时,业务指标可能的非线性响应模式。

3. 设计一个AI产品的AB实验方案模板,包括:假设、变量控制、样本量估算、
   评估指标选择、长尾case专项评估。

4. 深度拆解数据飞轮:如何在产品交互的微观层面设计反馈采集机制,
   使其既不打扰用户,又能产出高质量训练数据。
   对比ChatGPT的点赞、Copilot的Tab采纳、Midjourney的V变体这三种机制的数据哲学。

5. 提供一份"AI产品评估体系搭建清单",可直接指导工程团队实施。

模块 3:AI 商业战略与生态(Business Strategy & Ecosystem)

定位

回答的核心问题: 这个AI产品的钱从哪来?护城河在哪?能活多久?

与v1的差异

v1的商业模块覆盖面够了,但缺少两个关键能力:一是把商业分析和技术约束联动起来的能力(比如:定价策略必须考虑算力成本结构),二是对中国AI市场特殊竞争格局的分析框架。

子章节

3.1 AI 产业链价值分布与生态位选择

  • 算力层 → 模型层 → 中间件层 → 应用层的价值分配
  • 应用层的利润池在哪?为什么大部分应用层公司赚不到钱?
  • 中国AI市场特殊性:平台依赖(蚂蚁/腾讯/百度生态)、被收购作为现实退出路径

3.2 “套壳”诊断与护城河构建

  • 五维度自检框架:

    1. 模型替换成本: 如果底层模型换了,产品价值保留多少?
    2. 数据壁垒: 产品是否在积累用户使用中独有的数据资产?
    3. 工作流嵌入深度: 用户切换到竞品的迁移成本有多高?
    4. 网络效应: 更多用户是否让产品对每个用户都更好用?
    5. 领域know-how: 产品团队是否积累了难以复制的行业理解?
  • 护城河构建策略:

    • 垂直行业系统记录(SoR)锁定
    • 数据飞轮:用户使用→专有数据→模型变强→用户更多
    • 工作流深度集成(从”AI工具”到”AI基础设施”)

3.3 商业模式与单位经济模型

  • Token计费 vs 订阅制 vs 按结果计费 vs 按座席计费
  • AI时代按座席定价的崩溃逻辑(AI减少人头→座席收入下降)
  • UE拆解模板:CAC / COGS per interaction / LTV / Gross Margin
  • 算力成本对定价策略的硬约束(不是”想定多少就多少”)

3.4 企业级 vs 消费级的战略分化

  • ToB:私有化部署溢价、合规信任壁垒、销售周期长但LTV高
  • ToC:获客成本博弈、留存是生死线、免费层的算力成本控制
  • 当前阶段的PMF判断:为什么低容错创意工具比高精度垂直工具更容易找到PMF

3.5 开源 vs 闭源的战略推演

  • 闭源API(GPT-4、Claude)的议价权和锁定风险
  • 开源模型(Llama、DeepSeek)的降本逻辑和运维成本
  • 多模型路由策略:用不同模型处理不同难度的任务

扩展Prompt设计

你是一位投资过多个AI独角兽、深度参与中国AI创业生态的风险投资人和战略顾问。
请帮我建立"AI商业战略"分析能力。

核心要求:
1. 用"套壳诊断五维度框架"分析3个真实AI产品(1个已死/1个挣扎/1个成功),
   推演其护城河强弱的具体原因。

2. 设计一个AI产品的单位经济模型(UE)计算模板。
   用"AI自动化客服"和"AI写作助手"两个场景,分别推演其成本结构和盈利路径。
   特别要把算力成本(Token消耗)纳入COGS计算。

3. 针对中国AI应用层市场,分析以下竞争格局:
   - 平台依赖型公司(蚂蚁/腾讯/百度生态内)的生存策略
   - 独立创业公司的差异化路径
   - 被收购 vs 独立上市的退出路径选择

4. 推演"按结果定价"(Outcome-based Pricing)在3个具体场景中的可行性,
   包括定价逻辑、价值归因难点和用户接受度。

模块 4:竞品拆解与行业分析方法论(Competitive Intelligence)

定位

回答的核心问题: 拿到一个AI产品,如何在30分钟内形成有价值的判断?

这是v1完全缺失的模块,也是你从”观察者”转变为”牌桌玩家”的关键工具。你已经在做公司mapping,但需要一个系统化的拆解方法论来支撑这个活动。

子章节

4.1 AI 产品快速拆解框架(30分钟版)

第一层:产品定位(5分钟)

  • 解决什么问题?目标用户是谁?
  • 在AI产业链的哪个位置?
  • 核心价值主张是什么?

第二层:技术架构反推(10分钟)

  • 从交互行为反推技术方案:
    • 有引用来源 → 大概率RAG
    • 响应速度极快 → 可能用了缓存或小模型
    • 输出格式高度一致 → 大概率有SFT或严格的Prompt Engineering
    • 支持复杂多步骤任务 → Agent架构
  • 从定价模型反推成本结构:
    • 按Token计费 → 直接API转售,薄利
    • 固定订阅制 → 需要控制单用户算力消耗
    • 免费 → 靠融资续命或有其他变现方式

第三层:竞争力评估(10分钟)

  • 套壳五维度快速打分(各1-5分)
  • 数据飞轮是否已经转起来?
  • 用户迁移成本有多高?

第四层:产品改进假设(5分钟)

  • 如果我是这个产品的PM,最优先改什么?
  • 这个产品最可能被什么颠覆?

4.2 行业地图构建方法论

  • 如何系统性地mapping一个AI细分领域(你已经在做的事情的方法论支撑)
  • 信息源:36Kr、量子位、AI产品榜单、ProductHunt、融资新闻、招聘信息
  • 分类框架:按技术路线分 / 按目标用户分 / 按商业模式分
  • 动态追踪:融资事件、产品更新、团队变动、竞品跟进

4.3 面试场景的竞品分析模板

  • “你怎么看XX产品?“的标准回答结构:

    1. 定位判断(一句话)
    2. 做得好的地方(具体功能+为什么好)
    3. 结构性问题或机会(不是吐槽细节,是指出战略层面的张力)
    4. 如果我来做,会怎么改(具体方案+预期效果)
  • “你为什么想来我们公司?“的深度版回答准备方法:

    • 拆解目标公司产品的技术架构和竞争位置
    • 找到一个你认为有改进空间的具体点
    • 准备一个有深度的改进假设(不是泛泛而谈,而是能展示你的产品直觉)

扩展Prompt设计

你是一位资深AI行业分析师,曾为多家头部VC和AI公司提供竞品情报服务。
请帮我建立"AI产品竞品拆解"的系统化能力。

核心要求:
1. 给出一个可复用的"AI产品30分钟快速拆解框架",包括:
   看什么、怎么看、判断标准是什么。
   用3个真实AI产品(如Perplexity、Cursor、Kimi)做示范拆解。

2. 教我"从产品交互反推技术架构"的具体方法。
   例如:怎么通过使用一个AI产品10分钟,判断它用的是RAG还是微调?
   怎么通过定价模型推断它的成本结构?

3. 针对中国AI应用层市场,帮我建立一个行业mapping的信息源清单和追踪节奏。

4. 提供3个"面试场景竞品分析"的完整示范回答(中文),
   展示从定位判断到改进假设的完整论证链。

模块 5:AI 风险、伦理与合规(Risk, Ethics & Compliance)

定位

回答的核心问题: 这个AI功能会不会让公司被罚、被骂、被起诉?

与v1的差异

v1的合规模块已经够全了,v2只做两个调整:一是增加中国特色的监管要求(深度补充《生成式人工智能服务管理暂行办法》的实操含义),二是把”安全防御”从学术化表述转为PM可直接落地到PRD的清单。

子章节

5.1 AI产品安全攻击面全景(Input → Processing → Output)

  • 输入端:Prompt Injection、Jailbreak、社工攻击
  • 处理端:数据投毒、模型窃取
  • 输出端:幻觉导致的错误信息、有害内容生成、版权侵权

5.2 可落地到PRD的安全防御清单

  • 输入过滤层:意图分类 + 敏感词拦截 + 上下文窗口隔离
  • 输出审核层:内容安全分类器 + 事实核查(RAG溯源)+ 人工抽检机制
  • 系统级:速率限制、异常行为检测、熔断机制

5.3 中国AI监管实操要点

  • 《生成式人工智能服务管理暂行办法》的核心要求:算法备案、内容审核、数据合规
  • 对产品开发周期的具体影响:备案流程、审核机制、用户协议要求
  • 出海场景的双重合规:中国规定 + 目标市场规定(GDPR/CCPA)

5.4 AI Agent的责任界定(新增)

  • 当自主执行的Agent造成损失,责任归谁?
  • 产品设计中的责任防火墙:确认机制、审计日志、人工兜底
  • 用户协议中的免责条款设计

5.5 危机应急响应(保留v1框架,增加实操性)

  • 幻觉导致舆情事件的黄金24小时响应流程
  • 技术熔断 → 公关回应 → 根因分析 → 修复验证 → 复盘改进

跨模块决策耦合层(Cross-Module Decision Layer)

定位

真实的产品决策从来不是单模块的。“要不要支持100K上下文”这一个问题,同时涉及技术约束(M0)、产品架构(M1)、成本结构(M3)和用户体验度量(M2)。

设计方式

提供3-5个高频决策场景,每个场景拉通所有相关模块:

决策场景1:是否支持长上下文(100K+ tokens)

  • M0 视角:KV Cache显存占用、并发限制、成本倍增
  • M1 视角:用户真的需要一次丢100K进去,还是RAG分段检索就够了?
  • M2 视角:如何度量长上下文功能的实际使用率和价值?
  • M3 视角:长上下文的算力成本如何反映到定价中?
  • M5 视角:长文档中是否包含敏感信息?如何处理?

决策场景2:模型升级(如从GPT-3.5切换到GPT-4)

  • M0 视角:延迟和成本的变化量级
  • M1 视角:需要重新调整Prompt和RAG策略吗?
  • M2 视角:如何设计AB实验验证升级效果?如何防止回归?
  • M3 视角:成本上升后定价是否需要调整?
  • M4 视角:竞品是否已经在用更强的模型?

决策场景3:是否构建Agent功能

  • M0 视角:多次模型调用的延迟和成本累积
  • M1 视角:用户任务的复杂度是否真的需要Agent,还是一个好的Prompt就够了?
  • M2 视角:Agent任务的成功率如何度量?失败时用户的挫败感如何管理?
  • M3 视角:Agent功能是否能支撑更高的定价?
  • M5 视角:Agent自主执行操作的安全和合规边界

决策场景4:出海市场选择与本地化

  • M0 视角:多语言Token效率差异(同样的内容,日语消耗的Token可能是英语的2-3倍)
  • M1 视角:本地化不只是翻译,还有检索库的本地化、合规Prompt的调整
  • M3 视角:目标市场的付费意愿和竞争格局
  • M4 视角:目标市场的竞品生态分析
  • M5 视角:目标市场的数据合规要求(数据本地化、跨境传输)

底座:AI PM 工作操作系统(Operating System)

定位

回答的核心问题: AI PM日常怎么工作?和谁协作?产出什么文档?

这不是一个知识模块,而是一个工作方式模块。知识图谱的其他模块教你”知道什么”,这个模块教你”怎么做”。

子章节

OS.1 AI PM的PRD长什么样

  • 和传统PRD的区别:
    • 需要包含模型选型建议和约束条件
    • 需要定义”什么算好”(评估标准和验收指标)
    • 需要包含失败模式和降级方案
    • 需要包含数据采集方案(反馈飞轮设计)
  • PRD模板(可直接使用)

OS.2 AI PM和算法工程师的协作语言

  • 用什么颗粒度描述需求(不要说”让AI更聪明”,要说”把这类case的准确率从70%提到85%”)
  • 什么时候该challenge工程师(“做不了”可能是”不想做”)
  • 什么时候该相信工程师(物理限制是真的不能绕过的)
  • 需求评审时的核心问题清单

OS.3 AI产品的迭代节奏

  • 模型迭代 vs 产品迭代的节奏差异
  • 数据标注 → 模型训练 → 评估 → 上线的周期管理
  • 如何平衡”快速上线验证”和”模型质量保证”

OS.4 面试情景题的思维框架

  • “如何从0到1设计一个XX AI产品?“的回答结构
  • “这个AI功能的效果不好,你怎么排查?“的回答结构
  • “用户反馈AI回答不准确,你怎么处理?“的回答结构

学习优先级建议(针对Rick的具体情况)

考虑到你的时间约束(旅行中并行准备,约2.5个月后回国求职)和知识结构(技术理解力强但缺乏AI实战经验),建议的学习顺序:

Phase 1(立即开始,旅行期间,每天1-2小时)

  1. 模块4:竞品拆解 — 这是最快能产生面试价值的模块。对着你已有的公司list,每天拆解一个AI产品。
  2. 模块2:度量与实验 — 这是你当前知识结构中最大的盲区,也是面试高频考点。
  3. 底座OS:工作操作系统 — 面试情景题的思维框架,可以在拆解竞品的过程中同步建立。

Phase 2(回国前2-4周,加大投入)

  1. 模块1:产品架构决策 — 在竞品拆解的基础上,系统化理解技术选型逻辑。
  2. 模块3:商业战略 — 结合目标公司的具体分析,理解其商业模式和竞争位置。

Phase 3(回国后,面试冲刺)

  1. 模块0:技术素养 — 查漏补缺,确保能听懂技术面试中的关键术语。
  2. 模块5:风险合规 — 按需补充,尤其是目标公司涉及出海或ToB业务时。

文档版本:v2.0 修订时间:2026年3月17日 修订依据:基于v1框架的六项结构性缺陷评估