R03 定价模式压测剧本

你的定价模型在哪一个外部冲击下会先崩？这个节点要解决的问题是：把一个 AI 产品的定价模式（不是价格点，是收费的底层逻辑）放进三个最常见的压力情景——底层模型降价 / 竞品免费战 / 用量激增——逐项推演单位经济学会被打成什么样，然后给出一套可复用的压测模板。视角是金融业的”压力测试”（stress test）搬到 AI 产品定价：不预测”会不会发生”，而是假设”已经发生”，量化损伤幅度，找出最先断裂的那根弦。

[!warning] 本节点是操作手册，不是结论手册这里不给”应该用哪种定价”的标准答案（那是 A04 Outcome-based 定价的概念边界与 G02 定价模式演化详解·Seat 到 Usage 到 Outcome 的活）。这里只给”无论你选了哪种，怎么把它放进炉子里烤”的剧本。读完你应该能在选型会上，对着一张定价提案当场问出三个让对方答不上来的问题。

§0 为什么是”压力测试”框架，而不是”敏感性分析”

PM 谈定价时最常用的工具是敏感性分析（sensitivity analysis）：单变量微调，看利润曲线斜率。它的默认假设是变化是平滑的、连续的、单变量的——价格涨 10%，留存掉几个点，算个弹性系数就完事。

但 AI 产品定价的现实不是平滑的，是断崖式、相关性、多变量同时发生的：

底层模型降价不是”成本降 5%“，是 2022 年 11 月到 2025 年 GPT-4 级性能的输出价格降了约 94.5%（来源：BenchLM，2025；前沿 LLM 平均输出价格自 2023 年 3 月起）。这不是斜率问题，是地基塌方。
竞品免费不是”价格战”,是 GPT Store 在 2023 年 11 月上线、$20/月即可自建 GPT，一夜抹掉一批专项套壳应用的收入归零（来源：多家科技媒体 2023-2024；Jasper 在 ChatGPT 2022 年 11 月发布后护城河”一夜归零”）。
用量激增不是”营收上升的好事”，对 token 成本模型而言是毛利倒挂——Anthropic 2026 年初被迫取消企业含 token 的 Seat 套餐，官方解释是”用户增速超过产能扩张，旧定价单位经济学不成立”（来源：The Register，2026-04-16）。营收涨，公司更亏。

压力测试的认识论前提和敏感性分析相反：它不假设变化温和、可逆、孤立。它问的是 Nassim Taleb 意义上的”凸性”问题——这个定价结构面对极端冲击，是凸的（抗脆弱，冲击越大相对越好）还是凹的（脆弱，冲击越大塌得越快）。Seat 定价对”用量激增”是凸的（用量涨我不多付成本，白赚），对”模型降价”是凹的（成本降了客户却觉得我该降价）；纯 token 转售定价对”用量激增”是凹的（用得越多我亏得越多），对”模型降价”反而是凸的（进价降、卖价不变，毛利扩张）。

判断: 任何定价模式都同时对某些冲击凸、对另一些冲击凹。压测的全部价值，就是定位你最凹的那一个象限，然后问”我赌它不发生，还是我建了缓冲”。

§1 三情景的定义与触发信号

先把三个压测情景钉死，避免”降价/免费/激增”这种滑变词在选型会上各说各话。

情景	精确定义	真实触发信号（已发生过的）	影响的单位经济学项
S1 模型降价	你依赖的底层 API 单价或开源等效模型的能力，在 6–12 个月内下降 ≥50%	GPT-4o 输入价 $2.50/MTok（较 GPT-4 降约 92%）；DeepSeek R1 $0.55/MTok 约为 Claude Opus 的 1/27（来源：Menlo Ventures，2025）	COGS↓、但定价权同步↓（客户预期你也该降）
S2 竞品免费	巨头把你的核心能力作为免费/捆绑功能推出，或开源模型把它推成基础设施	GPT Store 2023-11 上线；Microsoft 365 Copilot 2025-12 降价至 $30/席并捆绑；Adept、Inflection 被基础模型实验室内部复制后被收购（来源：ideaproof.io）	价格上限↓、CAC↑、转化率↓
S3 用量激增	单用户或全盘 token 消耗在短期内倍增（Agent 化、长上下文、推理链变长）	Anthropic 因”用户增速超产能”重构定价（来源：The Register，2026-04-16）；Agent 工作流单任务 token 量可达对话式的数十倍	COGS↑、毛利↓，定额套餐下毛利可转负

[!note] 三情景常常同时来最危险的不是单情景，是 S1+S2 联动：模型降价让能力商品化（S1），巨头顺势把商品化的能力免费捆绑（S2）。Jasper 就死在这个联动上——它的”营销内容提示词”价值，被 ChatGPT 免费等效输出（S2）+ 推理成本崩塌（S1）双杀。压测必须跑联合情景，不能只跑单变量。

§2 压测剧本模板（可直接复制到选型会）

这是核心交付物。把任何一个定价提案套进下面五步，逐格填。

第一步：写下你的”价值-成本-收费”三元组

价值单位（客户为什么买）：________________
成本单位（你的 COGS 按什么线性增长）：________________
收费单位（你按什么计费）：________________

致命点：三者错位的程度，就是你被压垮的速度。

Seat 定价：收费按”人头”，但 AI 时代成本按”token”、价值按”完成的任务”——三者全错位。一个用 Agent 的用户消耗 5 人份 token、产出 5 人份价值，你只收 1 份钱（来源：MindStudio，2025，“AI Agent 不登录、不持证、可批量完成工作”）。
Outcome 定价（如 Intercom Fin $0.99/已解决对话）：收费=价值=成本对齐度最高，但结果难干净归因（见 §3 陷阱）。

第二步：对每个情景填”冲击传导链”

	S1 模型降价 50%	S2 竞品免费/捆绑	S3 用量激增 2×
COGS 变化	填	填	填
可收价格上限变化	填	填	填
留存/转化变化	填	填	填
毛利净效应（±%）	填	填	填
现金跑道影响（月）	填	填	填

第三步：标定”先断裂点”（first break）

对每一列,问一句：“这个情景下，第一个变成负数的指标是什么？需要多久？” 这就是你的预警阈值。

例：纯 token 转售（进价 X，加成 30% 卖出）在 S3 下，若你给了”无限用量”套餐，先断裂点是重度用户的边际毛利——用量超过套餐隐含阈值的瞬间转负。Anthropic 的应对就是 2026-02 引入 $20/员工/月基础费 + 全量按 token 计费，把”无限”改回”计量”（来源：The Register，2026-04-16）。

第四步：填”缓冲机制”与”应激预案”

每个先断裂点配一个缓冲。常见缓冲：

缓冲机制	对冲哪个情景	真实案例
Hybrid 结构（基础费+用量超额）	S3（用量激增）	2025 年 Hybrid 占比从 27% 升至 41%、Seat 从 21% 降至 15%，已成第一大类（来源：getmonetizely SaaS Pricing Benchmark 2025、Flexprice，多源一致）
多模型路由 + 降级	S1（模型降价）+ S3	Cursor 多模型切换，不绑单一供应商；Cascade 路由可将均价降至原来 37%（来源：m209 - 推理成本控制手册）
Prompt Caching / 批量 API	S3（成本侧缓冲）	Anthropic 批量 API 全线折 50%、Prompt Caching 省 90% 输入费（来源：finout.io，2026）
工作流锁定 / System of Record	S2（竞品免费）	GitHub Copilot 靠 2 亿仓库分发护城河抵御替代（来源：Microsoft 财报，2025）
Outcome/价值锚定定价	S1（定价权流失）	Harvey 锚定”律师人力成本 5–7%“而非软件预算，绕开 API 降价传导（来源：eesel.ai/bindlegal，2025；〔Harvey 未公开确认 5–7% 比例〕）

第五步：判定”凸/凹”并写下赌注

对三情景各打一个标签——凸（受益）/中性/凹（受损）——然后明确写出：“我把哪个凹象限当作可接受的赌注，理由是它发生概率低 / 我有缓冲 / 发生时我能快速切换。”

没有第五步，前四步只是表格练习。压测的产出是一句可被证伪的赌注，不是一张表。

§3 判断主轴：90% 的人在定价压测里会搞错的四个点

错位一：把”营收增长”当好消息，忽略毛利倒挂

症状: 用量涨了，营收报表很漂亮，团队庆祝。
为什么会错: 在定额/Seat 套餐下，token 成本随用量线性涨，但收入不涨。营收和毛利在 AI 产品里可以反向运动。
正确做法: 压测 S3 时，主指标是毛利率和重度用户的边际毛利，不是营收。AI 产品毛利率本就只有 50–60%（对比传统 SaaS 80–90%，来源：BVP Atlas），没有缓冲空间。
真实反例: Anthropic 2026 初的定价重构，本质是承认”用户增长把单位经济学打穿了”（来源：The Register，2026-04-16）。营收狂涨的同时旧定价不可持续。

错位二：把”模型降价”当纯利好

症状: “API 又降价了，我们成本下降，毛利改善。”
为什么会错: 模型降价同时打掉了你的定价权。如果你的产品价值就是”帮客户调好的 API”,客户看到 API 降价会要求你同步降价。成本降幅会被价格降幅吃掉甚至超过。
正确做法: 区分”成本侧降价”和”价值侧降价传导”。只有当你的价值锚定在 token 之外（工作流、数据、结果），模型降价才是纯利好。
真实反例: 价格套利型套壳（靠”我能拿到更便宜的 API”赚差价）在推理成本降约 80% 后，价差护城河直接消失（来源：本专题简报，机制 1）。

错位三：把 Outcome 定价当”价值对齐的银弹”

症状: “我们按结果收费，和客户利益完全一致，无懈可击。”
为什么会错: 真实业务结果难以干净归因，行业实践依赖代理指标（proxy metrics）。一旦用代理指标，就触发古德哈特定律——AI 会被优化去满足指标而非真实价值。
正确做法: 压测 Outcome 定价时，专门跑”代理指标被博弈”情景：如果 AI 学会让指标好看但价值没产生，你的计费基础就是虚的。
真实反例: Zendesk 的”自动解决”定义为”工单关闭后 72 小时无后续跟进”（来源：WebSearch，2024-08）——这不是真正的”解决”，只是代理信号；Salesforce Agentforce 原 $2/对话因”什么算一次对话”争议，前两季 5,000 合同仅 3,000 付费，2025-05 被迫改版为 Flex Credits（来源：concret.io/SaaStr，2025）。

错位四：只压测”成本侧”,不压测”采购心理侧”

症状: 压测全是 COGS、毛利、跑道，没有一格是”客户采购部门怎么想”。
为什么会错: 定价模式的生死一半在采购心理。纯用量计费让 CIO 无法预测预算（90% CIO 把成本预测列为 AI 部署首要难题，来源：Pilot Blog，2026；78% IT 领导遭遇意外收费〔单一来源〕），即使单位经济学完美，采购也会拒签。
正确做法: 每个情景多填一行”采购可预测性变化”。这就是为什么 Seat 没死、而是演变为 Hybrid 基础层的原因——大企业要预算确定性，Microsoft Copilot 在 $30/席仍大量续签（来源：本专题简报）。
真实反例: 纯消费模式理论最优，但实践中”账单震惊”导致客户流失，反推 Hybrid 成为主流（27%→41%）。

§4 产品 PM 视角补盲：定价压测里的非工程盲点

用户心理模型：损失厌恶 vs 计量焦虑。 用量计费在心理上是”水表跳字”——用户每次操作都感到出血，会抑制使用，反而损害数据飞轮。Seat 的心理优势是”已付费，随便用”，鼓励重度使用。压测时要算”计量焦虑导致的使用抑制”对长期留存的隐性损伤，这是纯 ROI 模型看不见的。
GTM 摩擦：定价复杂度 = 销售周期。 Outcome / 多层 Credit 定价越”精巧”，企业采购越难评估、法务越难落合同。Salesforce 在一年内换了三套定价模型（来源：SaaStr，2025），每次换都是销售团队的重新培训成本。压测要把”定价变更本身的组织成本”算进去。
合规边界：结果定价的责任归属。 按”已解决工单”收费，意味着你在对结果背书。一旦 AI 给出错误的”已解决”（如法律、医疗场景），责任归属和赔付风险陡增。Outcome 定价在高风险垂直行业是合规雷区，不只是商业选择。

§5 对手框架回应

对手立场（业界主流”用量计费是未来”派，如 Flexprice/Monetizely 2025 数据驱动的乐观叙事）： Seat 正死（21%→15%），Hybrid 崛起（27%→41%），用量/结果定价才是 AI-native 的归宿，Gartner 预测 2030 年 40%+ 企业 SaaS 支出转向用量/Agent/结果计费。

接受的部分: 方向正确。Seat 与”用户数=价值”的解耦是真实且不可逆的，AI Agent 从根本上破坏了人头计费的逻辑。Hybrid 占比反超也是硬数据。

坚持的边界与赌注: 但”用量计费是终点”是过度外推。

同一个 Gartner 也预测 40%+ Agentic AI 项目将在 2027 年底前被取消（来源：Gartner 官网新闻稿，2025-06-25）。两个数据同源、方向相反——说明 Agentic 商业化仍处高度不确定期，押注”结果定价成主流”为时过早。
用量计费的”采购不可预测性”是结构性硬约束，不是过渡期摩擦。只要企业还有年度预算制度，Hybrid 的”基础层提供确定性”就有不可替代的位置。我赌的是：终局不是 Seat 死、用量赢，而是 Hybrid 长期占主导，纯用量与纯 Outcome 各自占据特定产品形态的利基。

这个判断在哪失效: 如果未来 2–3 年企业财务系统普遍内建”AI 用量实时预算管控”（让用量变得可预测），那么我对”采购心理是用量计费天花板”的判断会失效，纯用量定价的份额会比我预期的更大。

§6 跨域呼应：金融压力测试的认识论搬运（Rick 未必读过的对手框架）

调度框架: 2008 金融危机后的银行压力测试方法论（Fed 的 CCAR / DFAST 框架）。

银行压测的核心认识论贡献，恰恰是定价 PM 最缺的那一课：它放弃了”预测概率”,转而采用”假设情景已发生、量化损伤”。 监管不问”金融危机会不会来”,而是规定一个”严重不利情景”（severely adverse scenario），让每家银行算出在该情景下的资本充足率。这套思路直接可搬：定价 PM 不该花时间争论”模型会不会降价 50%“,而该假设它已经发生,算出毛利和跑道的损伤。

更深一层，压测框架还贡献了**“反身性”（reflexivity）警觉**——Soros 意义上的：压测情景本身会改变行为。当 Anthropic 公开承认”旧定价不可持续”并涨价，这个动作本身会触发客户重新评估、竞品趁机挖角，冲击因被应对而变形。定价压测必须把”我的应激动作会引发的二阶反应”也纳入剧本第四步，否则你对冲了一阶冲击，却被自己应对动作的二阶后果反噬。

这正是金融压测后来引入”动态/多轮压测”的原因，也是本节点剧本第四步要求填”应激预案”而非仅”缓冲”的理由——缓冲是静态的，预案是考虑了反身性的动态响应。

[!note] 赌注我把”金融压测方法论可直接迁移到产品定价”当作一个有边界的类比，而非严格同构。失效边界：银行压测有监管强制的标准情景，定价压测没有——情景设定的主观性是这套方法的最大弱点。谁来定义”严重不利情景”，本身就是判断而非计算。

§7 PM 决策启示

面试怎么用: 被问”你怎么给 AI 产品定价”,不要直接答模式，先反问”在三个压力情景下哪个模式先崩”——展示你想的是抗冲击性而非价格点。能当场画出 §2 的五步剧本 = 顶 1% 答案。
选型怎么用: 评估一个 AI 供应商时，把它的定价套进 S1/S2/S3，问”模型降价时你会不会同步降价给我""用量激增时我的账单天花板在哪""巨头免费捆绑同类能力时你靠什么留住我”。答不上来 = 它没做过压测，未来会把不确定性转嫁给你。
复现怎么用: 给自己的产品定价提案做内部 review 时，强制填完 §2 的第三步（先断裂点）和第五步（赌注）。这两步是大多数定价文档缺失的，补上它们就超过了 90% 的同行。

§8 与已有节点的关系

对照 A04 Outcome-based 定价的概念边界：A04 是概念边界辨析（Outcome 定价到底算到哪一步、代理指标的真伪），本节点是动态压力测试（任一模式在冲击下怎么变形）。A04 回答”这种模式的定义边界在哪”，R03 回答”选了之后怎么验证它扛不扛揍”。本节点不复述 A04 的概念辨析，直接把它的结论（代理指标陷阱）当作 §3 错位三的压测要点。这是”补缺”关系——A04 缺的动态抗冲击维度由 R03 补上。
对照 G02 定价模式演化详解·Seat 到 Usage 到 Outcome：G02 讲的是定价范式为什么会发生历史性迁移（Seat→Usage→Outcome 的代际驱动力），是时间维度；R03 把 G02 揭示的迁移力当作压测情景 S1/S2/S3 的历史依据——G02 说”Seat 正被 token 经济侵蚀”,R03 把这句话翻译成”所以你的 Seat 模型要跑 S3 压测”。这是”深化”关系——G02 给出”变化方向”,R03 给出”变化幅度下你怎么活”。
对照 m209 - 推理成本控制手册：m209 停在”工程降本手段”层（缓存/路由/压缩），本节点把这些手段当作压测第四步的缓冲机制调用——把工程能力翻译成商业抗脆弱性。这是”升高抽象层”关系：同样的 Cascade 路由，m209 视角是”省钱”,R03 视角是”对冲 S1/S3 的护城河”。不复述 m209 的实现细节。

§9 关联节点

核心（必读）:

A04 Outcome-based 定价的概念边界（本节点的压测对象，代理指标陷阱来源）
G02 定价模式演化详解·Seat 到 Usage 到 Outcome（压测情景的历史依据）
m209 - 推理成本控制手册（缓冲机制的工程来源）
Anthropic（S3 用量激增 + 定价重构的一手案例）

延伸（可选）:

Perplexity（产品形态领先、单位经济亏损的 pessimistic case）
ChatGPT、OpenAI（S2 竞品免费/GPT Store 案例）
Claude（多模型路由对冲 S1 的实例）
0133新制度经济学（交易成本视角看定价复杂度的采购摩擦）

§10 修订日志

2026-06-07 R1：首稿。按宪章 §4 十一段骨架建立三情景压测框架；接入金融压测方法论（CCAR/DFAST）作跨域呼应；A04/G02 双链已对照 staging 实际 basename 校正。
2026-06-07 R1.1：WebSearch 接地校验。Hybrid 占比经多源核实修正（见正文）；其余数字保留来源标注。〔待核实项：78% IT 领导意外收费单一来源、Harvey 5–7% 比例未经厂商确认。〕