R03 定价模式压测剧本
R03 定价模式压测剧本
你的定价模型在哪一个外部冲击下会先崩?这个节点要解决的问题是:把一个 AI 产品的定价模式(不是价格点,是收费的底层逻辑)放进三个最常见的压力情景——底层模型降价 / 竞品免费战 / 用量激增——逐项推演单位经济学会被打成什么样,然后给出一套可复用的压测模板。视角是金融业的”压力测试”(stress test)搬到 AI 产品定价:不预测”会不会发生”,而是假设”已经发生”,量化损伤幅度,找出最先断裂的那根弦。
[!warning] 本节点是操作手册,不是结论手册 这里不给”应该用哪种定价”的标准答案(那是 A04 Outcome-based 定价的概念边界 与 G02 定价模式演化详解·Seat 到 Usage 到 Outcome 的活)。这里只给”无论你选了哪种,怎么把它放进炉子里烤”的剧本。读完你应该能在选型会上,对着一张定价提案当场问出三个让对方答不上来的问题。
§0 为什么是”压力测试”框架,而不是”敏感性分析”
PM 谈定价时最常用的工具是敏感性分析(sensitivity analysis):单变量微调,看利润曲线斜率。它的默认假设是变化是平滑的、连续的、单变量的——价格涨 10%,留存掉几个点,算个弹性系数就完事。
但 AI 产品定价的现实不是平滑的,是断崖式、相关性、多变量同时发生的:
- 底层模型降价不是”成本降 5%“,是 2022 年 11 月到 2025 年 GPT-4 级性能的输出价格降了约 94.5%(来源:BenchLM,2025;前沿 LLM 平均输出价格自 2023 年 3 月起)。这不是斜率问题,是地基塌方。
- 竞品免费不是”价格战”,是 GPT Store 在 2023 年 11 月上线、$20/月即可自建 GPT,一夜抹掉一批专项套壳应用的收入归零(来源:多家科技媒体 2023-2024;Jasper 在 ChatGPT 2022 年 11 月发布后护城河”一夜归零”)。
- 用量激增不是”营收上升的好事”,对 token 成本模型而言是毛利倒挂——Anthropic 2026 年初被迫取消企业含 token 的 Seat 套餐,官方解释是”用户增速超过产能扩张,旧定价单位经济学不成立”(来源:The Register,2026-04-16)。营收涨,公司更亏。
压力测试的认识论前提和敏感性分析相反:它不假设变化温和、可逆、孤立。它问的是 Nassim Taleb 意义上的”凸性”问题——这个定价结构面对极端冲击,是凸的(抗脆弱,冲击越大相对越好)还是凹的(脆弱,冲击越大塌得越快)。Seat 定价对”用量激增”是凸的(用量涨我不多付成本,白赚),对”模型降价”是凹的(成本降了客户却觉得我该降价);纯 token 转售定价对”用量激增”是凹的(用得越多我亏得越多),对”模型降价”反而是凸的(进价降、卖价不变,毛利扩张)。
判断: 任何定价模式都同时对某些冲击凸、对另一些冲击凹。压测的全部价值,就是定位你最凹的那一个象限,然后问”我赌它不发生,还是我建了缓冲”。
§1 三情景的定义与触发信号
先把三个压测情景钉死,避免”降价/免费/激增”这种滑变词在选型会上各说各话。
| 情景 | 精确定义 | 真实触发信号(已发生过的) | 影响的单位经济学项 |
|---|---|---|---|
| S1 模型降价 | 你依赖的底层 API 单价或开源等效模型的能力,在 6–12 个月内下降 ≥50% | GPT-4o 输入价 $2.50/MTok(较 GPT-4 降约 92%);DeepSeek R1 $0.55/MTok 约为 Claude Opus 的 1/27(来源:Menlo Ventures,2025) | COGS↓、但定价权同步↓(客户预期你也该降) |
| S2 竞品免费 | 巨头把你的核心能力作为免费/捆绑功能推出,或开源模型把它推成基础设施 | GPT Store 2023-11 上线;Microsoft 365 Copilot 2025-12 降价至 $30/席并捆绑;Adept、Inflection 被基础模型实验室内部复制后被收购(来源:ideaproof.io) | 价格上限↓、CAC↑、转化率↓ |
| S3 用量激增 | 单用户或全盘 token 消耗在短期内倍增(Agent 化、长上下文、推理链变长) | Anthropic 因”用户增速超产能”重构定价(来源:The Register,2026-04-16);Agent 工作流单任务 token 量可达对话式的数十倍 | COGS↑、毛利↓,定额套餐下毛利可转负 |
[!note] 三情景常常同时来 最危险的不是单情景,是 S1+S2 联动:模型降价让能力商品化(S1),巨头顺势把商品化的能力免费捆绑(S2)。Jasper 就死在这个联动上——它的”营销内容提示词”价值,被 ChatGPT 免费等效输出(S2)+ 推理成本崩塌(S1)双杀。压测必须跑联合情景,不能只跑单变量。
§2 压测剧本模板(可直接复制到选型会)
这是核心交付物。把任何一个定价提案套进下面五步,逐格填。
第一步:写下你的”价值-成本-收费”三元组
价值单位(客户为什么买):________________
成本单位(你的 COGS 按什么线性增长):________________
收费单位(你按什么计费):________________
致命点:三者错位的程度,就是你被压垮的速度。
- Seat 定价:收费按”人头”,但 AI 时代成本按”token”、价值按”完成的任务”——三者全错位。一个用 Agent 的用户消耗 5 人份 token、产出 5 人份价值,你只收 1 份钱(来源:MindStudio,2025,“AI Agent 不登录、不持证、可批量完成工作”)。
- Outcome 定价(如 Intercom Fin $0.99/已解决对话):收费=价值=成本对齐度最高,但结果难干净归因(见 §3 陷阱)。
第二步:对每个情景填”冲击传导链”
| S1 模型降价 50% | S2 竞品免费/捆绑 | S3 用量激增 2× | |
|---|---|---|---|
| COGS 变化 | 填 | 填 | 填 |
| 可收价格上限变化 | 填 | 填 | 填 |
| 留存/转化变化 | 填 | 填 | 填 |
| 毛利净效应(±%) | 填 | 填 | 填 |
| 现金跑道影响(月) | 填 | 填 | 填 |
第三步:标定”先断裂点”(first break)
对每一列,问一句:“这个情景下,第一个变成负数的指标是什么?需要多久?” 这就是你的预警阈值。
例:纯 token 转售(进价 X,加成 30% 卖出)在 S3 下,若你给了”无限用量”套餐,先断裂点是重度用户的边际毛利——用量超过套餐隐含阈值的瞬间转负。Anthropic 的应对就是 2026-02 引入 $20/员工/月基础费 + 全量按 token 计费,把”无限”改回”计量”(来源:The Register,2026-04-16)。
第四步:填”缓冲机制”与”应激预案”
每个先断裂点配一个缓冲。常见缓冲:
| 缓冲机制 | 对冲哪个情景 | 真实案例 |
|---|---|---|
| Hybrid 结构(基础费+用量超额) | S3(用量激增) | 2025 年 Hybrid 占比从 27% 升至 41%、Seat 从 21% 降至 15%,已成第一大类(来源:getmonetizely SaaS Pricing Benchmark 2025、Flexprice,多源一致) |
| 多模型路由 + 降级 | S1(模型降价)+ S3 | Cursor 多模型切换,不绑单一供应商;Cascade 路由可将均价降至原来 37%(来源:m209 - 推理成本控制手册) |
| Prompt Caching / 批量 API | S3(成本侧缓冲) | Anthropic 批量 API 全线折 50%、Prompt Caching 省 90% 输入费(来源:finout.io,2026) |
| 工作流锁定 / System of Record | S2(竞品免费) | GitHub Copilot 靠 2 亿仓库分发护城河抵御替代(来源:Microsoft 财报,2025) |
| Outcome/价值锚定定价 | S1(定价权流失) | Harvey 锚定”律师人力成本 5–7%“而非软件预算,绕开 API 降价传导(来源:eesel.ai/bindlegal,2025;〔Harvey 未公开确认 5–7% 比例〕) |
第五步:判定”凸/凹”并写下赌注
对三情景各打一个标签——凸(受益)/中性/凹(受损)——然后明确写出:“我把哪个凹象限当作可接受的赌注,理由是它发生概率低 / 我有缓冲 / 发生时我能快速切换。”
没有第五步,前四步只是表格练习。压测的产出是一句可被证伪的赌注,不是一张表。
§3 判断主轴:90% 的人在定价压测里会搞错的四个点
错位一:把”营收增长”当好消息,忽略毛利倒挂
- 症状: 用量涨了,营收报表很漂亮,团队庆祝。
- 为什么会错: 在定额/Seat 套餐下,token 成本随用量线性涨,但收入不涨。营收和毛利在 AI 产品里可以反向运动。
- 正确做法: 压测 S3 时,主指标是毛利率和重度用户的边际毛利,不是营收。AI 产品毛利率本就只有 50–60%(对比传统 SaaS 80–90%,来源:BVP Atlas),没有缓冲空间。
- 真实反例: Anthropic 2026 初的定价重构,本质是承认”用户增长把单位经济学打穿了”(来源:The Register,2026-04-16)。营收狂涨的同时旧定价不可持续。
错位二:把”模型降价”当纯利好
- 症状: “API 又降价了,我们成本下降,毛利改善。”
- 为什么会错: 模型降价同时打掉了你的定价权。如果你的产品价值就是”帮客户调好的 API”,客户看到 API 降价会要求你同步降价。成本降幅会被价格降幅吃掉甚至超过。
- 正确做法: 区分”成本侧降价”和”价值侧降价传导”。只有当你的价值锚定在 token 之外(工作流、数据、结果),模型降价才是纯利好。
- 真实反例: 价格套利型套壳(靠”我能拿到更便宜的 API”赚差价)在推理成本降约 80% 后,价差护城河直接消失(来源:本专题简报,机制 1)。
错位三:把 Outcome 定价当”价值对齐的银弹”
- 症状: “我们按结果收费,和客户利益完全一致,无懈可击。”
- 为什么会错: 真实业务结果难以干净归因,行业实践依赖代理指标(proxy metrics)。一旦用代理指标,就触发古德哈特定律——AI 会被优化去满足指标而非真实价值。
- 正确做法: 压测 Outcome 定价时,专门跑”代理指标被博弈”情景:如果 AI 学会让指标好看但价值没产生,你的计费基础就是虚的。
- 真实反例: Zendesk 的”自动解决”定义为”工单关闭后 72 小时无后续跟进”(来源:WebSearch,2024-08)——这不是真正的”解决”,只是代理信号;Salesforce Agentforce 原 $2/对话 因”什么算一次对话”争议,前两季 5,000 合同仅 3,000 付费,2025-05 被迫改版为 Flex Credits(来源:concret.io/SaaStr,2025)。
错位四:只压测”成本侧”,不压测”采购心理侧”
- 症状: 压测全是 COGS、毛利、跑道,没有一格是”客户采购部门怎么想”。
- 为什么会错: 定价模式的生死一半在采购心理。纯用量计费让 CIO 无法预测预算(90% CIO 把成本预测列为 AI 部署首要难题,来源:Pilot Blog,2026;78% IT 领导遭遇意外收费〔单一来源〕),即使单位经济学完美,采购也会拒签。
- 正确做法: 每个情景多填一行”采购可预测性变化”。这就是为什么 Seat 没死、而是演变为 Hybrid 基础层的原因——大企业要预算确定性,Microsoft Copilot 在 $30/席仍大量续签(来源:本专题简报)。
- 真实反例: 纯消费模式理论最优,但实践中”账单震惊”导致客户流失,反推 Hybrid 成为主流(27%→41%)。
§4 产品 PM 视角补盲:定价压测里的非工程盲点
-
用户心理模型:损失厌恶 vs 计量焦虑。 用量计费在心理上是”水表跳字”——用户每次操作都感到出血,会抑制使用,反而损害数据飞轮。Seat 的心理优势是”已付费,随便用”,鼓励重度使用。压测时要算”计量焦虑导致的使用抑制”对长期留存的隐性损伤,这是纯 ROI 模型看不见的。
-
GTM 摩擦:定价复杂度 = 销售周期。 Outcome / 多层 Credit 定价越”精巧”,企业采购越难评估、法务越难落合同。Salesforce 在一年内换了三套定价模型(来源:SaaStr,2025),每次换都是销售团队的重新培训成本。压测要把”定价变更本身的组织成本”算进去。
-
合规边界:结果定价的责任归属。 按”已解决工单”收费,意味着你在对结果背书。一旦 AI 给出错误的”已解决”(如法律、医疗场景),责任归属和赔付风险陡增。Outcome 定价在高风险垂直行业是合规雷区,不只是商业选择。
§5 对手框架回应
对手立场(业界主流”用量计费是未来”派,如 Flexprice/Monetizely 2025 数据驱动的乐观叙事): Seat 正死(21%→15%),Hybrid 崛起(27%→41%),用量/结果定价才是 AI-native 的归宿,Gartner 预测 2030 年 40%+ 企业 SaaS 支出转向用量/Agent/结果计费。
接受的部分: 方向正确。Seat 与”用户数=价值”的解耦是真实且不可逆的,AI Agent 从根本上破坏了人头计费的逻辑。Hybrid 占比反超也是硬数据。
坚持的边界与赌注: 但”用量计费是终点”是过度外推。
- 同一个 Gartner 也预测 40%+ Agentic AI 项目将在 2027 年底前被取消(来源:Gartner 官网新闻稿,2025-06-25)。两个数据同源、方向相反——说明 Agentic 商业化仍处高度不确定期,押注”结果定价成主流”为时过早。
- 用量计费的”采购不可预测性”是结构性硬约束,不是过渡期摩擦。只要企业还有年度预算制度,Hybrid 的”基础层提供确定性”就有不可替代的位置。我赌的是:终局不是 Seat 死、用量赢,而是 Hybrid 长期占主导,纯用量与纯 Outcome 各自占据特定产品形态的利基。
这个判断在哪失效: 如果未来 2–3 年企业财务系统普遍内建”AI 用量实时预算管控”(让用量变得可预测),那么我对”采购心理是用量计费天花板”的判断会失效,纯用量定价的份额会比我预期的更大。
§6 跨域呼应:金融压力测试的认识论搬运(Rick 未必读过的对手框架)
调度框架: 2008 金融危机后的银行压力测试方法论(Fed 的 CCAR / DFAST 框架)。
银行压测的核心认识论贡献,恰恰是定价 PM 最缺的那一课:它放弃了”预测概率”,转而采用”假设情景已发生、量化损伤”。 监管不问”金融危机会不会来”,而是规定一个”严重不利情景”(severely adverse scenario),让每家银行算出在该情景下的资本充足率。这套思路直接可搬:定价 PM 不该花时间争论”模型会不会降价 50%“,而该假设它已经发生,算出毛利和跑道的损伤。
更深一层,压测框架还贡献了**“反身性”(reflexivity)警觉**——Soros 意义上的:压测情景本身会改变行为。当 Anthropic 公开承认”旧定价不可持续”并涨价,这个动作本身会触发客户重新评估、竞品趁机挖角,冲击因被应对而变形。定价压测必须把”我的应激动作会引发的二阶反应”也纳入剧本第四步,否则你对冲了一阶冲击,却被自己应对动作的二阶后果反噬。
这正是金融压测后来引入”动态/多轮压测”的原因,也是本节点剧本第四步要求填”应激预案”而非仅”缓冲”的理由——缓冲是静态的,预案是考虑了反身性的动态响应。
[!note] 赌注 我把”金融压测方法论可直接迁移到产品定价”当作一个有边界的类比,而非严格同构。失效边界:银行压测有监管强制的标准情景,定价压测没有——情景设定的主观性是这套方法的最大弱点。谁来定义”严重不利情景”,本身就是判断而非计算。
§7 PM 决策启示
- 面试怎么用: 被问”你怎么给 AI 产品定价”,不要直接答模式,先反问”在三个压力情景下哪个模式先崩”——展示你想的是抗冲击性而非价格点。能当场画出 §2 的五步剧本 = 顶 1% 答案。
- 选型怎么用: 评估一个 AI 供应商时,把它的定价套进 S1/S2/S3,问”模型降价时你会不会同步降价给我""用量激增时我的账单天花板在哪""巨头免费捆绑同类能力时你靠什么留住我”。答不上来 = 它没做过压测,未来会把不确定性转嫁给你。
- 复现怎么用: 给自己的产品定价提案做内部 review 时,强制填完 §2 的第三步(先断裂点)和第五步(赌注)。这两步是大多数定价文档缺失的,补上它们就超过了 90% 的同行。
§8 与已有节点的关系
- 对照 A04 Outcome-based 定价的概念边界:A04 是概念边界辨析(Outcome 定价到底算到哪一步、代理指标的真伪),本节点是动态压力测试(任一模式在冲击下怎么变形)。A04 回答”这种模式的定义边界在哪”,R03 回答”选了之后怎么验证它扛不扛揍”。本节点不复述 A04 的概念辨析,直接把它的结论(代理指标陷阱)当作 §3 错位三的压测要点。这是”补缺”关系——A04 缺的动态抗冲击维度由 R03 补上。
- 对照 G02 定价模式演化详解·Seat 到 Usage 到 Outcome:G02 讲的是定价范式为什么会发生历史性迁移(Seat→Usage→Outcome 的代际驱动力),是时间维度;R03 把 G02 揭示的迁移力当作压测情景 S1/S2/S3 的历史依据——G02 说”Seat 正被 token 经济侵蚀”,R03 把这句话翻译成”所以你的 Seat 模型要跑 S3 压测”。这是”深化”关系——G02 给出”变化方向”,R03 给出”变化幅度下你怎么活”。
- 对照 m209 - 推理成本控制手册:m209 停在”工程降本手段”层(缓存/路由/压缩),本节点把这些手段当作压测第四步的缓冲机制调用——把工程能力翻译成商业抗脆弱性。这是”升高抽象层”关系:同样的 Cascade 路由,m209 视角是”省钱”,R03 视角是”对冲 S1/S3 的护城河”。不复述 m209 的实现细节。
§9 关联节点
核心(必读):
- A04 Outcome-based 定价的概念边界(本节点的压测对象,代理指标陷阱来源)
- G02 定价模式演化详解·Seat 到 Usage 到 Outcome(压测情景的历史依据)
- m209 - 推理成本控制手册(缓冲机制的工程来源)
- Anthropic(S3 用量激增 + 定价重构的一手案例)
延伸(可选):
- Perplexity(产品形态领先、单位经济亏损的 pessimistic case)
- ChatGPT、OpenAI(S2 竞品免费/GPT Store 案例)
- Claude(多模型路由对冲 S1 的实例)
- 0133新制度经济学(交易成本视角看定价复杂度的采购摩擦)
§10 修订日志
- 2026-06-07 R1:首稿。按宪章 §4 十一段骨架建立三情景压测框架;接入金融压测方法论(CCAR/DFAST)作跨域呼应;A04/G02 双链已对照 staging 实际 basename 校正。
- 2026-06-07 R1.1:WebSearch 接地校验。Hybrid 占比经多源核实修正(见正文);其余数字保留来源标注。〔待核实项:78% IT 领导意外收费单一来源、Harvey 5–7% 比例未经厂商确认。〕