R

R03 Unit Economics 模型·CAC COGS LTV 与盈亏平衡

创建 2026-06-07 更新 2026-06-11 13 条双链 成本工程 专题 AI 整理

R03 Unit Economics 模型·CAC COGS LTV 与盈亏平衡

本节点要解决的问题:一个 AI 产品到底赚不赚钱,PM 怎么用一张能在定价会上摊开、能被任何一行追问的表算清楚? 前面 R01 最小可运行·Token 成本计算器 把”一次对话”变成了 per-query 单价,但单价本身不回答商业问题——它要除以转化率、乘以人均调用量、减去 CAC、对齐 LTV,才知道这个产品能不能活。本节给出一套可复用的 unit economics 表格模型(变量字典 + 计算链 + 盈亏平衡 + 敏感性分析),框架名借自风投/SaaS 财务,但本节的核心立场是:SaaS 的 unit economics 模板直接套在 AI 产品上会系统性骗你,因为 AI 的 COGS 是随用量线性增长的变动成本,不是 SaaS 那个边际成本≈0 的虚线。


§0 为什么是 unit economics 这个框架,而不是”毛利率”或”ROI”

PM 谈 AI 产品的钱,脑子里常蹦出三个框架,挡掉错的两个是本节第一步:

  • 错误框架一:公司层 P&L 毛利率。 “我们整体毛利 60%“是一个被研发摊销、被高价大客户拉高、被免费用户拉低后的混合数字,它告诉你公司活不活,但不告诉你”再多一个用户”是赚还是赔。AI 产品最致命的恰恰是后者——一个重度白嫖用户可能单月烧掉你十个付费用户的利润,混合毛利率把这件事完全藏住。
  • 错误框架二:项目 ROI。 ROI 适合一次性投资(建一个数据中心值不值),但 AI 产品的成本是每次调用都在发生的流量,不是一次投入。用 ROI 思考会让你忽略”成本随用量线性爬升”这个 AI 特性。
  • 正确框架:unit economics(单位经济模型)。 它把视角钉在”一个单位(通常是一个付费用户 / 一个 seat)“上,问三件事:获取它花多少(CAC)、留住它期间它贡献多少毛利(LTV)、服务它每月烧多少(per-user COGS)。只有在”单位”这个粒度上,AI 的变动成本结构才暴露出来。

[!note] 一句话辨析 Unit economics 不是”算毛利率”,是把毛利率拆到单个用户粒度,再把这个粒度的成本结构看清楚。对 SaaS,这一步常常可省(边际成本≈0,多一个用户几乎不增成本);对 AI,这一步是生死线(多一个用户=多一份随其用量增长的推理账单)。这正是 A01 成本概念史与口径辨析 反复强调的”AI 产品 COGS≠SaaS COGS”在复现层的落地。


§1 变量字典:一张表先把”未知数”列全

任何 unit economics 模型的第一性工作是把所有变量显式列出来并标注口径——这一步比算数重要十倍,因为 AI 产品的坑全在”口径”上(见 A02 成本对象层级辨析·per-token per-query per-task per-user per-seat)。下表是可复用的变量字典(建表时按此填):

符号变量口径/单位典型来源不确定性
P月订阅价元/用户/月(区分含税/不含税、年付折扣)定价决策可控
Q人均月调用量queries/user/month留存+使用数据,上线前是
c_qper-query 推理成本元/query(来自 R01 最小可运行·Token 成本计算器,含 input/output/缓存/重试)R01 计算器
c_other每用户其他变动成本元/用户/月(向量库/检索/存储/带宽/三方 API)架构核算
r_free免费→付费转化率%漏斗数据,上线前是
n_free每付费用户背后的免费用户数漏斗结构
c_free单个免费用户月成本元/月(免费额度内的推理)R01 × 免费额度
CAC单付费用户获取成本元(市场+销售÷新增付费数)财务
m月留存率 / churn%(churn = 1 - m留存曲线,上线前是
gm%毛利率%(=毛利÷收入)计算得出

[!warning] 三个高不确定变量决定一切 Q(人均调用量)、r_free(转化率)、m(留存)这三个上线前全是猜的变量,对结论的影响远大于 token 单价。这正是 §5 必须做敏感性分析、而非给单点估计的根本原因——见末尾 Polanyi 默会知识与提示工程的认识论张力 的认识论拷问。


§2 计算链:从 per-query 到盈亏平衡的六步

把变量字典串成一条可在表格里逐行计算的链。每一行都是一个可被追问的判断,这是它能贴进评审 deck 的原因。

  1. per-user 月推理成本 = Q × c_q
  2. per-user 月变动成本(COGS) = Q × c_q + c_other —— 注意:还要把分摊到这个付费用户头上的免费用户成本算进真实服务成本。
  3. 付费用户分摊的免费成本 = n_free × c_free(免费额度=获客成本,见 A07 成本约束反向塑造产品
  4. 真实 per-user 月成本 = Q × c_q + c_other + n_free × c_free
  5. per-user 月毛利 = P − (Q × c_q + c_other + n_free × c_free)毛利率 gm% = 月毛利 ÷ P
  6. LTV = 月毛利 ÷ churn = 月毛利 ÷ (1 − m)(最简口径,未折现);LTV/CAC 比 = LTV ÷ CAC

盈亏平衡(两个层次,别只算一个)

  • 单位级盈亏平衡月毛利 > 0 才是健康单位经济;若 Q × c_q + c_other + n_free × c_free ≥ P每多一个付费用户都在亏,规模越大死得越快(这是 AI 产品独有的”负向规模效应”,SaaS 几乎不会发生)。
  • 回收级盈亏平衡(CAC 回收期)回收月数 = CAC ÷ 月毛利。SaaS 业界经验线是 LTV/CAC ≥ 3、CAC 回收期 ≤ 12 个月——这条”3:1 + 12 月回收”法则由 David Skok(Matrix Partners)约 2010 年从 HubSpot/Salesforce/NetSuite 等成熟上市 SaaS 的稳态数据提炼并推广(来源:David Skok forEntrepreneurs SaaS metrics;经多方复述,见 The SaaS CFO / Kellblog 等)。⚠️这是稳态成熟 SaaS 的经验法则,不是 AI 早期产品的硬指标——它的原始前提是”churn 稳定、多年 LTV 窗口、回收期稳稳低于 12 月”,早期 AI 产品几乎都不满足这些前提,照搬 3:1 上 board deck 是被广泛批评的误用。

[!note] 可直接复制的表格模型(填数即用)

公式A 方案(GPT-4o 类)B 方案(路由+缓存)
月价 P输入〔填〕〔填〕
人均月调用 Q输入〔填〕〔填〕
per-query 成本 c_q来自 R01〔填〕〔填〕
其他变动 c_other输入〔填〕〔填〕
免费分摊 n_free×c_free输入〔填〕〔填〕
真实月成本Q·c_q+c_other+n_free·c_free=计算=计算
月毛利P−真实月成本=计算=计算
毛利率月毛利/P=计算=计算
LTV月毛利/(1−m)=计算=计算
LTV/CACLTV/CAC=计算=计算
CAC 回收月数CAC/月毛利=计算=计算

把这张表打印出来贴在定价会的白板上——A vs B 两列一摆,“该不该上路由+缓存(R02 中型·模型路由 + 语义缓存 降本实验)“这个问题就从工程嘴里的”能降本 X%“变成了商业嘴里的”毛利率从 a% 升到 b%、回收期从 c 月缩到 d 月”。


§3 一个走完的算例(标注口径,数字均为示意/可替换)

为让框架可感,走一遍示意算例(所有单价为占位,真实建表时从 R01 + 官方定价填入)。

设:月价 P=150 元,人均月调用 Q=300 queries,per-query 成本 c_q=0.10 元,其他变动 c_other=5 元,每付费用户背 4 个免费用户、每免费用户月成本 2.5 元(n_free×c_free=10 元),月留存 m=0.92(churn 8%),CAC=200 元

  • 真实月成本 = 300×0.10 + 5 + 10 = 45 元
  • 月毛利 = 150 − 45 = 105 元;毛利率 = 105/150 = 70%
  • LTV = 105 / 0.08 ≈ 1,313 元;LTV/CAC = 1,313/200 ≈ 6.6(健康)
  • CAC 回收期 = 200/105 ≈ 1.9 个月(健康)

同一张表,把 Q 从 300 改成重度用户的 1,500: 真实月成本 = 1,500×0.10 + 5 + 10 = 165 元 > 150 元——月毛利 −15 元,这个用户每月在亏。 这就是 AI unit economics 的命门:结论对人均调用量极度敏感,而 SaaS 模型里这一项几乎不影响成本。 一个被混合毛利率藏住的真相是:你的盈利可能完全建立在轻度用户补贴重度用户上,一旦重度用户占比上升(往往随产品做得越好越发生),整盘账翻负。

[!warning] 数字纪律 上面 c_q=0.10 等均为示意占位,不是任何真实模型的实际成本。真实建表必须从 R01 最小可运行·Token 成本计算器 按当期官方定价算出 c_q 再代入;token 单价 volatile,标〔以2026-06定价·待核实〕。本节示意算例的价值在结构与敏感性,不在具体数值。


§4 判断主轴:90% 的人在 unit economics 上会栽的四个点

这一节是本节点的命门。每点带 症状 → 为什么会错 → 正确做法 → 真实反例 四件套。

错位一:用 SaaS 的”边际成本≈0”直觉建 AI 的表

  • 症状:表里把 COGS 当成固定的”基础设施摊销”,认为”多一个用户成本几乎不增”,于是把毛利率当常数(“我们 80% 毛利”)。
  • 为什么会错:SaaS 的边际服务成本确实趋近 0(一份代码服务一万人和一人,成本几乎一样);但 AI 的每一次推理都在实时烧 GPU/token,COGS 是随用量线性增长的变动成本。把变动成本当固定成本,毛利率会随用户活跃度上升而下降,而你的模型里它纹丝不动。
  • 正确做法:COGS 项必须写成 Q × c_q 的函数式,让它随 Q 浮动;毛利率是 Q 的减函数,必须画出”毛利率 vs 人均调用量”曲线,而非给单点。
  • 真实反例:a16z 在《The New Business of AI (and How It’s Different From Traditional Software)》与《Navigating the High Cost of AI Compute》中明确指出:传统 B2B SaaS 长期享受 80–90% 毛利,而 AI-first 产品因每次用户动作都触发一次”算力密集的变动成本”,毛利结构性下沉——LLM-native 公司毛利约 65%、AI-first B2B 普遍落在 50–65% 区间,且服务更多用户的边际成本”远不趋近 0、而是随用量大致线性增长”(来源:a16z 上述两文,2020/2023;〔具体百分比区间为 a16z 与后续行业分析复述·以原文为准〕)。把 SaaS 的 80% 毛利模板套上去,第一个月账单就会打脸。

错位二:盈亏平衡只算”回收期”,不算”单位级是否为正”

  • 症状:表里算了 CAC/月毛利 = 回收期,看到”8 个月回本”就拍板,没回头检查”月毛利本身是不是正的”。
  • 为什么会错:回收期公式在月毛利为负时会给出一个负数或无穷大的荒谬结果,但人眼容易忽略符号,只盯”几个月”。AI 产品里”每个付费用户都在亏”是真实存在的(重度用户、免费分摊过重、定价偏低),此时谈回收期毫无意义——规模越大亏越多。
  • 正确做法先验单位级(月毛利>0),再算回收级(回收期)。两道闸门,顺序不能反。
  • 真实反例:早期不少 AI 套壳产品定一个低价吸量、免费额度给得很慷慨,结果在重度用户 + 免费分摊双重挤压下单位级为负——这正是 A07 成本约束反向塑造产品 讲的”免费额度=获客成本”必须进 COGS 的原因,也是 E03 一个 RAG Agent 产品的 unit economics 拆解 里多步 Agent 把 per-query 成本顶到几倍后单位经济翻负的真实形态。

错位三:LTV 用”收入”算而不是”毛利”算

  • 症状LTV = 月收入 / churn,把整个订阅费当成”价值”。
  • 为什么会错:LTV 的本意是”这个用户一生贡献的利润”,AI 产品的服务成本动辄吃掉 30–50% 收入,用收入算 LTV 会系统性高估 LTV/CAC,让你在该刹车时踩油门。SaaS 时代很多人用收入算 LTV 还能蒙混(成本占比低),AI 时代这个偷懒会致命。
  • 正确做法LTV = 月毛利 / churn,且毛利必须扣掉免费分摊与重试成本。严谨场景还应折现(除以贴现率),但 PM 决策用未折现的简口径即可,关键是用毛利不用收入
  • 真实反例:用收入算,§3 算例的 LTV 会从 1,313 元虚高到 150/0.08≈1,875 元,LTV/CAC 从 6.6 虚高到 9.4——一个让你误判产品”超健康”的认识论幻觉。

错位四:给盈亏平衡点一个精确的单点数字

  • 症状:deck 上写”盈亏平衡用户数 = 12,473 人""毛利率 68.4%“,精确到小数位。
  • 为什么会错Q/r_free/m 三个核心变量上线前全是猜的(见 §1),输入是区间,输出却写成单点,是把估计的不确定性伪装成计算的确定性——典型的认识论越权(见末尾 Polanyi 调度)。
  • 正确做法:盈亏平衡点必须给区间 + 敏感性(“在留存 88–94%、人均调用 250–400 的范围内,盈亏平衡用户数在 1.0 万–1.6 万之间”),并在表旁附 §5 的敏感性矩阵。
  • 真实反例:把单点估计当军令状,三个月后实际留存比假设低 5 个点,“已盈利”的项目突然变成”还要烧半年”——单点数字的精确感恰恰是它最危险的地方。

§5 敏感性分析:unit economics 表的灵魂,不是可选项

单点估计在 AI 产品里几乎一定错(§4 错位四),所以敏感性分析不是加分项,是这张表能不能用的前提。两种做法,PM 都要会:

(1)单因子扫描(tornado 图思维):固定其他变量,单独让一个变量在合理区间走,看月毛利的摆幅。AI 产品里摆幅排序通常是 Q(人均调用)> m(留存)> c_q(单价)> CAC——这个排序本身就是结论:别把降本精力全压在抠 token 单价上,人均调用量和留存对盈利的杠杆更大(呼应 A07 成本约束反向塑造产品:用 rate limit/context 上限控住 Q 的尾部,比省 token 更直接保毛利)。

(2)双因子情景矩阵:选两个最不确定的变量(通常 Q × m),做一张”在不同人均调用 × 留存下,单位月毛利正负”的网格表:

月毛利(元)留存 m=0.85m=0.90m=0.94
Q=200〔填〕〔填〕〔填〕
Q=600〔填〕〔填〕〔填〕
Q=1200〔填〕〔填〕(可能转负)〔填〕

把”转正/转负”的边界用颜色标出来,一眼看到自己赌的是网格里哪一格——这比任何单点数字都诚实。

[!note] 跨域呼应:Polanyi 默会知识 × Jevons 悖论 Polanyi 默会知识与提示工程的认识论张力 在这里改变的判断是:unit economics 表里写满了数字,但 Q/r_free/m 这三个最关键的数本质是默会估计(上线前没人真知道,靠类比经验”猜”)——把它们代进公式得到的”盈亏平衡点”是显性精确性包裹着的默会不确定性。正确的认识论姿态不是追求更精确的单点,而是承认这是估计、用敏感性分析把不确定性显式化。A07 成本约束反向塑造产品 调度的 Jevons 悖论 在敏感性里有一个反直觉推论:当你把 token 单价 c_q 降下去(路由+缓存),用户可能因为”反正便宜/不限量”而提高 Qc_q↓Q↑ 部分吃掉——所以敏感性矩阵不能假设变量相互独立,降本动作本身会移动调用量。这是 SaaS 模型里不存在的耦合。


§6 对手框架回应:接受”先上线再算账”,但标出 AI 的边界

对手立场(精益创业 / “unit economics 是后期的事”派):以 Eric Ries《精益创业》为代表的主流创业方法论主张——早期产品最该优化的是 product-market fit 和增长,过早纠结 unit economics 会拖死迭代速度;先把用户做起来,成本结构后面再优化。这个立场在传统 SaaS/消费互联网历史上被反复验证(无数公司靠”先增长后盈利”成功)。

接受的部分:完全同意。MVP 阶段为了一两个百分点的毛利去做复杂的路由+缓存工程,是典型的过早优化;早期数据噪声大,精算 unit economics 确实是认识论幻觉(这恰是 §4 错位四和 Polanyi 调度的延伸)。我不主张早期就把表算到小数位。

坚持的边界(AI 让这条经验法则部分失效):传统 SaaS”先增长后盈利”成立的隐含前提是边际成本≈0——多服务一个用户不增成本,所以可以放心先增长。AI 产品没有这个前提:每个用户都在实时烧推理成本,“先增长”意味着”先按比例烧钱”,且 A07 成本约束反向塑造产品 指出 AI 成本是分钟级失控的(一个 prompt 循环就能烧穿预算)。所以 AI 时代的修正版是:早期不必精算 unit economics,但必须知道单位级毛利的符号(正还是负),并搭好成本熔断(见 S03 FinOps for AI·成本可观测与归因全景。可以不知道是赚 105 还是 95,但绝不能不知道是赚还是赔——因为赔的话,增长越快死得越快。这是精益创业经验法则在变动成本结构下的失效边界。

失效场景(本节自己的边界):当推理成本占客单价比例极低时(如低频高价 B2B 工具,per-query 成本远小于客单价),上述所有焦虑都消失——unit economics 由 CAC 和销售成本主导而非推理成本,此时本节的”COGS 随用量线性增长”判断不再是主要矛盾,强行用成本视角解释会误判(对应总览 §7 failure scenario #1)。


§7 产品 PM 视角补盲:表之外的三个”看走眼”点

工程视角的 unit economics 容易只盯成本-收入数字,但 PM 还要看见三件表里没有的事:

  1. 用户心理:免费额度是”锚”不是”成本”。 慷慨的免费额度短期拉转化,但它同时抬高了用户的心理基准线——一旦收窄会触发强烈流失(用户感觉”被剥夺”,而非”恢复正常”)。所以 n_free×c_free 这一项不能只当成本算,要当成”一旦定下就很难收回的承诺”算,定免费额度比定价更不可逆。
  2. 商业模式:seat-based vs usage-based 的根本张力。 订阅制(seat)让收入可预测但与成本脱钩(重度用户亏、轻度用户赚,靠组合平衡);用量计费(usage)让收入与成本对齐但用户讨厌不确定账单。AI 产品的成本本质是 usage-based,定价却常被迫 seat-based(用户偏好),这个错配是 unit economics 表里最大的结构性风险来源(详见 A02 成本对象层级辨析·per-token per-query per-task per-user per-seat 的 per-seat 口径)。
  3. 合规边界:端侧分流改写 COGS 但带来质量回退。 把部分推理推到端侧(A06 端侧与云端成本重构)能把 c_q 显著压低,但端侧模型质量回退可能降低留存 m——在敏感性矩阵里,c_q↓m↓ 是反向的,净效果要在表里联算,不能只算省下来的那半边。

§8 PM 决策启示:面试 / 选型 / 复现三类落地

  • 面试桌:被问”你怎么判断一个 AI 产品赚不赚钱”,不要答”看毛利率”,答”我会建一张 per-user unit economics 表,先验单位级月毛利符号、再算 LTV/CAC 和回收期,关键是对人均调用量和留存做敏感性——因为 AI 的 COGS 是变动成本,重度用户可能让单位经济翻负”。这一段话直接把你和”只会背 CAC/LTV 名词”的人区分开。配 §3 的”Q 从 300 到 1500 翻负”算例讲 60 秒,就是一个带数字的真实判断。
  • 选型会:拿 §2 的双方案表(A=直接调大模型,B=路由+缓存),把工程的”降本 X%“翻译成”毛利率 a%→b%、回收期 c→d 月”,让降本决策从工程语言变成商业语言——这是 PM 在选型会上的不可替代价值。
  • 复现台:把 §2 表格模型做成一个 spreadsheet(或接 R01 最小可运行·Token 成本计算器 的输出),所有输入参数化,敏感性用数据表/条件格式实现——这是一个能直接贴进定价 deck 的可复用资产。

§9 与已有节点的关系(不复述其事实基础)

  • m202 - 工程选型决策矩阵 的深化:m202 §2.2.2 的”成本预算”维度是定性的隐性成本判断(提醒你别只看 API 单价),本节给它一张可定量填的 unit economics 表,把”成本预算”从定性提醒升级为可算出盈亏平衡点的定量工具。m202 告诉你”选型要算隐性成本”,R03 告诉你”隐性成本怎么算成一个毛利数字”。
  • E03 一个 RAG Agent 产品的 unit economics 拆解 的工具化:E03 是把这套框架用在一个具体 RAG/Agent 产品上的病理学剖解(实例),R03 是从那个实例抽出来的可复用空表模型(操作手册)。E03 回答”这个产品赚不赚钱”,R03 回答”任何产品你怎么自己建表算”。两者是实例↔模板关系。
  • R01 最小可运行·Token 成本计算器 的上承:R01 产出 c_q(per-query 成本),R03 把 c_q 作为一个输入变量接进商业账——R01 是”贵不贵”,R03 是”赚不赚”。
  • m209 - 推理成本控制手册 的抽象层升高:m209 停在”工程降本手段清单及其降幅”(缓存/路由/语义缓存),R03 把这些降幅接到毛利和盈亏平衡上,回答”这个降本动作值不值得做”——从工程账升到商业账。不复述 m209 的具体手段与降幅数字。
  • 对话 A07 成本约束反向塑造产品:A07 是判断主轴(产品决策是成本的影子),R03 是它在复现层的”算账证据”——免费额度、rate limit、context 上限这些 A07 讲的产品决策,在 R03 表里全是具体的成本项和敏感性杠杆。

§10 关联节点

核心(必读)

延伸(可选)


§11 修订日志

  • R0(2026-06-07,初稿):按宪章 §4 十一段骨架与总览 §3/§4 蓝图写成。§0 框架辨析挡掉”公司毛利率/项目 ROI”两个错误框架;§1 变量字典(10 变量,标注三个高不确定变量);§2 六步计算链 + 可复制表格模型(A/B 双方案);§3 走完一个标注口径的示意算例(含”Q 翻 5 倍单位经济转负”的命门展示);§4 判断主轴四点全配症状→为什么错→正确做法→真实反例四件套(SaaS 直觉/只算回收期/LTV 用收入/单点估计);§5 敏感性分析(单因子排序 + 双因子情景矩阵)+ Polanyi×Jevons 跨域呼应(Jevons 给出”降单价被涨用量吃掉”的变量耦合反直觉推论);§6 对手框架回应(精益创业”先上线再算账”派,接受+AI 边界+失效场景);§7 产品 PM 补盲三点(免费额度心理锚/seat-vs-usage 张力/端侧质量回退);§8 面试-选型-复现三类落地;§9 与 m202/E03/R01/m209/A07 显式升级对照(不复述);§10 核心/延伸分档关联节点;双链全部来自总览确认存在的名。数字纪律:所有单价/比率(§3 算例、§5 矩阵)均显式标为示意/占位,token 单价标〔以2026-06定价·待核实〕(不硬编任何真实单价,c_q 须从 R01 当期定价算出)。
  • R1(2026-06-07,grounding 接地):WebSearch 核实两处经验/行业事实并升级。①LTV/CAC≥3 + 12 月回收:确认由 David Skok(Matrix Partners)约 2010 年从 HubSpot/Salesforce/NetSuite 稳态数据提炼,§2 补出处并显式标注”是稳态成熟 SaaS 法则、非 AI 早期硬指标”(来源 David Skok forEntrepreneurs,The SaaS CFO / Kellblog 复述)。②AI 毛利结构性低于 SaaS:确认 a16z《The New Business of AI》《Navigating the High Cost of AI Compute》论点——传统 SaaS 80–90% 毛利、LLM-native 约 65%、AI-first B2B 50–65%,边际成本随用量近似线性而非趋近 0;§4 错位一真实反例补具体区间与出处。两处从〔待核实〕升级为已接地。遗留待核实(1 项):token per-query 单价 c_q volatile,§3/§5 一律占位,标〔以2026-06定价·待核实〕,由 R01 当期定价支撑,不在本节硬编。待后续轮次:与 E03 落稿后对齐示意算例口径避免重复。