R01 给一个 AI 产品建 UE 模型 Sheet · 知识库

当一个 AI 产品在融资材料里写”我们毛利 75%、LTV/CAC = 4.2”时，它大概率是把一张传统 SaaS 的财务模板原封不动套了上去——而这张模板里最致命的一格被悄悄改写了：COGS 不再趋近于零，而是随每一次用户交互线性流血。本节点不讲护城河”是什么”，只讲一件可以今晚就动手的事：给一个 AI 产品建一张能经得起投资人和你自己拷问的单位经济学（Unit Economics, UE）模型 Sheet。它给出一套可复制的字段模板（COGS / CAC / LTV / 毛利 / 敏感性五块），把 m209 - 推理成本控制手册的工程降本手段接到财务报表上，并落地一个 brief 的核心判断：AI 产品的 UE 不是一个静态数字，它是模型价格与使用规模两个外生变量的函数——同一个产品，在不同的 token 价格和不同的重度用户占比下，可以同时”看起来盈利”和”实际在烧钱”。

§0 为什么用”UE 模型 Sheet”框架，而不是”毛利率一个数”

业界（以及多数 AI 创业公司的 BP）评估 AI 产品经济性的默认框架是”报一个毛利率”。这个框架对 PM 和投资人都有害，因为它把一个分布压成了一个点估计。传统 SaaS 可以这么做——它的边际成本趋近于零，所以”一个用户”和”一个重度用户”的成本几乎一样，平均毛利率就是真相。AI 产品恰恰相反：边际成本（推理 token）随使用量线性增长，而使用量在用户间是极度长尾的——5% 的重度用户可能消耗 80% 的 token。这意味着”平均毛利 70%“这个数字背后，可能藏着”头部 5% 用户毛利为负、靠尾部 95% 轻用户补贴”的结构性炸弹。

[!note] “一个数 vs 一张分布表”的框架级辨析：报一个毛利率回答的是”平均下来赚不赚钱”；建一张 UE 模型 Sheet 回答的是”在哪个用户分位、哪个模型价格、哪个使用规模下开始亏钱”。前者是会计视角，后者是 PM/经营视角。本节点坚持后者——因为 AI 产品的死法不是”平均亏钱”，而是”增长得越快、重度用户越多、亏得越狠”（负向规模经济），这只有分布表能照出来。

所以”UE 模型 Sheet”框架的第一性原理是：把成本对象从”一个公司”下沉到”一个可计费单元”，再把这个单元放进一张能跑敏感性的表里。下沉到哪一层是第一个判断主轴（见 §1），跑哪几个敏感性变量是第二个（见 §5）。这一步框架级辨析挡掉了读者脑中的默认错误框架——“AI 产品的经济性可以用一个毛利率概括”。

§1 第一步:定义”可计费单元”——成本对象下沉的五层

建 UE 表之前必须先回答一个问题:你的”一个单元”是什么? 这是整张表的地基,选错了后面全错。AI 产品的成本对象有五层可选,对应 m209 - 推理成本控制手册里讨论过的 token 计费,但要升一个抽象层:

计费单元层	定义	适用产品	UE 表里的”单元成本”是什么	陷阱
per-token	每百万 input/output token	基础设施/API 转售	直接的 API 账单	output 比 input 贵 2–5×,均价被 output 占比拉高
per-query	每次问答/检索	答案引擎、搜索	单次完整调用的 token 成本(可能含多跳)	RAG 产品一次 query = 检索+生成双成本
per-task	每个完成的任务/Action	工作流 Agent	一个任务链路所有 LLM 调用之和	Agent 多步推理,一个 task 可能 = 几十次调用
per-resolution	每个被解决的结果	客服/工单 Agent	解决一个问题的全部成本(含失败重试)	失败的尝试也烧 token,但不产生收入
per-seat / per-user	每个付费席位/用户每月	Copilot 类订阅	该用户当月所有调用之和	长尾:重度用户成本可达均值的 10–50×

核心判断(brief 落地): 你的 UE 单元应该选在你的定价单元那一层,否则收入和成本对不齐。如果你按 per-seat 收 $20/月(如 Cursor Pro $20/用户/月、GitHub Copilot Business $19/用户/月,均为公开定价),但成本是 per-token 发生的,那么你的 UE 表的核心一格必须是”单个 seat 当月的 token 成本分布”,而不是平均 token 成本。这正是 Anthropic 2026 年初放弃含用量的企业 Seat 捆绑包、改为基础费 + 纯 Token 计费的原因——按 IntuitionLabs CEO 的说法,“用户增速超过产能扩张速度,旧定价单位经济学不成立”(来源:The Register, 2026-04-16)。Seat 定价 + token 成本 = 定价单元和成本单元错位,重度用户把你的 UE 拖垮。

§2 UE 模型 Sheet 模板·五块字段(可直接复制进 Google Sheets / Excel)

下面是可复用模板。每块给出字段、公式、和 AI 产品相对传统 SaaS 必须改写的格子(用 ⚠️ 标注)。所有示例数字均标〔示意〕,真实建表时替换为你的实测值。

Block A — 输入假设区 (Assumptions)

字段	示例值〔示意〕	说明
月订阅价 ASP	$20/用户/月	你的定价单元
input 单价	$3/MTok	⚠️ 外生变量,见 §5。示例取 Claude Sonnet 4.6 公开价 $3/$15(来源:Anthropic 定价页)
output 单价	$15/MTok	⚠️ output 通常 2–5× input
平均用户月 input token	2 MTok〔示意〕	实测
平均用户月 output token	0.5 MTok〔示意〕	output 量小但单价高
Prompt Caching 命中率	60%〔示意〕	⚠️ 缓存命中部分省约 90% input 费(来源:Anthropic 定价页),见 m209
重度用户(P95)token 倍数	12×〔示意〕	⚠️ AI 专属:长尾倍数,UE 成败关键
月毛流失率	5%〔示意〕

Block B — COGS(单位成本)⚠️ 这块是 AI 产品和 SaaS 的分水岭

平均用户月 LLM 成本 =
   (input_token × input单价 × (1 − 缓存命中率 × 0.9))
 + (output_token × output单价)

示意:= (2 × $3 × (1 − 0.6×0.9)) + (0.5 × $15)
      = (2 × $3 × 0.46) + 7.5
      = $2.76 + $7.5 = $10.26 / 用户 / 月

COGS 子项	平均用户〔示意〕	P95 重度用户〔示意〕
LLM 推理成本	$10.26	$10.26 × 12 = $123
向量库/检索(RAG 产品)	$1.0	$8.0
其它基础设施摊销	$1.0	$1.0
单位 COGS 合计	$12.26	$132

⚠️ 致命格子: 重度用户单位 COGS $132 > ASP $20——重度用户每个月净亏 $112。这一格是传统 SaaS 模板里根本不存在的,因为 SaaS 的边际成本≈0。这就是为什么 ChartMogul 2025 年 N=2,100 的样本显示 AI 原生公司中位 NRR 仅 48%、GRR 仅 40%,而低价位(<$50/月)AI 产品 NRR 低至 32%——便宜的订阅价 + 长尾重度用户成本 = 越用越亏(来源:ChartMogul, SaaS Retention: The AI Churn Wave, 2025)。

Block C — 毛利(Gross Margin)

平均单位毛利 = ASP − 单位COGS = $20 − $12.26 = $7.74  → 毛利率 38.7%
混合毛利率(考虑长尾) 见 §5 敏感性

⚠️ AI 应用层实测毛利率约 50–60%,低于传统 SaaS 的 80–90%(来源:BVP Atlas, The AI Pricing and Monetization Playbook);Perplexity 这类 RAG+LLM 双成本产品更低。所以 BP 里”我们毛利 75%“对一个纯应用层 AI 产品,要么是没把 LLM 成本算进 COGS(藏在研发费里),要么是只算了轻用户。

Block D — CAC 与回收期

字段	示例〔示意〕	AI 产品的特殊性
单客获取成本 CAC	$120	与 SaaS 同源,但⚠️ AI 产品免费额度本身是 CAC 的一部分(免费用户烧的 token)
CAC 回收期 = CAC / 单位毛利	$120 / $7.74 = 15.5 月	⚠️ SaaS 健康线 < 12 月;AI 因毛利薄,回收期天然更长

⚠️ AI 专属隐藏 CAC: 免费层(free tier)消耗的推理成本必须计入获客成本。一个免费用户每月烧 $3 token、平均转化要 4 个月、转化率 5%,则每个付费用户的”免费期 token CAC” = $3 × 4 / 5% = $240——常常比显性营销 CAC 还高。Bessemer 据称测算 AI 套壳初创需比传统 SaaS 多约 3.2× 资金才能盈利,但该原始报告未能核实,勿作硬数据引用〔待核实〕。

Block E — LTV

LTV = 单位毛利 × 平均生命周期(月) = 单位毛利 × (1 / 月毛流失率)
示意:= $7.74 × (1 / 0.05) = $7.74 × 20 = $155
LTV/CAC = $155 / $120 = 1.29   ← ⚠️ 健康线是 3,这个产品不健康

⚠️ AI 产品的 LTV 双重打击: (1)毛利薄 → LTV 分子小;(2)AI 原生产品流失率高(大量”AI 游客”实验后离开,ChartMogul 称之为 AI churn wave)→ 生命周期短 → LTV 进一步缩水。两者叠加,使得很多 AI 产品的真实 LTV/CAC 远低于 BP 上的数字。0428 专题(采纳决定 LTV)的核心命题正落在这里:LTV 的分母端(流失/留存)由组织采纳深度决定,不是定价能解决的——一个没被嵌进工作流的 AI 产品,无论怎么调价,生命周期都短。〔0428 总览待归位,链接降级登记见文末〕

§3 一张可直接套用的整表(把上面五块拼起来)

===================== AI 产品 UE 模型 Sheet =====================
[Block A 假设]  ASP=$20  in=$3/MTok  out=$15/MTok  缓存命中=60%
               平均 in=2M out=0.5M   P95倍数=12×   月流失=5%  CAC=$120
--------------------------------------------------------------------
[Block B COGS] 平均单位COGS=$12.26      P95单位COGS=$132
[Block C 毛利] 平均毛利=$7.74 (38.7%)   P95毛利= −$112 (亏损)
[Block D CAC ] 回收期=15.5月  (+免费层token CAC ~$240 隐藏项)
[Block E LTV ] LTV=$155   LTV/CAC=1.29   ← 不健康(健康线≥3)
====================================================================
诊断:平均看微利,但回收期>12月、LTV/CAC<3、且P95用户净亏 →
     这是一个"靠轻用户补贴重用户"的结构,规模越大越危险。见 §5。

把这张表打印出来贴在墙上:任何 AI 产品的经营会,第一个该问的不是”我们毛利多少”,而是”我们的 P95 用户毛利是正是负”。

§4 怎么填真实数字——三个数据来源

模板是死的,数字是活的。三个来源,可信度递减:

你自己的可观测埋点(最可信): 按用户聚合 token 消耗,直接算出 P50/P95/P99 倍数。这是唯一不会骗你的数据。
模型提供商的公开定价(确证): Claude Haiku 4.5 $1/$5、Sonnet 4.6 $3/$15、Opus 4.8 $5/$25 per MTok;批量 API 全线折 50%、Prompt Caching 省约 90% input 费(来源:Anthropic 定价页,本会话证据包)。这些是 Block A 的硬输入。
同业公开财务/定价(参照): Cursor ARR 2026 年 2 月达 $20 亿(来源:CNBC)、GitHub Copilot 2025 年 7 月 2,000 万累计用户(来源:Microsoft 财报,TechCrunch 引用)——可反推它们的单位经济敢于按 seat 定价,说明其重度用户 token 成本被工作流锁定带来的高 NRR 摊平了。

§5 敏感性分析:UE 随”模型价格 × 使用规模”两个轴变(本节点的命门)

这是 brief 结尾要求的落点,也是整张表唯一不能省的一块。把毛利率做成模型单价(横轴)× P95 重度用户占比(纵轴)的二维敏感性矩阵,你会立刻看到 UE 不是一个数,而是一片地形:

混合毛利率〔示意〕	output 单价 $10	$15(基准)	$25	$50
重度用户占 2%	52%	45%	31%	2%
重度用户占 5%(基准)	44%	38.7%	18%	−15%
重度用户占 10%	33%	24%	−3%	−48%
重度用户占 20%	12%	−2%	−38%	−110%

读这张地形图的三条判断:

沿横轴(模型价格)看: 同一个产品,output 单价从 $15 涨到 $50(比如你从 Sonnet 切到 Opus Fast Mode $10/$50),基准格毛利从 38.7% 直接跌成 −15%。你的盈利能力被一个你不控制的外生变量(模型提供商定价)主导。 这正是 0413 成本专题的命题:成本是被外生变量主导的,工程降本(缓存/路由/降级到便宜模型)买的是把自己往这张表的左上角推。
沿纵轴(使用规模/用户结构)看: 产品越成功、重度用户占比越高(从 2% 涨到 20%),毛利越差——这是 AI 产品独有的负向规模经济,与 SaaS 的正向规模经济相反。增长本身在侵蚀单位经济。
对角线(双重恶化): 模型涨价 + 重度用户增多同时发生时(右下角),毛利断崖式为负。Jevons 悖论在这里现身: 推理单价下降(往左移)不会让成本问题消失,因为它会刺激使用量上升(往下移),净效应不确定——降价省下的钱被多出来的调用吃掉。〔Jevons 悖论概念词典无独立节点,借道 m209 - 推理成本控制手册与 0413 成本专题语境理解〕

这就是”UE 随规模与模型价格变”的全部含义: 你不能报一个毛利率,你必须报一片地形,并指出你今天站在哪个格子、明年模型涨价/用户变重会把你推到哪个格子。

§6 判断主轴·建 UE 表时 90% 的人会搞错的四个点

错点一:把 LLM 成本算进研发费而非 COGS。

症状:BP 毛利率写 75%,但 OpenAI/Anthropic 的账单每月在涨。
为什么会错:沿用 SaaS 习惯,把”模型 API 费”当成研发投入而非售卖成本。
正确做法:凡是随用户调用线性发生的推理成本,一律进 COGS(Block B)。
真实反例:OpenAI 2025 年 ARR $200 亿但 2024 年仍亏约 $50 亿(来源:Amadeus Capital, 2025;TradingKey, 2026)——把推理成本算清楚,“高收入”和”在烧钱”可以并存。

错点二:用平均值建表,无视长尾。

症状:平均毛利 38.7% 看着能活,实际重度用户在大出血。
为什么会错:UE 模板默认每个单元同质,但 AI 产品的 token 消耗是幂律分布。
正确做法:Block B 必须有 P50/P95/P99 三列,毛利诊断看 P95 是正是负。
真实反例:Anthropic 2026 年初被迫从 Seat 捆绑改纯 Token 计费,正是因为 seat 均价掩盖了重度用户亏损(来源:The Register, 2026-04-16)。

错点三:把模型价格当常量。

症状:UE 表里 input/output 单价是写死的硬编码,没有敏感性轴。
为什么会错:误以为自己的成本是内生可控的。
正确做法:§5 的二维敏感性矩阵,模型价格永远是一个轴。
真实反例:推理成本 2023→2025 下降约 80%、前沿 LLM 输出价 2023 年 3 月以来跌约 94.5%(来源:techstartups.com 2025;BenchLM 2025)——把价格当常量的 UE 表,半年就废。

错点四:免费层成本不进 CAC。

症状:CAC 只算了营销费,免费用户烧的 token 凭空消失。
为什么会错:免费额度被当成营销活动,不是可量化成本。
正确做法:Block D 加”免费层 token CAC”隐藏项,= 免费期月 token 成本 × 转化周期 / 转化率。
真实反例:Perplexity 这类高速增长但毛利低的产品,免费搜索的双成本(检索+生成)是其获客成本结构里被低估的一块(参见 Perplexity)。

§7 产品 PM 视角补盲(跳出工程财务视角)

用户心理模型: AI 产品的”重度用户”往往是你最忠诚、最爱晒、最愿付费推荐的用户——而他们恰恰是亏你钱最多的人。如果你用限速/降配去”治理”他们(很多产品这么干),你是在赶走传播节点。UE 表会逼你直面这个商业模式张力:你的最佳用户是你的最大亏损源,这不是技术问题,是定价模式没对齐价值(参见 0434 专题 A04 Outcome-based 定价节点对”按价值收费”的讨论)。
合规/GTM 边界: UE 表里的”流失率”在 B 端不是用户随性,而是采购预算周期 + 工作流嵌入深度决定的。同样的产品卖给 SMB(高流失、按 seat、UE 差)和卖给 Enterprise(低流失、可谈用量合同、UE 好),是两张完全不同的 UE 表。建表时必须分客群,不能合并报。

§8 对手框架回应

接受 a16z / Bessemer 的”AI 应用层单位经济学天生比 SaaS 差”立场对的部分——是的,推理成本使 AI 应用层毛利结构性低于 SaaS(50–60% vs 80–90%,来源:BVP Atlas),这是真的,UE 表必须诚实反映。但坚持本节点的边界: 差的 UE 不等于没有商业模式,它等于”你必须靠护城河(工作流/网络)把 NRR 拉到能摊平重度用户成本的水平”——高价位(>$250/月)AI 产品 NRR 可达 85%、媲美 SaaS(来源:ChartMogul, 2025),说明 UE 可以通过定位高价值客群 + 深度嵌入被救回来。我赌的是: AI 产品的 UE 救赎不在”等模型变便宜”,而在”把定价单元从 seat 迁到与价值对齐的 outcome/usage,并把客群上移到容忍高价的企业端”。如果未来 18 个月推理成本继续暴跌使纯 seat 模式也能盈利,这个赌注的紧迫性会下降——这是本节点的 failure scenario。

§9 跨域呼应:信号理论看”UE 表里藏不住的成本”

经济学的信息不对称框架(参见 0133信息经济学)给 UE 表一个反直觉的读法:一张诚实的 UE 表本身是一个昂贵信号。 在投资人面前,任何创业者都可以口头宣称”毛利 75%“,这个宣称的伪造成本接近零,所以不传递信息;而一张拆到 P95 单位 COGS、带模型价格敏感性矩阵、敢于标出”重度用户净亏 $112”的 UE 表,伪造成本极高(你得真的有埋点、真的算过、真的敢承认),所以它在信号意义上传递了”这个团队真的懂自己的单位经济学”。这与 Rick 滴滴的一手经验同构——PAX-Premium实名徽章之所以是有效安全信号,正因为实名审核让伪装可信乘客的成本变高;一张拆到长尾的 UE 表之所以可信,也正因为它把”假装盈利”的成本拉高了。UE 表的价值一半在数字本身,一半在”敢于建这张表”所传递的可信度。

§10 PM 决策启示

面试怎么用: 被问”你怎么看这个 AI 产品的盈利能力”,不要报一个毛利率。回答:“我会建一张 UE 表,核心看三件事——P95 重度用户毛利是正是负、CAC 回收期是否 <12 月、毛利率对 output 单价和重度用户占比的敏感性矩阵长什么样。AI 产品的死法是负向规模经济,只有分布表照得出来。”
选型/投资怎么用: 拿到 BP 的”毛利 75%、LTV/CAC=4”,直接问三句:“LLM 成本进 COGS 了吗?这是平均还是 P95?模型涨价 50% 这个数变多少?” 三句问完,水分见底。
建产品怎么用: 把这张 Sheet 模板(§3)接到你的用量埋点上,每月跑一次敏感性矩阵,盯住自己在地形图上的移动方向——往左上(降本/客群上移)还是往右下(模型涨价/用户变重)。

§11 与已有节点的关系

对照 m209 - 推理成本控制手册:m209 停在”成本是可优化的工程对象”层(缓存/路由/压缩/截断);本节点把这些手段接到财务报表——m209 的每一个降本手段,都是把你在 §5 敏感性地形图上往左上角推的操作。做深化 + 接口对接,不复述 m209 的缓存命中率/Cascade 路由公式。
对照本专题 S03 架构剖面节点〔同批待建,brief 指定关联,归位后补全名双链〕:S03 给出护城河的工程栈剖面,本节点给出与之配套的财务剖面——护城河决定 LTV 的分母(留存),UE 表把它量化。做配套补缺。
对照 0413 成本工程系统化专题(成本/COGS)、0428 组织采纳系统化专题(采纳决定 LTV):0413 提供 COGS 的工程来源与 Jevons 悖论,本节点把它落进 Block B;0428 提供 LTV 分母(留存)的组织解释,本节点把它落进 Block E。均为显式升级对照,不复述两专题正文。〔两专题总览待归位,降级登记见文末〕

§12 关联节点

核心(必读):

m209 - 推理成本控制手册
Perplexity
0133信息经济学
PAX-Premium实名徽章
Agent
AI PM 知识图谱·总索引

延伸(可选):

ChatGPT OpenAI Claude Scaling Laws 幻觉 0117社会学
本专题同级节点(待建/同批):S01 产业链价值生态位地图、S02 五类护城河可替换栈、S03〔架构剖面其三,brief 指定关联,待建〕、A04 Outcome-based 定价的概念边界、G02 定价模式演化详解、_0434 AI 产品护城河与商业模式系统化专题·总览

[!warning] 跨专题双链降级登记:以下专题/概念文件仍在 99Archive/_ai_review/ 待归位或概念词典无独立节点,为防死链本节点正文中以普通文本引用、不建 “ 双链,并登记到 _待建概念清单.md:0413 成本工程系统化专题·总览、0428 组织采纳系统化专题·总览、本专题 S03 节点全名;以及概念词典无独立节点的”Unit Economics / 单位经济学""Jevons 悖论""COGS / CAC / LTV""免费层 token CAC""负向规模经济”。归位后由 synthesize 阶段统一补链。

修订日志

2026-06-07 R0 首稿:建立”UE 模型 Sheet”框架(一张分布表 vs 一个毛利率)、成本对象五层下沉、五块字段模板(COGS/毛利/CAC/LTV/敏感性)、可直接复制整表、模型价格×重度用户占比二维敏感性矩阵、判断主轴四件套(LLM 成本归类/长尾/价格当常量/免费层 CAC)、信息经济学信号跨域呼应、与 m209/0413/0428/S03 显式升级对照。商业数字均沿用 brief 经对抗验证的证据包(Anthropic 公开定价/CNBC/Microsoft 财报/ChartMogul/BVP Atlas/The Register/techstartups/BenchLM/Amadeus Capital)。Bessemer “3.2× 资金”无法核实原报告,标〔待核实〕不作硬引用。Jevons/UE/COGS/CAC/LTV 等概念词典无节点,降级普通文本并登记。