G01 商业模式代际谱系·SaaS 到 AI-native

软件赚钱的方式，过去三十年走过四个台阶：卖软件许可（永久授权）→ 卖座席订阅（per-seat SaaS）→ 卖用量（consumption/token）→ 卖结果（outcome / AI-as-employee）。本节点要解决的问题是：这四代不是一条”越来越先进”的直线，而是一组各有独特驱动力、独特瓶颈、独特反例的范式；理解谱系不是为了赶最新一代，而是为了在选型会上判断”我这个 AI 产品该收什么钱、护城河能不能跟着收费方式一起长出来”。本节用的框架是 Christensen 的整合-模块化钟摆＋“计价单元 = 价值归因单元”这把尺子。

§0 为什么是”四代计价谱系”而不是”SaaS vs AI-native 二分”

业界最流行的默认框架是把世界切成”传统 SaaS”和”AI-native”两堆——这个二分错得很危险，因为它把收费方式和技术基底混为一谈。Cursor 起步时是 GPT-4 的 wrapper，技术上”不 native”，但收费上已经是 hybrid（座席+credit 池）；很多”AI-native”创业公司技术很 native，收费却退回到最古老的 per-seat。技术 native 程度和商业模式代际是两条正交的轴，二分法把它们焊死，于是得出”AI-native = 先进 = 必胜”的 hype 结论。

更准的切法是盯住一个不变量：计价单元（你按什么收钱）就是你向客户声明的价值归因单元。

卖许可：价值 = 一份可安装的二进制，归因到”拥有”。
卖座席：价值 = 一个能登录使用的人，归因到”接入”。
卖用量：价值 = 一次调用 / 一个 token，归因到”消耗”。
卖结果：价值 = 一个被解决的工单 / 一份交付的文书，归因到”产出”。

四代的真正分野在这里，而不在”用没用大模型”。本节点因此不写”SaaS 已死、AI-native 当立”的进步史，而写钟摆：每一代解决了上一代的归因失真，又引入了自己的归因失真，没有终点。

[!note] 跨域呼应预告这条”整合 ↔ 模块化”钟摆直接借自 Clayton Christensen 的互依架构理论（《The Innovator’s Solution》，2003）——见本节 §5。它是 Rick 未必读过的对手框架，用来逼问”AI-native 一定是终态吗”。

§1 第一代：卖软件许可（Perpetual License，约 1980s–2000s）

驱动力： 软件第一次成为可独立交付的商品。一次性买断 + 年度维护费（通常 license 的 18–22%），厂商把研发成本摊进一个高单价的”拥有权”。Oracle、SAP、早期 Microsoft 都是这套。

瓶颈： 计价单元（一份拷贝）和真实价值（持续使用产生的业务结果）严重脱钩。客户买了用不用厂商都收到了钱，于是厂商没有持续改进的内生动力，客户没有持续付费的理由——续约靠的是迁移成本（数据锁死、流程长进系统里）而非产品力。盗版进一步击穿”拥有=付费”的假设。

反例（不是一代更比一代强）： 永久授权至今没死。专业工程软件（部分 CAD、嵌入式工具链）、对数据主权极度敏感的政府/军工，仍偏好买断本地部署——因为对他们而言”可审计的拥有”本身就是价值，订阅的”厂商随时可断供”反而是风险。把第一代当”落后”是 SaaS 厂商的叙事，不是客观规律。

§2 第二代：卖座席订阅（per-seat SaaS，约 2005–2022）

驱动力： 云交付 + 浏览器消灭了”拥有/安装”这个动作，Salesforce 把它变成”按月按人订阅”。per-seat 的天才在于计价单元（一个活跃用户）天然对齐了价值——CRM 对 50 个销售比对 5 个销售更值钱，座席数就是价值的代理。叠加 70–90% 的软件毛利率（来源：BVP Atlas，AI Pricing & Monetization Playbook），SaaS 成了人类历史上单位经济学最漂亮的生意之一，催生 NRR>120%、“land and expand”整套打法。

瓶颈（也是第三代的导火索）： per-seat 假设”价值随使用的人数线性增长”。这个假设在 AI 时代被直接证伪：一个 AI Agent 不登录、不持证、可批量干活；一个人借 AI 干完五个人的活，座席数反而下降，而产生的价值上升。计价单元和价值归因第一次反向。市场数据印证了迁移：纯 seat-based 模式占比从约 21% 降到约 15%（约 12 个月内，来源：Flexprice / Monetizely，2025）。

反例： 但 seat 远没死。Microsoft 365 Copilot 在 $30/用户/月仍获大量企业续签（2025 年 12 月做了永久降价，来源：WebSearch / eesel.ai）；大型企业采购部门要的是预算可预测性——90% CIO 把”AI 成本预测”列为部署首要难题（来源：Pilot Blog，2026），纯用量计费会让采购头疼。所以第二代的归宿不是”死”，而是退化成 hybrid 里的稳定基础层。

§3 第三代：卖用量（Consumption / Token，约 2020–至今）

驱动力： 当 COGS 随调用量线性扩张（每次推理都烧真金白银的 GPU 时间），把成本曲线直接传导给计价是唯一健康的做法。AWS 早就用 consumption 模式证明了管道生意的稳健；大模型 API（Anthropic、OpenAI）天然是 per-token。这一代把价值归因单元从”人”换成”消耗量”，对基础设施/平台层几乎是唯一合理选择。

关键事实接地：

Anthropic 公开 API 价格（2026）：Sonnet 4.6 为 $3/$15 per MTok（输入/输出），Opus 4.8 为 $5/$25 per MTok（来源：finout.io，Anthropic API Pricing 2026）。
推理价格三年崩塌：自 2023 年 3 月以来前沿 LLM 平均输出价格下降约 94.5%（来源：BenchLM，LLM API Pricing History，2025）；推理成本 2023→2025 整体下降约 80%（来源：techstartups.com，2025/03）。
Anthropic 自己的企业计价迁移是这一代逻辑最赤裸的案例： 2025 年 11 月起放弃含 token 的座席捆绑包改纯用量；2026 年 2 月引入 $20/员工/月基础费 + 全量按 token 计；2026 年 3 月 8 日旧座席套餐停止新签（来源：The Register，2026-04-16）。官方解释是”用户增速超过产能扩张，旧定价单位经济学不成立”。

瓶颈： consumption 把不确定性甩给了客户——78% 的 IT 领导报告遭遇过意外账单（来源：Pilot Blog，2026）。对客户而言”我付了一堆 token，但不知道换来多少业务价值”，归因又一次失真，只是从”人多但价值少”变成”花了钱但不知值不值”。

反例： 用量计价对轻量用户极不友好。Anthropic 迁移后轻量用户账单大幅上涨即是明证——consumption 奖励重度用户、惩罚浅尝者，与”先免费试用养成习惯”的增长打法天然冲突。

§4 第四代：卖结果（Outcome / AI-as-employee，约 2024–至今）

驱动力： 既然 token 不等于价值，干脆只在产生可验证结果时收钱——这是与业务价值对齐最彻底的一代。Zendesk 2024 年 8 月成为首家主流 SaaS 大厂推出 outcome-based 定价（每次”自动解决”$1.50 承诺量 / $2.00 按需，工单关闭后 72 小时无跟进算解决，来源：WebSearch）；Intercom Fin 每次完整解决对话 $0.99；Salesforce Agentforce 从 $2/对话起步。更激进的AI-as-employee 变体把价格直接锚定”被替代的人力成本”：Harvey 按席位报价，多源给出的区间约为 $1,000–$2,000+/律师/月（随律所规模与来源浮动：中型律所约 $1,200–$1,500，Am Law 100 约 $1,500–$2,000+，亦有来源给出 $1,000–$1,200），定位为”联席律师人力成本的 5–7%“，把预算从软件 line item 搬到人力成本中心（价格区间多源交叉验证：bindlegal.com、eesel.ai、aivortex.io、irys.ai，2025–2026；各源不完全一致故取区间。“5–7% 比例”仍为单一来源、Harvey 未公开确认〔需查询〕）。

Gartner 预测到 2030 年 40%+ 企业 SaaS 支出将转向用量/Agent/结果计费（来源：Gartner 2025，经 LinkedIn 引用，标〔二手引用，需查原报告〕）。

瓶颈（这一代远没成熟）：

代理指标陷阱（Goodhart 问题）： 真实业务结果难以干净归因，于是用 proxy——Zendesk 的”72 小时不复联”并非真解决，只是代理信号。一旦 AI 被优化去满足指标而非真实价值，整个计价基础崩塌（来源：EY，SaaS Transformation with GenAI Outcome-Based Pricing）。
“什么算一次结果”的定义战： Salesforce Agentforce 原 $2/对话模型前两季 5,000 个合同仅 3,000 个付费，被迫 2025 年 5 月改为 Flex Credits（$0.10/action，来源：concret.io / Saastr）。按 conversation 还是按 resolution，价值对齐天差地别。

反例（最关键的反线性证据）： 第四代不是第三代的升级版而吞掉它——两者并存且适用层不同。基础设施层（API、算力）天然该用第三代 consumption，硬套 outcome 反而荒谬（你无法为”一次 GPU 调用”定义业务结果）。outcome 只在应用层、且结果可清晰判定的场景成立。

§5 判断主轴：四个”90% 的人会搞错”的代际误判

[!warning] 这一节是 PM 顶刊与技术博客的分界线每条 = 症状 → 为什么会错 → 正确做法 → 真实反例。

误判一：把代际当线性进步，以为”越往后越先进、该全力押 outcome”。

症状：创业 deck 里写”我们抛弃落后的 seat 模式，采用最先进的结果计费”。
为什么会错：把”晚出现”等同于”更优”，忽略了每一代各有适用层。
正确做法：按产品形态选代——Copilot 类（人仍决策）用 seat+credit 混合；workflow Agent 用 per-action；resolution Agent 用 per-outcome；基础设施用纯 token。
真实反例：Anthropic（最前沿模型公司）的企业计价不是 outcome，而是退回到最朴素的 per-token + 小额基础费——因为它是基础设施层（来源：The Register，2026-04-16）。

误判二：把”计价方式”等同于”护城河”。

症状：JD 里写”我们用 AI-native 的 outcome 定价所以有护城河”。
为什么会错：计价方式可被任何竞争者一夜复制（Zendesk 一推 AR 定价，Intercom、Salesforce 数月内全跟上）。
正确做法：护城河长在工作流嵌入、数据飞轮、分发上，计价只是把已有护城河变现的方式——见关联节点 p306 - 数据飞轮与反馈回路设计。
真实反例：Salesforce 改了三次定价模型（$2/对话 → Flex Credits → …），护城河没变，仍是 CRM 系统级锁定。

误判三：以为新一代会”杀死”上一代。

症状：“SaaS 已死""座席模式终结”。
为什么会错：混淆”占比下降”与”消失”，无视客户对预算可预测性的刚需。
正确做法：用钟摆模型——市场长期停在 hybrid（占比已从 27% 升到 41%，成第一大类，来源：Flexprice/Monetizely，2025）：固定基础层（可预测）+ 用量/结果弹性层（捕获价值）。
真实反例：Microsoft Copilot 纯 seat（$30/用户/月）大规模续签，永久授权在政府/工程软件领域至今稳固。

误判四：把 AI-as-employee 的”对标人力成本”当成可持续的高定价护城河。

症状：“我们对标 $90K/年的人类 SDR 收 $2,000/月，相当于其成本 27%，所以有巨大定价空间。“（来源：mpt.solutions，标〔单一来源〕）
为什么会错：人力锚点是叙事定价不是成本定价；一旦同类 AI 竞品涌入，价格会向 COGS（token 成本）回归，而 token 成本正以 ~94% 速率崩塌。
正确做法：把 AI-as-employee 的高定价当作有时间窗口的早期红利，而非结构性护城河；窗口长短取决于工作流锁定深度。
真实反例：Harvey 竞品已有 $99–$199/用户/月的低价替代（来源：WebSearch），人力锚点正被价格战侵蚀。

§6 产品 PM 视角补盲：计价方式如何反向塑造产品与组织

工程视角只看”哪种计价毛利高”，PM 必须看三个被忽略的二阶效应：

计价方式重塑客户的内部采购权力。 AI-as-employee 把预算从 IT 的软件 line item 搬到业务线的人力成本中心——这意味着 buyer 从 CIO 变成业务负责人，整个 GTM（销售话术、ROI 计算器、决策周期）全要重做。Harvey 提供 ROI 计算器把”节省工时”换算成”可计费时间”正是为了对话这个新 buyer（来源：WebSearch / eesel.ai）。
outcome 计价把”定义结果”变成产品的核心设计决策。 “72 小时不复联算解决”不是财务问题，是产品问题——它决定了 AI 会被训练成什么样。计价单元一旦选定，就成了 AI 的优化目标函数，Goodhart 失真会直接写进产品行为。
consumption 计价制造”成本焦虑型 UX”。 当用户为每次调用付费，产品必须显式展示用量、设置预算上限、做成本预警——这与”无限畅用”的增长本能冲突。Cursor 的 credit 池 UI 就是在”鼓励使用”和”控制成本”之间走钢丝（来源：WebSearch，Cursor credit 体系 2026-06 起）。

§7 对手框架回应

对手立场一（a16z / 进步派）：“AI-native 商业模式是代际跃迁，传统 SaaS 单位经济学不再适用。” 接受：他们对的部分是——AI 产品毛利确实结构性低于 SaaS（50–60% vs 80–90%，来源：BVP Atlas），per-seat 的价值假设确实被 Agent 击穿，这是真范式转移，不是渐进。边界：但”跃迁”不等于”前几代作废”。我赌的是hybrid 长期主导而非纯 outcome 接管——理由是企业采购对可预测性的刚需（90% CIO 把成本预测列首要难题）不会因技术先进而消失。a16z 自己也在 2025–2026 更新框架承认”领域特殊数据 / walled gardens”的新价值，说明纯进步叙事被他们自己修正了。

对手立场二（Christensen 互依架构理论 / Rick 未读对手框架）：“行业在性能不足时整合（卖打包系统），在性能过剩时模块化（卖标准组件）。AI 当前性能严重不足，故必然走向整合，AI-native 整合方案会赢。” 接受：这解释了为什么当下 outcome / AI-as-employee（高度整合、端到端负责结果）正在崛起——模型能力还不稳定，客户愿意为”打包的确定性”付溢价。边界与逼问：但 Christensen 的钟摆是双向的。一旦模型能力过剩（推理价格崩塌已是信号），价值会向模块化滑动——客户不再为打包整合付费，而是自己用便宜的标准 token 拼装。这恰恰预言了 outcome 高定价的时间窗口性（呼应 §5 误判四）。Christensen 的框架反对的不是 AI-native，而是反对”AI-native 是终态”——这正是本节点坚持”钟摆无终点”的理论靠山。

对手立场三（Andrew Chen）：“GPT wrapper 类比 1990 年代 CRUD 应用，最终靠网络效应而非计价/技术取胜。“（来源：andrewchen.substack.com，Revenge of the GPT Wrappers）接受：对的部分是——计价方式不是终局变量，分发与网络效应才是。边界：但 Chen 自己也承认 AI 周期比 Web 压缩更快，留给套壳的时间窗更短，这与本节点”计价红利有时间窗口”一致。

§8 跨域呼应：Christensen 互依架构钟摆 + Jevons 悖论

调度 Clayton Christensen 的互依-模块化理论（已在 §0、§7 展开，此处收束其对判断的改变）：它把”四代谱系”从一条直线改写成一个钟摆，这是本节点最重要的判断升级——没有它，代际演化极易写成”卖结果 = 终极形态”的线性进步史（§7 的一票否决项之一）。钟摆模型给出的可证伪预测是：当模型能力从”不足”翻越到”过剩”，价值会从整合型的 outcome 定价回摆向模块化的 consumption 定价。这条预测可以被未来 24 个月的市场数据检验。

辅以 Jevons 悖论（呼应 m209 - 推理成本控制手册与 0413 成本专题）：推理价格崩塌 94% 不会消灭计价问题，只会刺激用量暴增，把”卖什么单元”的归因焦虑放大而非缓解——这解释了为什么计价范式在成本暴跌期反而加速迭代（Anthropic 2026 年的计价大改正发生在价格最低点）。

§9 PM 决策启示

面试怎么用： 被问”你怎么看 AI 产品的商业模式”，不要答”AI-native 是趋势”。答：“四代计价谱系是钟摆不是直线，计价单元 = 价值归因单元；当下 outcome 崛起是因为模型能力不足触发整合，但 Christensen 钟摆预示能力过剩后会回摆向 consumption。我会按产品所在的层（基础设施/工作流/解决型/专业替代）选代，而不是无脑追最新一代。“30 秒展示判断密度。
选型/定价决策怎么用： 拿”产品形态 → 计价代际”对照表（§5 误判一的正确做法）做四象限——别让财务部门按”哪代毛利高”拍板，要按”计价单元能否干净归因到客户感知的价值”拍板。
复现/建模怎么用： 做单位经济学模型时，把 token 成本的下降斜率（~94%/年）作为关键变量代入——它决定了 AI-as-employee 高定价的窗口期长短，是最敏感的假设。

§10 与已有节点的关系（不复述旧节点事实）

对 m209 - 推理成本控制手册：m209 停在”工程降本手段”层（缓存/路由/压缩），本节点做升维对话——把成本从”怎么省”提到”省下来的成本如何反向塑造计价代际与商业模式”。
对 Perplexity：Perplexity 是”产品形态领先 + 单位经济亏损”的样本，本节点为它补上计价代际坐标——它困在第二/三代之间（订阅 + RAG/LLM 双成本），尚未找到能干净归因的计价单元。做的是补缺。
对 p306 - 数据飞轮与反馈回路设计：p306 讲数据飞轮如何形成护城河，本节点做纠偏对话——强调”计价方式 ≠ 护城河”，护城河长在飞轮上，计价只是变现接口。
与本专题 G02 定价模式演化详解·Seat 到 Usage 到 Outcome（同模块）：G01 提供”计价代际”的时间轴，G02 在定价维度做纵向放大，两者共享同一代际时间轴，合读才能定位一个产品的真实坐标。

§11 关联节点

核心（必读）：

m209 - 推理成本控制手册
Perplexity
p306 - 数据飞轮与反馈回路设计
Christensen 互依架构与模块化钟摆〔本专题待建概念，降级为普通文本，已登记 _待建概念清单.md，见下〕
本专题总览 _总览（待建）

延伸（可选）：

ChatGPT OpenAI Claude DeepSeek
m208 - AI 基础设施与中间件选型
Scaling Laws
AI PM 知识图谱·总索引
0413 成本工程系统化专题（待归位，final_path 在 04AI/0413 成本工程系统化专题/）

[!note] 死链登记说明 “Christensen 互依架构与模块化钟摆""双边市场""网络效应""单位经济学”在概念词典中均无独立节点，本文已全部降级为普通文本，并登记入 _待建概念清单.md，未在主库建任何 stub。Jevons 悖论同理。

修订日志

R0（2026-06-07）：首稿。建立”四代计价谱系 = 钟摆非直线”主框架；计价单元=价值归因单元尺子；四条判断主轴（线性进步误判 / 计价≠护城河 / 新代不杀旧代 / 人力锚点非护城河）；接入 Christensen 互依架构、a16z、Andrew Chen 三个对手框架；接地 Anthropic 2026 计价迁移、Zendesk/Intercom/Salesforce/Harvey 定价、推理价格崩塌等硬事实，单一来源与二手引用均已标注。
2026-06-11 P3.1 接地修复：Harvey 定价原写死 “$1,500–$2,000/律师/月”（双源），经多源核验后改为区间 “$1,000–$2,000+/律师/月”——因各独立来源不一致（aivortex.io/eesel.ai/bindlegal 给 ~$1,200–$2,000+，irys.ai 给 ~$1,000–$1,200），按”不一致→降级为区间”处理，并补 aivortex.io、irys.ai 两源；“5–7% 人力成本占比”仍单一来源未经厂商确认，维持〔需查询〕标注。来源：aivortex.io/legal/ai-tools/harvey-ai-pricing-2026、irys.ai/insights/market/harvey-enterprise-pricing-legal-ai-april-2026。