G01 商业模式代际谱系·SaaS 到 AI-native
G01 商业模式代际谱系·SaaS 到 AI-native
软件赚钱的方式,过去三十年走过四个台阶:卖软件许可(永久授权)→ 卖座席订阅(per-seat SaaS)→ 卖用量(consumption/token)→ 卖结果(outcome / AI-as-employee)。本节点要解决的问题是:这四代不是一条”越来越先进”的直线,而是一组各有独特驱动力、独特瓶颈、独特反例的范式;理解谱系不是为了赶最新一代,而是为了在选型会上判断”我这个 AI 产品该收什么钱、护城河能不能跟着收费方式一起长出来”。本节用的框架是 Christensen 的整合-模块化钟摆+“计价单元 = 价值归因单元”这把尺子。
§0 为什么是”四代计价谱系”而不是”SaaS vs AI-native 二分”
业界最流行的默认框架是把世界切成”传统 SaaS”和”AI-native”两堆——这个二分错得很危险,因为它把收费方式和技术基底混为一谈。Cursor 起步时是 GPT-4 的 wrapper,技术上”不 native”,但收费上已经是 hybrid(座席+credit 池);很多”AI-native”创业公司技术很 native,收费却退回到最古老的 per-seat。技术 native 程度和商业模式代际是两条正交的轴,二分法把它们焊死,于是得出”AI-native = 先进 = 必胜”的 hype 结论。
更准的切法是盯住一个不变量:计价单元(你按什么收钱)就是你向客户声明的价值归因单元。
- 卖许可:价值 = 一份可安装的二进制,归因到”拥有”。
- 卖座席:价值 = 一个能登录使用的人,归因到”接入”。
- 卖用量:价值 = 一次调用 / 一个 token,归因到”消耗”。
- 卖结果:价值 = 一个被解决的工单 / 一份交付的文书,归因到”产出”。
四代的真正分野在这里,而不在”用没用大模型”。本节点因此不写”SaaS 已死、AI-native 当立”的进步史,而写钟摆:每一代解决了上一代的归因失真,又引入了自己的归因失真,没有终点。
[!note] 跨域呼应预告 这条”整合 ↔ 模块化”钟摆直接借自 Clayton Christensen 的互依架构理论(《The Innovator’s Solution》,2003)——见本节 §5。它是 Rick 未必读过的对手框架,用来逼问”AI-native 一定是终态吗”。
§1 第一代:卖软件许可(Perpetual License,约 1980s–2000s)
驱动力: 软件第一次成为可独立交付的商品。一次性买断 + 年度维护费(通常 license 的 18–22%),厂商把研发成本摊进一个高单价的”拥有权”。Oracle、SAP、早期 Microsoft 都是这套。
瓶颈: 计价单元(一份拷贝)和真实价值(持续使用产生的业务结果)严重脱钩。客户买了用不用厂商都收到了钱,于是厂商没有持续改进的内生动力,客户没有持续付费的理由——续约靠的是迁移成本(数据锁死、流程长进系统里)而非产品力。盗版进一步击穿”拥有=付费”的假设。
反例(不是一代更比一代强): 永久授权至今没死。专业工程软件(部分 CAD、嵌入式工具链)、对数据主权极度敏感的政府/军工,仍偏好买断本地部署——因为对他们而言”可审计的拥有”本身就是价值,订阅的”厂商随时可断供”反而是风险。把第一代当”落后”是 SaaS 厂商的叙事,不是客观规律。
§2 第二代:卖座席订阅(per-seat SaaS,约 2005–2022)
驱动力: 云交付 + 浏览器消灭了”拥有/安装”这个动作,Salesforce 把它变成”按月按人订阅”。per-seat 的天才在于计价单元(一个活跃用户)天然对齐了价值——CRM 对 50 个销售比对 5 个销售更值钱,座席数就是价值的代理。叠加 70–90% 的软件毛利率(来源:BVP Atlas,AI Pricing & Monetization Playbook),SaaS 成了人类历史上单位经济学最漂亮的生意之一,催生 NRR>120%、“land and expand”整套打法。
瓶颈(也是第三代的导火索): per-seat 假设”价值随使用的人数线性增长”。这个假设在 AI 时代被直接证伪:一个 AI Agent 不登录、不持证、可批量干活;一个人借 AI 干完五个人的活,座席数反而下降,而产生的价值上升。计价单元和价值归因第一次反向。市场数据印证了迁移:纯 seat-based 模式占比从约 21% 降到约 15%(约 12 个月内,来源:Flexprice / Monetizely,2025)。
反例: 但 seat 远没死。Microsoft 365 Copilot 在 $30/用户/月仍获大量企业续签(2025 年 12 月做了永久降价,来源:WebSearch / eesel.ai);大型企业采购部门要的是预算可预测性——90% CIO 把”AI 成本预测”列为部署首要难题(来源:Pilot Blog,2026),纯用量计费会让采购头疼。所以第二代的归宿不是”死”,而是退化成 hybrid 里的稳定基础层。
§3 第三代:卖用量(Consumption / Token,约 2020–至今)
驱动力: 当 COGS 随调用量线性扩张(每次推理都烧真金白银的 GPU 时间),把成本曲线直接传导给计价是唯一健康的做法。AWS 早就用 consumption 模式证明了管道生意的稳健;大模型 API(Anthropic、OpenAI)天然是 per-token。这一代把价值归因单元从”人”换成”消耗量”,对基础设施/平台层几乎是唯一合理选择。
关键事实接地:
- Anthropic 公开 API 价格(2026):Sonnet 4.6 为 $3/$15 per MTok(输入/输出),Opus 4.8 为 $5/$25 per MTok(来源:finout.io,Anthropic API Pricing 2026)。
- 推理价格三年崩塌:自 2023 年 3 月以来前沿 LLM 平均输出价格下降约 94.5%(来源:BenchLM,LLM API Pricing History,2025);推理成本 2023→2025 整体下降约 80%(来源:techstartups.com,2025/03)。
- Anthropic 自己的企业计价迁移是这一代逻辑最赤裸的案例: 2025 年 11 月起放弃含 token 的座席捆绑包改纯用量;2026 年 2 月引入 $20/员工/月基础费 + 全量按 token 计;2026 年 3 月 8 日旧座席套餐停止新签(来源:The Register,2026-04-16)。官方解释是”用户增速超过产能扩张,旧定价单位经济学不成立”。
瓶颈: consumption 把不确定性甩给了客户——78% 的 IT 领导报告遭遇过意外账单(来源:Pilot Blog,2026)。对客户而言”我付了一堆 token,但不知道换来多少业务价值”,归因又一次失真,只是从”人多但价值少”变成”花了钱但不知值不值”。
反例: 用量计价对轻量用户极不友好。Anthropic 迁移后轻量用户账单大幅上涨即是明证——consumption 奖励重度用户、惩罚浅尝者,与”先免费试用养成习惯”的增长打法天然冲突。
§4 第四代:卖结果(Outcome / AI-as-employee,约 2024–至今)
驱动力: 既然 token 不等于价值,干脆只在产生可验证结果时收钱——这是与业务价值对齐最彻底的一代。Zendesk 2024 年 8 月成为首家主流 SaaS 大厂推出 outcome-based 定价(每次”自动解决”$1.50 承诺量 / $2.00 按需,工单关闭后 72 小时无跟进算解决,来源:WebSearch);Intercom Fin 每次完整解决对话 $0.99;Salesforce Agentforce 从 $2/对话起步。更激进的AI-as-employee 变体把价格直接锚定”被替代的人力成本”:Harvey 按席位报价,多源给出的区间约为 $1,000–$2,000+/律师/月(随律所规模与来源浮动:中型律所约 $1,200–$1,500,Am Law 100 约 $1,500–$2,000+,亦有来源给出 $1,000–$1,200),定位为”联席律师人力成本的 5–7%“,把预算从软件 line item 搬到人力成本中心(价格区间多源交叉验证:bindlegal.com、eesel.ai、aivortex.io、irys.ai,2025–2026;各源不完全一致故取区间。“5–7% 比例”仍为单一来源、Harvey 未公开确认〔需查询〕)。
Gartner 预测到 2030 年 40%+ 企业 SaaS 支出将转向用量/Agent/结果计费(来源:Gartner 2025,经 LinkedIn 引用,标〔二手引用,需查原报告〕)。
瓶颈(这一代远没成熟):
- 代理指标陷阱(Goodhart 问题): 真实业务结果难以干净归因,于是用 proxy——Zendesk 的”72 小时不复联”并非真解决,只是代理信号。一旦 AI 被优化去满足指标而非真实价值,整个计价基础崩塌(来源:EY,SaaS Transformation with GenAI Outcome-Based Pricing)。
- “什么算一次结果”的定义战: Salesforce Agentforce 原 $2/对话模型前两季 5,000 个合同仅 3,000 个付费,被迫 2025 年 5 月改为 Flex Credits($0.10/action,来源:concret.io / Saastr)。按 conversation 还是按 resolution,价值对齐天差地别。
反例(最关键的反线性证据): 第四代不是第三代的升级版而吞掉它——两者并存且适用层不同。基础设施层(API、算力)天然该用第三代 consumption,硬套 outcome 反而荒谬(你无法为”一次 GPU 调用”定义业务结果)。outcome 只在应用层、且结果可清晰判定的场景成立。
§5 判断主轴:四个”90% 的人会搞错”的代际误判
[!warning] 这一节是 PM 顶刊与技术博客的分界线 每条 = 症状 → 为什么会错 → 正确做法 → 真实反例。
误判一:把代际当线性进步,以为”越往后越先进、该全力押 outcome”。
- 症状:创业 deck 里写”我们抛弃落后的 seat 模式,采用最先进的结果计费”。
- 为什么会错:把”晚出现”等同于”更优”,忽略了每一代各有适用层。
- 正确做法:按产品形态选代——Copilot 类(人仍决策)用 seat+credit 混合;workflow Agent 用 per-action;resolution Agent 用 per-outcome;基础设施用纯 token。
- 真实反例:Anthropic(最前沿模型公司)的企业计价不是 outcome,而是退回到最朴素的 per-token + 小额基础费——因为它是基础设施层(来源:The Register,2026-04-16)。
误判二:把”计价方式”等同于”护城河”。
- 症状:JD 里写”我们用 AI-native 的 outcome 定价所以有护城河”。
- 为什么会错:计价方式可被任何竞争者一夜复制(Zendesk 一推 AR 定价,Intercom、Salesforce 数月内全跟上)。
- 正确做法:护城河长在工作流嵌入、数据飞轮、分发上,计价只是把已有护城河变现的方式——见关联节点 p306 - 数据飞轮与反馈回路设计。
- 真实反例:Salesforce 改了三次定价模型($2/对话 → Flex Credits → …),护城河没变,仍是 CRM 系统级锁定。
误判三:以为新一代会”杀死”上一代。
- 症状:“SaaS 已死""座席模式终结”。
- 为什么会错:混淆”占比下降”与”消失”,无视客户对预算可预测性的刚需。
- 正确做法:用钟摆模型——市场长期停在 hybrid(占比已从 27% 升到 41%,成第一大类,来源:Flexprice/Monetizely,2025):固定基础层(可预测)+ 用量/结果弹性层(捕获价值)。
- 真实反例:Microsoft Copilot 纯 seat($30/用户/月)大规模续签,永久授权在政府/工程软件领域至今稳固。
误判四:把 AI-as-employee 的”对标人力成本”当成可持续的高定价护城河。
- 症状:“我们对标 $90K/年的人类 SDR 收 $2,000/月,相当于其成本 27%,所以有巨大定价空间。“(来源:mpt.solutions,标〔单一来源〕)
- 为什么会错:人力锚点是叙事定价不是成本定价;一旦同类 AI 竞品涌入,价格会向 COGS(token 成本)回归,而 token 成本正以 ~94% 速率崩塌。
- 正确做法:把 AI-as-employee 的高定价当作有时间窗口的早期红利,而非结构性护城河;窗口长短取决于工作流锁定深度。
- 真实反例:Harvey 竞品已有 $99–$199/用户/月的低价替代(来源:WebSearch),人力锚点正被价格战侵蚀。
§6 产品 PM 视角补盲:计价方式如何反向塑造产品与组织
工程视角只看”哪种计价毛利高”,PM 必须看三个被忽略的二阶效应:
- 计价方式重塑客户的内部采购权力。 AI-as-employee 把预算从 IT 的软件 line item 搬到业务线的人力成本中心——这意味着 buyer 从 CIO 变成业务负责人,整个 GTM(销售话术、ROI 计算器、决策周期)全要重做。Harvey 提供 ROI 计算器把”节省工时”换算成”可计费时间”正是为了对话这个新 buyer(来源:WebSearch / eesel.ai)。
- outcome 计价把”定义结果”变成产品的核心设计决策。 “72 小时不复联算解决”不是财务问题,是产品问题——它决定了 AI 会被训练成什么样。计价单元一旦选定,就成了 AI 的优化目标函数,Goodhart 失真会直接写进产品行为。
- consumption 计价制造”成本焦虑型 UX”。 当用户为每次调用付费,产品必须显式展示用量、设置预算上限、做成本预警——这与”无限畅用”的增长本能冲突。Cursor 的 credit 池 UI 就是在”鼓励使用”和”控制成本”之间走钢丝(来源:WebSearch,Cursor credit 体系 2026-06 起)。
§7 对手框架回应
对手立场一(a16z / 进步派):“AI-native 商业模式是代际跃迁,传统 SaaS 单位经济学不再适用。” 接受:他们对的部分是——AI 产品毛利确实结构性低于 SaaS(50–60% vs 80–90%,来源:BVP Atlas),per-seat 的价值假设确实被 Agent 击穿,这是真范式转移,不是渐进。 边界:但”跃迁”不等于”前几代作废”。我赌的是hybrid 长期主导而非纯 outcome 接管——理由是企业采购对可预测性的刚需(90% CIO 把成本预测列首要难题)不会因技术先进而消失。a16z 自己也在 2025–2026 更新框架承认”领域特殊数据 / walled gardens”的新价值,说明纯进步叙事被他们自己修正了。
对手立场二(Christensen 互依架构理论 / Rick 未读对手框架):“行业在性能不足时整合(卖打包系统),在性能过剩时模块化(卖标准组件)。AI 当前性能严重不足,故必然走向整合,AI-native 整合方案会赢。” 接受:这解释了为什么当下 outcome / AI-as-employee(高度整合、端到端负责结果)正在崛起——模型能力还不稳定,客户愿意为”打包的确定性”付溢价。 边界与逼问:但 Christensen 的钟摆是双向的。一旦模型能力过剩(推理价格崩塌已是信号),价值会向模块化滑动——客户不再为打包整合付费,而是自己用便宜的标准 token 拼装。这恰恰预言了 outcome 高定价的时间窗口性(呼应 §5 误判四)。Christensen 的框架反对的不是 AI-native,而是反对”AI-native 是终态”——这正是本节点坚持”钟摆无终点”的理论靠山。
对手立场三(Andrew Chen):“GPT wrapper 类比 1990 年代 CRUD 应用,最终靠网络效应而非计价/技术取胜。“(来源:andrewchen.substack.com,Revenge of the GPT Wrappers) 接受:对的部分是——计价方式不是终局变量,分发与网络效应才是。 边界:但 Chen 自己也承认 AI 周期比 Web 压缩更快,留给套壳的时间窗更短,这与本节点”计价红利有时间窗口”一致。
§8 跨域呼应:Christensen 互依架构钟摆 + Jevons 悖论
调度 Clayton Christensen 的互依-模块化理论(已在 §0、§7 展开,此处收束其对判断的改变):它把”四代谱系”从一条直线改写成一个钟摆,这是本节点最重要的判断升级——没有它,代际演化极易写成”卖结果 = 终极形态”的线性进步史(§7 的一票否决项之一)。钟摆模型给出的可证伪预测是:当模型能力从”不足”翻越到”过剩”,价值会从整合型的 outcome 定价回摆向模块化的 consumption 定价。这条预测可以被未来 24 个月的市场数据检验。
辅以 Jevons 悖论(呼应 m209 - 推理成本控制手册 与 0413 成本专题):推理价格崩塌 94% 不会消灭计价问题,只会刺激用量暴增,把”卖什么单元”的归因焦虑放大而非缓解——这解释了为什么计价范式在成本暴跌期反而加速迭代(Anthropic 2026 年的计价大改正发生在价格最低点)。
§9 PM 决策启示
- 面试怎么用: 被问”你怎么看 AI 产品的商业模式”,不要答”AI-native 是趋势”。答:“四代计价谱系是钟摆不是直线,计价单元 = 价值归因单元;当下 outcome 崛起是因为模型能力不足触发整合,但 Christensen 钟摆预示能力过剩后会回摆向 consumption。我会按产品所在的层(基础设施/工作流/解决型/专业替代)选代,而不是无脑追最新一代。“30 秒展示判断密度。
- 选型/定价决策怎么用: 拿”产品形态 → 计价代际”对照表(§5 误判一的正确做法)做四象限——别让财务部门按”哪代毛利高”拍板,要按”计价单元能否干净归因到客户感知的价值”拍板。
- 复现/建模怎么用: 做单位经济学模型时,把 token 成本的下降斜率(~94%/年)作为关键变量代入——它决定了 AI-as-employee 高定价的窗口期长短,是最敏感的假设。
§10 与已有节点的关系(不复述旧节点事实)
- 对 m209 - 推理成本控制手册:m209 停在”工程降本手段”层(缓存/路由/压缩),本节点做升维对话——把成本从”怎么省”提到”省下来的成本如何反向塑造计价代际与商业模式”。
- 对 Perplexity:Perplexity 是”产品形态领先 + 单位经济亏损”的样本,本节点为它补上计价代际坐标——它困在第二/三代之间(订阅 + RAG/LLM 双成本),尚未找到能干净归因的计价单元。做的是补缺。
- 对 p306 - 数据飞轮与反馈回路设计:p306 讲数据飞轮如何形成护城河,本节点做纠偏对话——强调”计价方式 ≠ 护城河”,护城河长在飞轮上,计价只是变现接口。
- 与本专题 G02 定价模式演化详解·Seat 到 Usage 到 Outcome(同模块):G01 提供”计价代际”的时间轴,G02 在定价维度做纵向放大,两者共享同一代际时间轴,合读才能定位一个产品的真实坐标。
§11 关联节点
核心(必读):
- m209 - 推理成本控制手册
- Perplexity
- p306 - 数据飞轮与反馈回路设计
- Christensen 互依架构与模块化钟摆 〔本专题待建概念,降级为普通文本,已登记
_待建概念清单.md,见下〕 - 本专题总览 _总览(待建)
延伸(可选):
- ChatGPT OpenAI Claude DeepSeek
- m208 - AI 基础设施与中间件选型
- Scaling Laws
- AI PM 知识图谱·总索引
- 0413 成本工程系统化专题(待归位,final_path 在
04AI/0413 成本工程系统化专题/)
[!note] 死链登记说明 “Christensen 互依架构与模块化钟摆""双边市场""网络效应""单位经济学”在概念词典中均无独立节点,本文已全部降级为普通文本,并登记入
_待建概念清单.md,未在主库建任何 stub。Jevons 悖论同理。
修订日志
- R0(2026-06-07):首稿。建立”四代计价谱系 = 钟摆非直线”主框架;计价单元=价值归因单元尺子;四条判断主轴(线性进步误判 / 计价≠护城河 / 新代不杀旧代 / 人力锚点非护城河);接入 Christensen 互依架构、a16z、Andrew Chen 三个对手框架;接地 Anthropic 2026 计价迁移、Zendesk/Intercom/Salesforce/Harvey 定价、推理价格崩塌等硬事实,单一来源与二手引用均已标注。
- 2026-06-11 P3.1 接地修复:Harvey 定价原写死 “$1,500–$2,000/律师/月”(双源),经多源核验后改为区间 “$1,000–$2,000+/律师/月”——因各独立来源不一致(aivortex.io/eesel.ai/bindlegal 给 ~$1,200–$2,000+,irys.ai 给 ~$1,000–$1,200),按”不一致→降级为区间”处理,并补 aivortex.io、irys.ai 两源;“5–7% 人力成本占比”仍单一来源未经厂商确认,维持〔需查询〕标注。来源:aivortex.io/legal/ai-tools/harvey-ai-pricing-2026、irys.ai/insights/market/harvey-enterprise-pricing-legal-ai-april-2026。