A05 路径依赖与技术锁定
为短期体验深锁单一模型,等于用今天的产品质量去抵押明天的议价权与退出权——这是 AI 产品最隐蔽的一笔表外负债。本节点要解决的问题:当”深度集成某个模型能立刻让产品变好”几乎总是成立时,PM 如何识别这种”变好”在何时翻转为”被锁定”,以及如何用 1985 年以来的**路径依赖(Path Dependence)**理论给这笔负债定价。视角/框架:David–Arthur 的收益递增锁定模型,叠加 Shapiro–Varian 的切换成本微观基础,再用 Liebowitz–Margolis 的”三度路径依赖”做反方校准。
§0 为什么是”路径依赖”而不是”供应商锁定”或”技术债”
读者脑中默认会用两个框架装这件事,两个都不够。
框架一:供应商锁定(vendor lock-in)。 这个词把问题定位成”合同/商业关系”——好像换一家供应商就解决了。但路径依赖的核心洞察恰恰是:锁定不是来自合同条款,而是来自你自己积累的沉没投资与自我强化的正反馈。你把 40% 的生产 prompt 写成了针对 GPT-4o 行为怪癖的临时补丁,这些补丁不在任何供应商合同里,却是你换不动模型的真正原因。Cutolo & Kenney(2021, Academy of Management Perspectives)研究平台依赖型创业者时也指出,权力不对称”源于平台的技术架构与网络效应,而非仅仅是合同条款”——AI 模型依赖是这个命题在供应链上游的翻版。
框架二:技术债(technical debt)。 技术债是”我知道这样写不对,但先这样,以后重构”——它假设主动权在你手里,利息由你决定何时偿还。路径依赖的残酷在于:利息何时上调、本金何时被强制赎回,决定权在供应商手里。供应商一纸弃用公告(OpenAI 对 GA 模型最短 6 个月、Preview 模型最短 2 周预告,来源:OpenAI 官方弃用文档 developers.openai.com/api/docs/deprecations),你的”以后重构”就变成了”两周内必须重写”。
所以正确的框架是路径依赖:一个由历史偶发选择 + 收益递增正反馈 + 准不可逆沉没成本三者锁死的序列。它比”供应商锁定”多了时间维度与自我强化机制,比”技术债”多了主动权外置。本节点是 0432 时间性专题的概念底座之一——它解释了为什么 A02 模型更新致行为突变 不只是”模型变了”的技术问题,而是”你已经无法离开这个会变的模型”的结构问题。
§1 路径依赖的三机制:David 1985 的原始模型如何映射到 AI
Paul David 在《Clio and the Economics of QWERTY》(American Economic Review, 1985, vol.75(2), pp.332–337)里提炼的三个自我强化机制,几乎可以逐条搬到 AI 模型集成上。
| David 1985 机制 | QWERTY 原义 | AI 模型集成的同构 |
|---|---|---|
| 技术互联性 | 打字机硬件、打字培训、制造商三者相互依赖 | prompt 模板、eval 套件、下游解析逻辑、fine-tune 数据全部围绕某个模型的具体行为构建 |
| 规模经济 | 用的人越多,培训成本越低,替代品越难进 | 团队越熟悉某模型的”脾气”,调优经验越厚,迁移的知识折旧越大 |
| 准不可逆性 | 沉没的机器存量 + 人力资本让理性人拒绝切换 | 已调优的 prompt(人力资本)+ 已嵌入的 embedding/索引(资本存量)使切换 NPV 为负 |
David 的经典定义点出了为什么”当初随便选的”会变成”现在动不了的”:
“A path-dependent sequence of economic changes is one of which important influences upon the eventual outcome can be exerted by temporally remote events, including happenings dominated by chance elements rather than systematic forces.”
翻译成 PM 语言:你 MVP 阶段为了赶 demo 随手选的那个模型(chance element),可能正在决定你三年后的退出成本(eventual outcome)。 这正是路径依赖最反直觉的地方——决定锁定的不是深思熟虑的战略,而是早期为速度做的随机选择。
§2 Arthur 1989 的正反馈:为什么”越用越好”是个陷阱信号
W. Brian Arthur(《Competing Technologies, Increasing Returns, and Lock-In by Historical Events》, Economic Journal, 1989, vol.99(394), pp.116–131)给出了锁定的动力学,比 David 的静态描述更适合解释 AI:
- 每一次采用都提供该技术的使用经验 → 下一轮采用的收益更高(你的团队每多调一个 prompt,对这个模型的掌控就更深);
- 每一次采用都降低对该技术性能的不确定性 → 进一步向已锁定路径聚集(你越知道这个模型在边缘 case 上怎么表现,越不敢碰未知的新模型)。
Arthur 证明这类系统有三个性质,每一个都是 AI PM 的红灯:不可预测性(结果取决于偶然事件序列,无法从供需推导)、可能低效(锁定的不保证是最优)、政策抵抗性(常规的”补贴/优惠”无法解锁)。
[!warning] 判断信号反转 路径依赖理论给 PM 的最锋利的一条:“换了这个模型,我们的产品立刻好了一大截” 不是一个买入信号,而是一个锁定预警信号。 体验提升越大,意味着你正在把越多业务逻辑外包给这个特定模型的特定行为,正反馈的斜率越陡,未来退出时的悬崖越高。Arthur 的模型告诉你:正反馈不是免费的体验红利,它在同步累积一笔你看不见的退出期权损耗。
这条与 0432 专题的母命题严丝合缝:传统软件你可以锁版本、读 changelog;AI 模型你既锁不住版本(供应商单方面静默更新),又读不到完整 changelog。所以 Arthur 式正反馈在 AI 场景下比在 QWERTY 场景下更危险——QWERTY 至少不会在你睡觉时自己改键位。
§3 切换成本的微观结构:Shapiro–Varian 与 AI 迁移的真实账单
Shapiro & Varian(Information Rules, 1999)把路径依赖商业化为可计量的切换成本(switching costs)+ 网络效应。在 AI 模型迁移上,切换成本不是抽象概念,而是有实测区间的工程账单(来源:VentureBeat《Swapping LLMs isn’t plug-and-play》、safjan.com《The Real Cost of Model Migration》、Sensible Blog 迁移实录):
| 迁移深度 | 工时量级 | 锁定根源 |
|---|---|---|
| 仅替换 API endpoint | ~20 分钟 | 表面无锁定 |
| 含 prompt 重新调优 | 20–40 小时 | prompt 是行为补丁 |
| 深度集成(fine-tune + embedding + 复杂 prompt) | 80–120 小时 | 资本存量 + 人力资本双重沉没 |
| 完整渐进发布(影子模式 + 5%→100% 灰度) | 多周周期 | 风险验证不可压缩 |
最致命的一句话来自这些实录:生产环境的 prompt 平均”40% 是规格、60% 是针对旧模型行为的临时补丁”。 换模型不是插拔,是重写那 60% 的业务逻辑。再叠加供应商间的格式不兼容——OpenAI 偏好 Markdown 结构化分隔,Anthropic 偏好 XML 标签——迁移意味着全部提示词重写。这就是 David 的”技术互联性”在 2026 年的具体形态:你的产品和模型的怪癖长在了一起。
一个量化的锁定代价案例(来源:Divyam.ai《Hidden Cost of LLMflation》):一家月均 $60K OpenAI 支出的中型 SaaS,因”模型惰性(model inertia)“未跟随推理成本年降约 10 倍(LLMflation)的曲线,相对最优路由方案年损耗约 $33.3 万——这是路径依赖切换成本在 AI 产品层最直接的实证。它把 §2 的抽象正反馈翻译成了财报上的一行钱。
§4 判断主轴:深锁单一模型时,90% 的 PM 会在这四处搞错
| # | 症状 | 为什么会错 | 正确做法 | 真实反例 |
|---|---|---|---|---|
| 1 | 把”体验提升”当净收益记账 | 只看到正反馈的体验红利,看不到同步累积的退出期权损耗(Arthur 1989) | 每次深集成时同步估算”若此模型 6 个月后弃用,重写成本是多少”,把它记为或有负债 | OpenAI 2024-01-04 一次性下线 text-davinci-003 等 33 个模型;Sensible 公司被迫拆单次调用为两次、增延迟与成本(来源:Sensible Blog) |
| 2 | 以为”换供应商”就解开了锁 | 误用 vendor-lockin 框架,忽略锁定来自自己的 prompt 补丁与 embedding 存量(技术互联性) | 用抽象层(LiteLLM / Portkey / AI Gateway)把应用逻辑与模型 API 解耦,让那 60% 补丁尽量收敛到可迁移的中间层 | 跨供应商 prompt 格式不兼容(OpenAI Markdown vs Anthropic XML),换厂等于重写全部提示词 |
| 3 | 用 Preview/移动别名做生产关键路径 | 图新、图省事,把不可锁定的版本当稳定依赖 | 生产用带日期戳的固定快照(如 gpt-4o-2024-11-20)而非移动别名(gpt-4o);Preview 模型禁入关键路径 | OpenAI 官方明示 Preview 模型最短 2 周预告退役;2026-01 OpenAI 以两周预警下线多个模型,引发开发者强烈反应(来源:The Register, 2026-01-30) |
| 4 | 把”模型惰性”当稳健,实则是不议价 | 不切换被包装成”求稳”,掩盖了对成本曲线与议价权的放弃 | 维护 200–500 条生产查询样本周跑 eval,让”是否该切”成为有数据的决策而非惯性 | $60K/月 SaaS 因 model inertia 年损耗约 $33.3 万(来源:Divyam.ai) |
这四点的共同病理:把一个动态的、主动权外置的、有时间维度的锁定问题,误当成一个静态的、自己说了算的技术选型问题。
§5 产品 PM 视角补盲:锁定不只在工程层
工程 PM 容易把路径依赖窄化为”迁移工时”。但锁定在三个非工程层同样致命:
- 用户心理模型层:用户已经习惯了你产品里某个模型特有的”语感/风格/谄媚度”。2025-04 OpenAI 因新奖励信号导致 GPT-4o 系统性谄媚(sycophancy),数天内回滚并由 Altman 公开道歉(来源:OpenAI 官方《Sycophancy in GPT-4o》)——这说明即便供应商想”改好”,用户预期也会被供应商的单方面调整打破,而接收投诉的是你,不是 OpenAI。你被锁定的不只是模型,还有用户对”你的产品该是什么样”的预期。
- 商业模式层:定价。LLMflation 让推理成本逐年大幅下降,但被锁定的产品吃不到这个红利(见 §3 的 $33.3 万案例)。竞品若用抽象层吃到了降本曲线,你的毛利结构会被结构性碾压。
- 合规边界层:金融/医疗等受监管场景需要可复现可审计。一项金融工作流研究(Khatchadourian & Franco, arXiv:2511.07585, 2025)发现 GPT-OSS-120B 在 T=0 时仅 12.5% 输出一致性(95% CI: 3.5–36.0%),而 7–8B 小模型达 100%——反直觉地指向”小模型 + 自主可控更适合合规场景”。在这些场景,深锁一个会静默更新的大模型,等于把合规底座建在流沙上。
§6 对手框架回应:Liebowitz–Margolis 的”三度路径依赖”
最值得 PM 认真对待的反方,是 Liebowitz & Margolis(《The Fable of the Keys》, Journal of Law and Economics, 1990;《Path Dependence, Lock-In, and History》, JLEO, 1995)。他们直接挑战 David 与 Arthur,提出三度路径依赖框架:
| 等级 | 定义 | 是否市场失灵 |
|---|---|---|
| 一度 | 历史影响当下,但结果有效率 | 否 |
| 二度 | 决策时无法预见次优,事后看次优但纠正成本高 | 遗憾,非失灵 |
| 三度 | 当时已可预见次优、纠正收益 > 成本、却仍未纠正 | 真正的市场失灵——且他们认为极罕见 |
他们对 QWERTY 的反驳很硬:支持 Dvorak 优越性的实验证据”统计上极为薄弱”,最可靠的人体工学研究显示 Dvorak 优势”微乎其微”;VHS 击败 Betamax 是因为 VHS 录制时间更长——市场选择了消费者真正在意的属性,不是锁定了次优。
[!note] 接受 + 边界 接受:Liebowitz–Margolis 是对的——前瞻性行为者(品牌承诺、提前规划、保留退出路径)确实能避免大多数劣质锁定;当前学界(2026)的共识也偏向他们一侧——真正”三度低效锁定”的实证案例,比 David 1985 暗示的稀少得多。换言之,“被锁定”在很多时候是 PM 偷懒的借口,而非客观宿命。 边界:但他们的框架恰恰给了 AI PM 一个可操作的判据,而不是一个免罪符。AI 模型锁定之所以更接近”真正的市场失灵”,是因为它同时满足三度的两个条件且打掉了第三个——(a) 可预见:弃用政策、静默更新、行为漂移(Chen, Zaharia & Zou 2023, arXiv:2307.09009:GPT-4 素数识别准确率 March 84% → June 51%)都是已知的、可预见的结构性风险,不是事后才知道;(c) 纠正收益 > 成本 也常成立(§3 的 $33.3 万);唯独 (b) 纠正本身被供应商的主动权外置和 60% prompt 补丁卡住了。所以我赌的边界是:在传统软件里 Liebowitz–Margolis 多数情况下赢”频率之争”(真锁定很罕见),但在 AI 模型依赖这个特定子域,三度锁定的发生频率被静默更新和不可锁版本系统性抬高了。 这个赌注的失效场景见下。
failure scenario(本节结论何时失效):若开放标准(如 MCP,Anthropic 2024-11 发布、已被 OpenAI/Microsoft 等接受)与抽象层成熟到让切换成本逼近”20 分钟换 endpoint”,且开源模型(权重持久、无供应商单方更新)成为生产主流,则我的”AI 子域三度锁定高频”判断会回落到 Liebowitz–Margolis 的”罕见”区间。这不是不可能——2026 年多供应商策略采用率已从约 23% 升至约 40%(来源:Kai Waehner 行业分析,2026),方向正在他们那边。
§7 跨域呼应:David vs Arthur 之争,与 Rick 的滴滴平台经验
路径依赖之争本身就是一次方法论的格式塔切换,值得调度。David/Arthur 阵营主张机制客观存在、正反馈在 critical juncture 以非线性放大偶然,个体无法逆转宏观动态;Liebowitz/Margolis 阵营主张市场提供足够多”克服锁定”的工具。2026 年的折中共识是:机制层 David/Arthur 未被推翻,频率层 Liebowitz/Margolis 占优。
这个张力直接接 Rick 的滴滴双边市场经验。平台政策突变(如算法调价导致司机行为突变)与模型静默更新是同构的权力不对称:complementor(司机 / 产品方)把生计/业务深锁进平台/模型,平台/供应商单方面改规则,complementor 被动承受。但有一个关键差异让 AI 更极端——滴滴的政策变更至少有公告、有生效日期、有申诉通道(哪怕不透明);模型静默更新连完整 changelog 都没有。 Rick 在出行平台做费用治理时处理过”平台规则变更后司乘行为突变”的治理,那套”降发生 + 分层补偿”的方法论,本质是在管理 complementor 的路径依赖风险。把它迁移到 AI PM:你对模型的依赖治理,需要的不是”选最好的模型”,而是 降发生方法论 式的”让锁定不发生 / 发生了能分层退出”。这是 Rick 的不公平优势——他在双边市场里亲历过路径依赖的权力不对称,只是当时的”平台”现在换成了”模型供应商”。(延伸阅读:0133新制度经济学 的交易成本视角,North 1990 把路径依赖推广到制度层,与本节同源。)
§8 PM 决策启示:面试 / 选型 / 复现三类落地
- 面试:被问”你怎么看 AI 产品的供应商风险”,不要答”做好多供应商备份”。答:“这是路径依赖问题,不是供应商问题——真正的锁定来自我自己积累的 prompt 补丁和 embedding 存量。我会用 David 的技术互联性识别锁定点、用 Arthur 的正反馈把’体验大涨’读成锁定预警、用 Shapiro–Varian 给切换成本定价,再用 Liebowitz–Margolis 校准——别把可避免的二度锁定当成宿命。” 30 秒说清,且带得出 §6 的反方。
- 选型:建一张”锁定预算表”——每个候选模型记三列:体验增益、估算退出成本(§3 工时表)、版本可锁性(固定快照 vs 移动别名 vs Preview)。体验增益最高的那个,往往退出成本也最高,不要只看第一列。
- 复现:生产与评测一律钉固定快照 ID + 评估日期 + temperature + system prompt 版本。这既是复现纪律,也是反锁定纪律——能复现,才能在切换时有 apples-to-apples 的基准(接 A02 模型更新致行为突变 与 0412 评测专题的回归测试)。
§9 与已有节点的关系
- 对照 m209 - 推理成本控制手册:深化 + 对话。m209 的 §2.6.3 模型路由把”用便宜模型省钱”讲透了,但它的隐含前提是”你能自由切换模型”。本节点补的正是这个前提的脆弱性——路由是反锁定的工程手段,但若你已深锁单一模型,路由本身就路由不动了。本节点不复述 m209 的路由机制与价格表,只指出:路由的可行性,等于你没被锁定的程度。 把 §3 的 $33.3 万 model inertia 案例与 m209 的路由收益放在一起读,是一组完整的”锁定成本 vs 解锁收益”账。
- 对照 0432 同级节点 A02 模型更新致行为突变:互补横切。A04 讲”模型会变”(时间性的现象),本节点讲”你已无法离开会变的模型”(时间性的结构后果)。二者合起来才是 0432 母命题的完整一半。
- 对照 0133新制度经济学:升高抽象层。把 AI 模型依赖接入 North 的制度路径依赖谱系,说明这不是 AI 独有的新问题,而是收益递增锁定的又一实例——但 AI 把”主动权外置 + 不可锁版本”两个变量推到了极端。
§10 关联节点
核心(必读)
- m209 - 推理成本控制手册 — 反锁定的工程手段(模型路由)在此,本节点是它的前提脆弱性分析
- A02 模型更新致行为突变 — 同专题横切:模型会变 ↔ 你离不开会变的模型
- 0133新制度经济学 — 路径依赖的制度经济学母体(North / 交易成本)
- 我此前在出行平台做费用治理的实践 — Rick 平台政策突变治理经验,权力不对称同构
- 降发生方法论 — “让锁定不发生 / 分层退出”的方法论迁移源
延伸(可选)
- OpenAI — 弃用政策与静默更新的主要事实来源
- Anthropic — MCP 开放标准、权重保存承诺(反锁定的另一侧证据)
- Claude — 跨供应商格式差异(XML vs Markdown)的迁移成本来源
- Agent — Agent 系统对单一模型的深耦合,放大锁定风险
- Scaling Laws — 解释为何前沿模型集中于少数供应商(结构性锁定的上游)
- 0117社会学 — 平台权力与 complementor 依赖的社会学视角
修订日志
- 2026-06-07 R0:首稿。建立 David–Arthur–Shapiro/Varian 正方框架 + Liebowitz–Margolis 三度路径依赖反方,判断主轴四件套,跨域调度 Rick 滴滴平台经验,链 m209 路由 / A04 漂移 / 0133 新制度经济学。待后续 grounding pass 复核 §3 工时区间与 $33.3 万案例的来源等级(行业博客,非同行评审)。