README·0413·多视图阅读指南
成本工程系统化专题 · README(多视图阅读指南)
这是
0413 成本工程系统化专题的第二把钥匙。_成本工程系统化专题·总览(MOC)回答”这个专题为什么存在、由什么组成”;本页只回答一件事——你是谁、现在有多少时间、读完要拿到什么,对应该走哪条路径。专题是一张网不是一条线,强行从 A01 读到 R03 是最低效的读法。先在下面三条路径里认领一条,按”前置产出”对照自己读完后能不能交付,再用自测题验收,最后用反方对话训练压力测试。
0. 三秒选路
| 你现在的处境 | 走哪条 | 总时长 |
|---|---|---|
| 明天面试 AI PM / 要在简历项目里讲清”我算过一个 AI 产品的账” | 路径 A · 求职速通 | 约 90 分钟 |
| 在岗,评审会上要质询工程的降本方案 / 要从零搭成本核算 | 路径 B · M1–M5 决策链 | 约 4 小时(可分次) |
| 不确定,但想知道”哪条最该先读” | 路径 C · 紧迫度红橙黄蓝 | 按红→蓝优先级,碎片时间也能读 |
[!tip] 一条铁律先记下 全专题只有一个判断主轴,三条路径都会撞到它——A07 成本约束反向塑造产品 的那句”你以为的产品决策,多半是成本约束的影子”。如果时间只够读一个节点,读 A07;如果只够记一句话,记”per-token ≠ per-user”(见 A02 成本对象层级辨析·per-token per-query per-task per-user per-seat)。
路径 A · 求职速通(面试桌)— 约 90 分钟
适合:转型 AI PM 面试、把成本判断力变成简历里能讲 5 分钟的项目、临阵磨枪。 目标产出:面试桌上 30 秒说清”我怎么判断一个 AI 产品赚不赚钱”,并能被追问任意一层都接得住。
| 序 | 节点 | 时长 | 读完必须能交付的”前置产出”(不达标就别往下走) |
|---|---|---|---|
| A1 | A02 成本对象层级辨析·per-token per-query per-task per-user per-seat | 15 min | 当场画出 per-token → per-query → per-task → per-user → per-seat 的换算链,并举一个”拿 per-token 谈 per-user 盈利”的错位例子 |
| A2 | S01 AI 产品成本结构分层剖面(★旗舰,本路径最厚) | 30 min | 默写 AI 产品成本分层堆栈(算力/KV Cache → API 计费 → per-user COGS),并指出至少一个”致命耦合点”(如并发上限硬锁 → per-user 边际成本) |
| A3 | A07 成本约束反向塑造产品(判断主轴) | 15 min | 任举一个产品限制(context 上限 / rate limit / 免费额度 / 优雅降级),反推它背后的成本约束 |
| A4 | E03 一个 RAG Agent 产品的 unit economics 拆解 | 20 min | 口头拆一个 RAG/Agent 产品的 per-query 成本(embedding + 检索 + 生成 + 重试)和 per-user 月成本,给出毛利大概区间 |
| A5 | 回看 A01 成本概念史与口径辨析 的 COGS/CAC/LTV 表(仅查阅,不精读) | 10 min | 说清 AI 产品的 COGS 与传统 SaaS 为什么不同(变动成本随用量线性增长,边际成本≠0) |
速通口袋卡(背下来,面试可直接复述)
- 一次对话的钱里,output token 通常比 input 贵几倍,长上下文烧的是 KV Cache 显存(A03 Token Economics 精算)。
- per-token 单价 × 人均调用量 ÷ 转化率 − CAC,才知道这个产品能不能活(E03 一个 RAG Agent 产品的 unit economics 拆解)。
- Agent 的账是单次对话的几倍到几十倍——每步都过一次推理 + 重试(E03 一个 RAG Agent 产品的 unit economics 拆解)。
- 别说”等模型降价就行”——那是 Jevons 悖论的陷阱(见路径末反方训练第 1 题)。
路径 B · M1–M5 决策链(评审会 / 在岗)— 约 4 小时(建议分 2–3 次)
适合:在岗 PM,要在评审会逐层质询降本方案、要为一笔失控账单做归因、要从零搭成本体系。 目标产出:拿到任何降本方案都能逐层质询”降哪笔账、代价是什么质量损失、值不值得做”;并能为成本失控设计自动负反馈(熔断/降级)。
这条路径按 PM 的五个被成本穿过的决策链节点(对应总索引 M1–M5:定价 / 功能设计 / 技术选型 / 商业模式 / 合规)组织,每段都标注它落在哪个决策链节点上。
M1 统一口径(定价的地基)— 30 min
- A01 成本概念史与口径辨析:token 计费 / 推理成本 / TCO / unit economics 四种口径之辨。
- 前置产出:评审会上听到”成本”二字能立刻反问”你说的是哪个口径——API 单价、TCO、还是 per-user COGS?“
M2 看清成本由什么组成(技术选型的承重梁)— 60 min
- S01 AI 产品成本结构分层剖面(★旗舰):成本分层堆栈 + 各层接口 + 致命耦合点。
- S02 降本手段流派对照矩阵:量化·蒸馏·MoE·缓存·路由·batching·投机解码 × 降本幅度/质量代价/复杂度/场景。
- 前置产出:拿到一张降本手段清单,能在矩阵上指出每个手段的”降本幅度上限”和”质量代价”,并说出它适配/不适配的场景。
M3 在时间维度上判断”该不该为这次降本买单”— 30 min
- G01 推理成本代际谱系总图:Dense→MoE→量化→投机解码→缓存→端侧 + token 价格历史下降曲线。
- G02 成本代际演化详解:逐代的推动力、瓶颈、被下一代如何超越、2026 当下位置。
- 前置产出:看到”某新技术降本 80%“,能判断它是开辟新成本下界的进步性降本,还是把成本挪到别处(reasoning token / 显存 / 端侧设备)的退化性转移。
M4 搭可归因、可熔断的成本体系(商业模式的运维底座)— 40 min
- S03 FinOps for AI·成本可观测与归因全景:按功能/用户/租户归因、预算告警、成本回归、成本 drift。
- 前置产出:能设计一个带自动负反馈的成本体系——没有熔断/降级触发器的告警等于没有(AI 成本是分钟级失控)。
M5 对症剖解真实标本(功能设计 + 合规)— 40 min(按需查阅,不必全读)
- E01 ChatGPT 与 Claude 的 context rate-limit 产品成本耦合剖解:context 上限/rate limit/订阅分层如何由成本反推。
- E02 Apple Intelligence 与端侧推理成本剖解:端侧 + 私有云分流的成本与隐私策略(合规-成本权衡)。
- 前置产出:能解释一个具体产品限制”为什么这么设”,并区分”端侧是分流不是替代”。
[!note] 决策链路与总览 §5 的对应 本路径是总览 _成本工程系统化专题·总览 §5 第 2 条”决策链”起点的展开版,把它细化到 M1–M5 五个决策链节点 + 每段前置产出。两者可对照。
路径 C · 紧迫度红橙黄蓝(碎片 / 按需)
适合:没有整块时间、或不确定从哪进,想按”现在最该解决的痛”挑节点。按颜色优先级读,红色不读完别碰蓝色。
| 紧迫度 | 什么情况下你在这一档 | 先读哪些(按序) | 读完前置产出 |
|---|---|---|---|
| 🔴 红 · 救火 | 账单已经失控 / 明天定价会要报免费额度 / 面试就在眼前 | A02 成本对象层级辨析·per-token per-query per-task per-user per-seat → S03 FinOps for AI·成本可观测与归因全景(归因+熔断)→ R01 最小可运行·Token 成本计算器 | 当场把”贵不贵”算成一个具体数字,并给账单做出归因定位 |
| 🟠 橙 · 决策在即 | 这周要选型 / 要批一个降本方案 / 要定 context 上限 | S02 降本手段流派对照矩阵 → A05 模型路由与 Mixture-of-models → A04 推理成本三角·模型大小 延迟 质量 → A07 成本约束反向塑造产品 | 在”模型大小×延迟×质量”三角上定位需求,选出降本手段并说清代价 |
| 🟡 黄 · 系统补课 | 没有急事,想把成本判断力补成体系 | A01 成本概念史与口径辨析 → A03 Token Economics 精算 → S01 AI 产品成本结构分层剖面 → G01 推理成本代际谱系总图 → E03 一个 RAG Agent 产品的 unit economics 拆解 | 能从口径到结构到代际到实例,完整讲一遍”成本在 AI 产品里怎么运作” |
| 🔵 蓝 · 深潜 / 动手 | 想亲手验证、做成简历项目、训练长期判断 | A06 端侧与云端成本重构 → E01 ChatGPT 与 Claude 的 context rate-limit 产品成本耦合剖解 → E02 Apple Intelligence 与端侧推理成本剖解 → R02 中型·模型路由 + 语义缓存 降本实验 → R03 Unit Economics 模型·CAC COGS LTV 与盈亏平衡 | 跑通一个路由+语义缓存降本实验,建一张带盈亏平衡点 + 敏感性分析的 unit economics 表 |
[!tip] 碎片时间组合 通勤 15 分钟只够读 🔴 里的一个;午休 40 分钟可吃掉 🟠 的前两节;周末两小时刷完 🟡 一整条。复现节点(R01/R02/R03)建议留给有键盘的整块时间。
自测题(≥10 题,每题标”及格线 / 优秀线 / 反例”)
读完任意一条路径后做对应题;想全面验收就全做。及格线 = 转型 PM 该有的下限;优秀线 = 能在面试/评审里碾压平均水平;反例 = 这道题最容易踩的坑,答到这步才算真懂。
Q1(口径|A01/A02) 一个工程同学说”我们这个功能成本很低,每千 token 才几分钱”。这句话哪里有问题?
- 及格线:指出”每千 token”是 per-token 口径,不等于 per-user 成本,得乘人均调用量。
- 优秀线:补出完整换算链 per-token → per-query → per-task → per-user → per-seat,并指出”成本低”还要看 output/input 价差、上下文长度、重试次数。
- 反例(最易错):把”单价低”直接当成”毛利高”——漏了 CAC、转化率、留存;高频调用的低单价产品可能比低频高价产品更不赚钱。
Q2(Token Economics|A03) 为什么”把 prompt 写长一点让模型答得更好”是一个有成本含义的决策?
- 及格线:说出长上下文增加 input token,且占用更多 KV Cache 显存。
- 优秀线:指出 KV Cache 显存随上下文长度增长会压低并发上限,间接抬高 per-user 边际成本;并知道 Prompt Caching 能折扣高频重复的长 system prompt(接 Prompt Caching)。
- 反例:以为”input 便宜所以随便加”——在 reasoning/长程任务里,长上下文还会放大 output 和 thinking token,复合成本非线性上涨。
Q3(推理三角|A04) “模型大小 × 延迟 × 质量”为什么是个三角而不是可以三者都要?
- 及格线:说清三者互相牵制——更大模型质量高但延迟高成本高,要降本/降延迟通常牺牲质量。
- 优秀线:引入 inference scaling / test-time compute——同一模型可以用更多推理 token 换质量,把三角变成四维权衡(接 c11 - System 2 思维与 Test-Time Compute)。
- 反例:以为”换小模型 = 纯降本”——小模型在质量敏感任务上的失败率上升,重试和人工兜底的隐性成本可能反超。
Q4(路由|A05) OpenRouter/Portkey 宣称”模型路由能砍 60%+ 成本”。你怎么回应?
- 及格线:接受路由对低复杂度请求降本显著,但指出不是所有场景都有低复杂度请求可分流。
- 优秀线:用 Baumol 成本病指出质量敏感场景(医疗/法律)存在”刚性成本区”——必须用最强模型,路由砍不动;且 fallback 引入可靠性风险。
- 反例:把某案例的”平均成本约 37%“(m209 实测)当通用数字照搬——换请求复杂度分布就失真。
Q5(端侧|A06) “未来推理都跑在端侧,云端成本会归零”——这个判断的边界在哪?
- 及格线:指出端侧能省 API 费且利好隐私,但大模型短期跑不动端侧。
- 优秀线:用 TCO 框架指出端侧加了设备/适配/维护/质量回退成本,“端侧是分流不是替代”;70B/671B MoE 必须留云端。
- 反例:把”省了 API 费”当成”总成本下降”——只算了显性那一项,漏了端侧的隐性 TCO。
Q6(判断主轴|A07) 为什么说 ChatGPT 的 context 上限、rate limit、免费额度”都是成本约束的影子”?
- 及格线:说出这些产品限制本质是成本结构倒逼的,不是纯粹的体验设计。
- 优秀线:能反推——context 上限对应 KV Cache 显存与并发,rate limit 对应单位时间算力预算,免费额度对应获客成本(CAC)的可承受上限(接 E01 ChatGPT 与 Claude 的 context rate-limit 产品成本耦合剖解)。
- 反例(A07 的 failure scenario):在成本占比极低的场景(低频高价 B2B 工具)强行用成本视角解释产品决策——此时主导约束是别的,会误判。
Q7(代际|G01/G02) 看到”token 又降价了”,怎么判断它是真进步还是把成本挪了地方?
- 及格线:知道降价不一定让总成本下降(Jevons:用量/上下文/推理深度会涨)。
- 优秀线:用库恩范式 + 拉卡托斯纲领退化二分——进步性降本开辟新成本下界,退化性转移只是把成本挪到 reasoning token / 显存 / 端侧设备;多数”降价”是退化性的。
- 反例:把 token 价格曲线当摩尔定律线性外推——推理降本靠算法+架构+硬件三重叠加,会有”算法红利耗尽”的拐点(G01 的 failure scenario)。
Q8(架构剖面|S01) 给你一笔失控的账单,你按什么层级去归因定位?
- 及格线:能从成本分层堆栈(算力/KV Cache → API 计费 → per-user COGS)自上而下排查。
- 优秀线:指出致命耦合点——某层的变化(如上下文变长)会沿堆栈向上放大到 per-user COGS;并能按功能/用户/租户维度归因(接 S03 FinOps for AI·成本可观测与归因全景)。
- 反例:只盯 API 账单总额不做归因——找不到是哪个功能/哪批用户/哪个 prompt 在烧钱。
Q9(降本矩阵|S02) 同事说”量化是免费午餐,降本 50–70% 还几乎不掉质量”。哪里要打问号?
- 及格线:指出量化有质量损失(如 INT4 AWQ 约 2–5%),不是零代价。
- 优秀线:指出质量损失在长程/精确任务上非线性放大,“降本 50–70%“的代价在某些场景是产品不可用;矩阵给的是量级不是精确值。
- 反例(confirmation-bias):把”量化稳赚”当通用结论——和蒸馏/MoE/路由一样,每个手段都有 failure scenario,要在矩阵上对照场景选。
Q10(FinOps|S03) “我们已经接了成本仪表盘,成本可观测了”——这够吗?
- 及格线:指出可观测是前提但不等于可控。
- 优秀线:用控制论指出必须有自动负反馈回路(熔断/降级触发器)——AI 成本是分钟级失控(一个 prompt 注入循环就能烧光预算),人盯仪表盘来不及。
- 反例:把”看板告警”当成”成本控制”——告警没有自动动作,等于没有(接 仪表盘)。
Q11(unit economics|E03/R03) 你拆出一个 RAG Agent 产品的盈亏平衡点是”月活 12,400 人”。这个数字该怎么用?
- 及格线:知道这是个估计值,不能当确定结论汇报。
- 优秀线:指出 CAC/留存/转化/人均调用量在上线前都是猜的,必须给区间 + 敏感性分析,而非单点估计(Polanyi:精确小数位是认识论幻觉,接 Polanyi 默会知识与提示工程的认识论张力)。
- 反例(E03/R03 的 failure scenario):把单点盈亏平衡点写进 deck 当承诺——上线后任一假设偏 20% 就翻盘。
Q12(Agent 账|E03) 为什么一个多步 Agent 的 per-query 成本可能是单次对话的几十倍?
- 及格线:说出 Agent 每步都过一次推理。
- 优秀线:拆出 embedding + 检索 + 多步生成 + 重试 + 工具调用,每步累加;并指出这是 0411 Agent 专题没算的那笔账(接 S01 Agent 六层架构剖面)。
- 反例:用单次对话的单价估 Agent 成本——低估一到两个数量级。
及格判定:路径 A 至少做对 Q1/Q6/Q11/Q12;路径 B 至少做对 Q1/Q4/Q7/Q8/Q9/Q10;想拿”出版级读者”自评,12 题里 ≥9 题答到优秀线、且能在每题说出反例。
反方对话训练(成本领域 6 大高频追问)
[!warning] 用法 这不是”标准答案背诵”,是对抗式训练。面试官、工程负责人、投资人会用这 6 句来打你的判断。原则照搬宪章 §7——接受对方对的部分,再标注自己坚持的边界与赌注,不是硬反驳。每条都给”对方的杀招 / 接受什么 / 守住什么边界 / 一句话收口”。
追问 1 ——“模型越来越便宜,成本还重要吗?“(Jevons)
- 对方的杀招:token 价格两年降了一个数量级,再等等就白菜价了,PM 操心成本是不是杞人忧天?
- 接受:token 单价确实在快速下降,这是真的,也确实让很多原来做不起的产品变得可行。
- 守住的边界:这正是 Jevons 悖论——单位成本越低,调用量、上下文长度、推理深度(reasoning token)涨得越凶,总账单常不降反升。降价不是让成本问题消失,是让它换个地方爆。成本是主动设计问题(要主动限流、卡 context、设降级),不是被动等待问题(见 A07 成本约束反向塑造产品、G01 推理成本代际谱系总图)。
- 一句话收口:“越便宜越要算账——便宜会诱发用量爆炸,账单的失控点从单价转移到了用量和深度。“
追问 2 ——“端侧不就免费了吗?“(端侧/本地化乐观主义)
- 对方的杀招:Apple Intelligence 都端侧跑了,推理放用户设备上,云端成本归零,成本问题不就解决了?
- 接受:端侧分流确实能省 API 费、利好隐私合规,是真实趋势。
- 守住的边界:用 TCO 框架——端侧”省了 API 费”但加了设备适配、模型分发、质量回退、维护成本;而且端侧硬件跑不动大模型,70B/671B MoE 必须留云端。Apple 自己也是”端侧 + 私有云分流”双轨,不是纯端侧。端侧是分流不是替代(见 A06 端侧与云端成本重构、E02 Apple Intelligence 与端侧推理成本剖解)。
- 一句话收口:“端侧把成本从云账单挪到了设备和工程,总 TCO 不一定降;它解决的是隐私和分流,不是消灭成本。“
追问 3 ——“路由省钱,为什么大厂不都用?“(模型路由万能论的反向版)
- 对方的杀招:既然便宜模型兜底、复杂任务才升级强模型能砍这么多成本,为什么不是行业标配、人人都上?
- 接受:路由对低复杂度、高同质请求降本确实显著(m209 实测某场景平均成本约 37%)。
- 守住的边界:三道坎——①Baumol 成本刚性区:质量敏感场景(医疗/法律/代码生成)不能用便宜模型兜底,路由砍不动;②fallback 可靠性风险:路由判错复杂度会把难任务派给弱模型,引入质量事故;③路径依赖/锁定:自建 router 形成工程锁定,迁移成本随时间上升。大厂不全用,是因为它们的请求分布里刚性区占比高、且对可靠性零容忍(见 A05 模型路由与 Mixture-of-models、S02 降本手段流派对照矩阵)。
- 一句话收口:“路由不是不省钱,是省的那部分恰好是大厂最不缺的低价值请求,而它砍不动的刚性区恰好是大厂的命门。“
追问 4 ——“MoE 激活参数少,不就是更便宜的架构吗?”
- 对方的杀招:DeepSeek-V3 总参 671B 但只激活 37B,算力成本低,MoE 就是更省的架构,选它准没错。
- 接受:MoE 激活参数少、算力(FLOPs)成本确实低,单 token 推理更省。
- 守住的边界:MoE 把变动成本换成了固定成本——总参数全部要常驻显存,显存门槛极高。对大规模高并发部署划算(摊薄固定成本),但对小规模/低并发部署反而更贵(显存利用率低)。“MoE = 便宜”漏掉了显存这笔固定账(见 A04 推理成本三角·模型大小 延迟 质量、c06 - 架构演进:Dense MoE SSM Hybrid)。
- 一句话收口:“MoE 省的是算力、烧的是显存——它对你便不便宜,取决于你的并发规模能不能摊薄那笔显存固定成本。“
追问 5 ——“reasoning model 分数更高,当然该选更强的,成本是小事”
- 对方的杀招:o 系列、extended thinking 在 SWE-bench 这些榜上分数高一截,PM 纠结那点成本干嘛?
- 接受:extended thinking / reasoning 确实提升复杂任务质量,高分有真实能力支撑。
- 守住的边界:thinking token 单独计费,让 per-task 成本暴涨——一个高分可能是靠堆推理 token + 多次采样换来的,per-task 成本高到产品化不可行。评测分要除以达到该分数的成本才有意义(接 0412 评测专题”这个分数值这个价吗”)。质量和成本是同一张表的两列,不能只看一列(见 A03 Token Economics 精算、A04 推理成本三角·模型大小 延迟 质量)。
- 一句话收口:“榜单不计成本,产品必须计成本——高分若靠烧 reasoning token,可能是个赢了 benchmark、输了毛利的选择。“
追问 6 ——“成本优化是规模化以后的事,MVP 阶段先把功能跑通”(精益创业派)
- 对方的杀招:过早优化成本会拖死迭代速度,先上线验证 PMF,成本等有量了再说。
- 接受:MVP 阶段为省每千 token 几分钱去做重度优化,确实是过早优化、会拖死迭代——这点对。
- 守住的边界:但成本可观测 + 熔断不是”优化”,是”安全带”,不能等规模化。AI 成本是分钟级失控——一个 prompt 注入循环、一个死循环 Agent、一次 prompt 泄露能在几小时内烧光预算。区分两件事:精细降本可以等,成本告警 + 自动熔断/降级必须 day 1 就有(控制论的负反馈回路,见 S03 FinOps for AI·成本可观测与归因全景)。
- 一句话收口:“降本可以晚做,但失控不会等你规模化——MVP 也要系安全带,区别只是要不要现在就抠那几分钱。”
[!note] 训练自检 6 条追问里,你能不能对每一条都做到”先接受、再划边界、最后一句话收口”而不滑进硬反驳或全盘接受?做不到的那条,回去重读对应节点的”对手框架回应”段。这 6 条对应总览 _成本工程系统化专题·总览 §7「对手立场接入清单」的 1/2/4/5/8/3 条,可交叉对照。
关联节点
专题内(三路径覆盖的全部节点)
- 概念辨析:A01 成本概念史与口径辨析、A02 成本对象层级辨析·per-token per-query per-task per-user per-seat、A03 Token Economics 精算、A04 推理成本三角·模型大小 延迟 质量、A05 模型路由与 Mixture-of-models、A06 端侧与云端成本重构、A07 成本约束反向塑造产品
- 代际演化:G01 推理成本代际谱系总图、G02 成本代际演化详解
- 架构剖面:S01 AI 产品成本结构分层剖面、S02 降本手段流派对照矩阵、S03 FinOps for AI·成本可观测与归因全景
- 实例剖解:E01 ChatGPT 与 Claude 的 context rate-limit 产品成本耦合剖解、E02 Apple Intelligence 与端侧推理成本剖解、E03 一个 RAG Agent 产品的 unit economics 拆解
- 复现指南:R01 最小可运行·Token 成本计算器、R02 中型·模型路由 + 语义缓存 降本实验、R03 Unit Economics 模型·CAC COGS LTV 与盈亏平衡
导航与方法论
- _成本工程系统化专题·总览(MOC,本页的另一把钥匙)
升级对照 / 对话的既有节点(自测题与反方训练里引用)
- m209 - 推理成本控制手册、c05 - 算力物理定律与 KV Cache、c06 - 架构演进:Dense MoE SSM Hybrid、c07 - 量化 Quantization 与端侧部署、m202 - 工程选型决策矩阵、c11 - System 2 思维与 Test-Time Compute、Prompt Caching、多模型分层、仪表盘
跨专题 / 跨域
修订日志
- R0(2026-06-07,综合初稿):依宪章 §12 交付清单的 README 条目(三路径 + ≥10 自测题 + 反方对话训练)与总览 §5 三条阅读起点写成。三路径:A 求职速通(约 90 min,5 节点 + 速通口袋卡,每节标读完前置产出)、B M1–M5 决策链(约 4h,按定价/功能设计/技术选型/商业模式/合规五个决策链节点组织,每段标前置产出)、C 紧迫度红橙黄蓝(按救火/决策在即/系统补课/深潜动手四档 + 碎片时间组合表)。自测题 12 题(超过 ≥10 要求),每题标”及格线/优秀线/反例”,并给路径化的及格判定。反方对话训练 6 条高频追问(Jevons 降价无用论、端侧免费论、路由为何大厂不全用、MoE 便宜论、reasoning model 高分值得论、精益创业延后成本论),每条按宪章 §7”接受+边界+收口”工艺写,并交叉标注对应总览 §7 对手立场清单第几条。双链全部使用节点索引中的真实 basename。待后续轮次:①待 16 节点正文落稿后复检全部专题内双链 resolve(当前为规划目标 basename,与总览同步);②跑 grounding pass 核 Q4 的”约 37%“、Q9 的”INT4 AWQ 约 2–5%“等引自 m209/c07 的数字(本页未引入总览之外的新硬数字,均指向既有节点);③入库 move 到 final_path 后随专题登记进
00Meta/索引.md。