README · 多视图阅读指南

这张网不是用来从头读到尾的。它是一个认识论立方体——横向（A 是什么）、纵向（G 从哪来）、解剖（S 由什么组成）、病理（E 现实怎么走样）、操作（R 自己怎么动手），靠双链织成。本 README 是它的反向编织器：给你三条按身份裁好的路径、一套自测题、一组反方对话训练，让你不论从哪个入口进来，都能在最短时间里拿到这个专题承诺的产出——在面试桌、选型会、复现台上，30 秒说清”为什么我不会让团队直接信这份 AI 报告，以及我会在哪一层、用什么机制设防”。

本专题的一句话立场先放在这里，读任何路径前都先记住它：真正杀死知识质量的，不是模型答错，而是用户（包括专业审阅者）在一个误判了中介性质的姿态下，把流畅的模拟当成了有保证的知识接收下来。 整套立方体都是这句话的展开。

总览（MOC）见 _AI 认识论中介系统化专题·总览；本 README 是它的操作化伴侣——总览回答”这张网是什么”，README 回答”我这种人该怎么读、读完怎么自检”。

一、三条阅读路径（各标时长 · 前置 · 产出）

三条路径不是难度递进，是身份适配：你是在备面试、在岗做决策、还是想先看清”AI 到底特殊在哪”，决定了你该走哪条。每条都给了预计时长、前置（读它之前最好已有的底子）、读完的可观测产出。三条路径有交集节点（A06/S01/E02 是枢纽），重复读它们是值得的。

路径甲 · 求职速通（约 70–90 分钟）

适合谁：备战 AI PM 面试，要的是 30 秒高区分度答案，不是完整哲学训练。前置：知道什么是 RAG、confidence display、human-in-the-loop 三个词的字面意思即可；不需要认识论背景。产出：能在白板前 30 秒讲清”认识论判断→三套机制”的承重逻辑，并对”你怎么设计 AI 报告产品的可信度”给出一个让面试官从”会用组件”重新评估为”懂系统”的答案。

步	节点	时长	读它拿什么
1	A06 认识论决定产品设计	25 min	承重墙。confidence ← 校准、citation ← 证言/仪器地位、HITL ← verification vs rubber-stamping，三套机制各对应一条认识论判断
2	S02 认识论立场对照矩阵	15 min	四立场（工具/证言者/生成器/合作者）× 三后果（信任/验证/归责）矩阵，逼你显式选一种立场并承担全部后果
3	E02 AI 报告审阅的认识论剖解	20 min	现成反例库。“绝大多数 AI 报告审阅在认识论上是橡皮图章，且不是审阅者偷懒、是场景结构在逼出橡皮图章”——面试讲故事的弹药
4	R03 Confidence 与 Citation 的认识论设计	15 min	可验收契约。被追问”具体怎么落地”时，给出”禁止自报置信度 / claim-level / 低置信改变交互模式”的字段级答案

速通版 30 秒口径（背下来）：可信度不是某一层的功能，是一条从来源层穿透到归责层的链；我会先定位 AI 在这个场景的认识论地位——它是不可问责的”技术性信念”来源，所以 citation 是把它降级回仪器姿态的必需契约；confidence 必须来自外部信号而非模型自报（自报系统性失真）；HITL 必须选择性触发，因为 verification 才是瓶颈、不是生成。

路径乙 · 决策链（约 110–140 分钟）

适合谁：在岗 PM，手上有真实的选型 / 评审 / 设计任务，要把判断主轴打印贴墙。前置：走过路径甲，或至少读过 A06 认识论决定产品设计;最好同时手边有一个真实的 AI 输出 / 一份供应商资料，边读边对着跑。产出：拿到三件可立即用的工具——选型时的三问清单、一段输出的三轴体检表、一套能逼出真验证的审阅流闸门;能在评审会上指着六层剖面说”故障在第几层”。

步	节点	时长	读它拿什么
1	A01 AI 作为认识论中介概念谱系	20 min	先定性：AI 在用户与知识间占了”工具/证言者/生成器”哪个位置——位置而非智能决定认识责任如何分配
2	S01 AI 认识论中介分层剖面	30 min	旗舰。六层剖面（来源→检索→生成→校准→验证→归责）+ 三个层间致命耦合，把”AI 是中介”落成一张能贴评审会墙上的故障定位表
3	R01 评估一个 AI 输出的认识论地位	25 min	三轴体检（可溯源 / 可验证 / 有保证），把”我信不信”拆成可操作判定;关键洞察：同一段输出的认识论地位随场景、随你的核验能力、随决策可逆性而变
4	R02 设计 Verification 而非 Rubber-stamp 的审阅流	25 min	四道机制闸门（强制溯源核对 / 抽检+种子错误 / 异议成本 / 触发设计），把”人在回路”从组织结构问题改写成过程可靠性问题
5	R03 Confidence 与 Citation 的认识论设计	20 min	两条原则→两套可验收契约，写进 PRD 的字段级模板

决策链贴墙三问（带进选型会）：① citation 是生成前穿透的、还是生成后贴的（耦合一）；② confidence 是否校准、能否驱动注意力路由（耦合二）；③ 有没有可审计的归责日志（耦合三）。这三问直接预测一个产品会不会系统性地制造过度信任。

路径丙 · 紧迫度 / 兴趣驱动（约 90–110 分钟）

适合谁：还没有具体任务，但想先看清”AI 作为知识中介到底特殊在哪、为什么不是更快的搜索引擎”。前置：无;有一点认识论或媒介理论背景会读得更快,但不是必须。产出：能讲清”从指引到代言”这次范式断裂——为什么搜索把知识”指给”你、生成把知识”替你说出来”是认识论上不可通约的格式塔切换，而不是检索精度的连续提升;以及默会知识为什么是 AI 中介最难逾越的原理性边界。

步	节点	时长	读它拿什么
1	G01 知识中介技术代际谱系总图	20 min	六代谱系（口传→文字→印刷→图书馆→搜索→AI），每代重新定义”何为知道”,且每代都是得失对冲、不是线性进步
2	G02 知识中介代际演化详解	25 min	逐代展开 + 年份接地。看清 AI 这代第一次开始”生产”看似知识、却无法追溯到任何证言者或可靠过程的内容
3	A02 知识 vs 知识的模拟	25 min	核心刀法。“模拟—接受”分析：LLM 仿真了知识的全部表层信号（流畅/命题形式/引用形式/自信度），独缺真值绑定;模拟越逼真，认识论风险越高
4	A05 默会知识与 AI 的认识论张力	25 min	边界。把默会专长当”可被 AI 替代的可显性化知识”是范畴错误;这条边界直接决定 HITL 触发条件画在哪

兴趣线一句话收束：AI 不是更快的搜索引擎，它是知识中介史上第一个把用户从”读取表征”（解释学关系）拽进”与之对话”（他者关系）、并第一个从”指引你去看原文”切换到”替你说出答案”的中介——核验路径随之坍缩，这才是它的认识论特殊性所在。

[!tip] 路径之外的两块拼图三条路径为了控制时长，各自略过了一些节点。读完任意一条后，建议补两块：A03 Verification vs Rubber-stamping（验证 vs 橡皮图章的认识论分界线——“无认识论摩擦的审阅本质就是橡皮图章”）与 A04 校准与信任的认识论（信任校准的目标不是最大化信任、而是让信任度追踪真实可靠率）。这两节是整张网的概念枢纽,几乎每条路径的判断都回指它们。架构层若想读全，再补 S03 认识论友好 AI 全景（认识论友好 ≠ 显示更多信息）;实例层补 E01 AI 研究助手的认识论剖解（引用 ≠ 验证）与 E03 教育与学习 AI 的认识论剖解（用户在学习还是获得”理解的表象”）。

二、自测题（12 题 · 每题给”及格线 / 优秀线 / 反例”）

自测的目的不是背诵，是检验你能不能用这套框架做判断。每题给三档标尺：及格线=抓住了核心区分;优秀线=能落到产品机制、带证据或边界;反例=一个看似对、实则栽进默认错误框架的典型错答(读到反例若心里”咦我刚才就想这么答”,说明那一节要重读)。

Q1 — 一个 AI 输出事实上完全正确,用户也据此做了对的决策。这算不算”用户获得了知识”？

及格线：不一定算;要看用户接受它的过程是否可靠,正确 ≠ 知识。
优秀线：援引 Gettier 结构——有辩护的真信念若”真”与”辩护”的连接是偶然的,就不是知识;LLM 下一 token 按概率采样,“为真”与”被生成”无真值导向连接,所以即便答对也是 Gettier 式的偶然真(见 A02 知识 vs 知识的模拟);风险在接受动作,这次没骗你的同一个动作下次会让你信下一个流畅的假命题。
反例：❌“答对了当然就是获得了知识,准确率到 95% 就接近给用户知识了”——这是栽进”准确率框架”,把碰巧为真当成知识。

Q2 — 产品想做 confidence display,工程师建议直接把模型的 softmax/logits 概率映射成红黄绿三色。对吗？

及格线：不对;模型自报置信度不可信。
优秀线：softmax 是 token 级局部确定性、不是命题级真值概率,二者系统性错位;且模型最不确定时最自信(RLHF 把这放大成谄媚式确定性,见 c13 - 幻觉的不可消除性)。置信度应来自外部可验证信号——检索命中数+来源一致性、是否触及训练分布边缘、self-consistency 采样方差(见 R03 Confidence 与 Citation 的认识论设计置信度来源白名单)。
反例：❌“用温度=0 让输出更确定就能解决”——降温只是消灭了 self-consistency 这个有用的不确定性信号,稳定的错误依然是错误。

Q3 — 公司给每份 AI 报告都配了”人在回路”,上线后准确率却没提升、错误照样流出。为什么？该怎么修？

及格线：制度上有人在回路 ≠ 认识论上发生了 verification;审阅退化成了橡皮图章。
优秀线：诊断为耦合二(L4 校准缺失 → L5 无信号可分辨该重点查哪 → 整体性地”信”)叠加自动化自满(Parasuraman & Manzey:系统越可靠、监视注意力越分散,专家新手都中招且培训无法根治)。修法不是”培训更认真”或”加强制停留时间”(针对的是时长,而真假审阅分野在信念来源过程),而是把 HITL 选择性触发绑在 L4 校准信号上 + R02 四道闸门逼出可靠过程(见 A03 Verification vs Rubber-stamping、R02 设计 Verification 而非 Rubber-stamp 的审阅流)。
反例：❌“加个’我已仔细阅读’勾选框 + 延长强制停留时间”——这些针对注意力时长,会被橡皮图章直接吃掉。

Q4 — citation 系统在认识论上到底为什么必需,而不是可选的”加分项”？

及格线：因为 AI 不是可被问责的证言者,信念辩护负担必须从”信任说话者”外移到”可追溯来源链”。
优秀线：Freiman 论证从 AI 获得的信念既非仪器性也非证言性,而是新的”技术性信念”——传统证言理论以说话者可被问责为前提,AI 恰恰缺这个前提;citation 是把不可问责的中介降级回仪器姿态的唯一手段(见 A06 认识论决定产品设计 §2)。这也是它升 _信息检索与知识系统系统化专题·总览（0427）的地方:0427 把 citation 当产品契约,本专题补”为什么这个契约在认识论上必需而非可选”。
反例：❌“citation 是为了显得严谨、增强可信度”——把可信度的给予当目标,正中 Fricker 认识论不公的圈套:一堆精美脚注会不当抬高接受度,而 citation 的价值是可核验性不是存在性。

Q5 — 区分 verification 与 rubber-stamping,靠的是”审阅者有没有认真看 / 看了多久”吗？

及格线：不是;靠的是信念的来源过程是否可靠,与时长无关。
优秀线：Goldman 过程可靠主义——信念正当性取决于产生它的过程。来源 A(自己复算/检索原始证据/识别逻辑断点 → 信念由独立可靠过程产生)是 verification;来源 B(信念直接从 AI 流畅自信的输出被动转移)是 rubber-stamping。一个人可以花两小时被动盖章,也可以三分钟做一次真抽检(见 A03 Verification vs Rubber-stamping)。推论:审阅 UI 的核心 KPI 不该是完成率/平均时长,而该是审阅者置信度与报告真实正确率的校准度。
反例：❌“看得越仔细、停留越久就越是 verification”——把认识论结构问题误诊成个人态度/注意力问题。

Q6 — 用三轴体检一段 AI 输出:它列了三条”据 XX 研究”、链接都点得开。它的认识论地位高吗？

及格线：不一定;“可溯源”有层次,链接可打开只是第一步。
优秀线：可溯源四层——无引用 / 有引用但打不开(citation theater)/ 可打开但内容不支持断言(引用幻觉,最隐蔽最危险)/ 可打开且确实支持(真溯源)。链接可点开只排除了第二层,必须打开并确认它支持断言才到真溯源;再叠加”可验证”(相对核验者,同一条 SQL 对分析师可验证、对运营不可验证)与”有保证”两轴(见 R01 评估一个 AI 输出的认识论地位)。
反例：❌“链接能打开就说明有依据、可以信”——卡在第三层”引用幻觉”上:RAG 检索回正确文档,生成仍可能把引文张冠李戴。

Q7 — “AI 已经能干高级分析师的活了,Q4 升级后就能转全自动审核。” 这句 roadmap 的认识论病在哪？

及格线：它预设了专家判断力可被完全显性化、压进模型权重,而默会知识否认这点。
优秀线：Polanyi”We can know more than we can tell”——不是暂时没说清,是结构上说不清;Ryle 的 knowing-how 不可还原为 knowing-that(否则无穷后退)。把默会专长当可替代是范畴错误;这类缺口是原理性的、不随规模消失,所以 HITL 触发条件必须画在”默会判断真正不可替代”处,roadmap 不能写”再喂三个月数据就转无人审”(见 A05 默会知识与 AI 的认识论张力)。
反例：❌“现在差一点是因为数据/上下文/模型不够大,补够就能全自动”——把原理性缺口误诊成可量化的工程缺口,正是这句 roadmap 的灾难性根源。

Q8 — 为什么说”AI 不是更快的搜索引擎”是一次范式断裂,而非检索精度的连续提升？

及格线：搜索把知识”指给”你(指引),生成”替你说出来”(代言),两者认识论性质不同。
优秀线：用 Kuhn 不可通约性 + Ihde 人技关系——搜索是解释学关系(你读取中介产生的表征、可点开来源自核验),AI 把你拽进他者关系(你在跟它对话);从”指引你去看原文”到”替你说出答案”,核验路径随之坍缩,是格式塔切换不是连续提升(见 G01 知识中介技术代际谱系总图、G02 知识中介代际演化详解)。
反例：❌“AI 就是检索更准更快的下一代,本质和搜索一样”——只看检索史(图书馆目录→PageRank→RAG)会系统性地漏掉从”指引”到”代言”的那次断裂。

Q9 — 学习类 AI 流畅地把一个难题讲得清清楚楚,学生说”我懂了”。这是好的学习产品吗？

及格线：未必;“读懂了 AI 的解释” ≠ “自己理解了概念”,流畅易制造”我懂了”的错觉。
优秀线：understanding 锚在 knowing-how 那一档,是学习者自己跑完过程的残留物,不是可搬运的对象;代答型 AI 消灭”合意困难”(desirable difficulties,Bjork),在作业分数与长期理解之间制造反向耦合——作业越漂亮、理解可能越空。三档用法(代答/解释/苏格拉底)差别在”认知摩擦保留了多少”(见 E03 教育与学习 AI 的认识论剖解)。
反例：❌“AI 是史上最强管道,秒答、个性化、不失耐心,所以学习一定更好”——栽进”信息可得性框架”,默认知识=可无损搬运的命题。

Q10 — Perplexity / deep research 给的带编号引用的综述,是知识吗？

及格线：引用的存在不等于验证的发生;它给的是”可信表象”,未必是认识论可信。
优秀线：引用在学术里承担可追溯性 + 辩护性两功能,AI 研究助手把二者解耦——保留了修辞外观(脚注/编号/链接触发”这是被核查过的”心理预期),却不保证辩护实质(断言由采样生成、引用事后装配,不是断言的理由)。这是 explainability theater/citation theater(见 E01 AI 研究助手的认识论剖解)。
反例：❌“都给出处了,而且引用大多真实存在,那就是有依据的知识”——“引用真实存在”仍可能”内容不支持断言”,且即便支持,信念之为真与辩护的连接仍可能是偶然的(Gettier)。

Q11 — “只要系统历史上一直很可靠,用户就应当信任它,纠结每层认识论地位是不必要的洁癖。” 这个反方立场怎么回应？

及格线：接受它在封闭、稳定、低后果场景成立;坚持它在开放域 LLM 上失效。
优秀线：这是计算可靠主义(Durán & Formanek 2019)——可靠性可替代透明性,只需四类可靠性依据。接受:人本来就合理地依赖不透明的可靠系统(没人审计自己的计算器)。边界:其四依据里的”历史成功记录”恰在分布漂移(distribution shift)下失效,而开放域 AI 报告正是分布不断漂移的场景;且 LLM 失败无征兆(最不可靠时最自信、校准是反的),用户无法分辨”历史可靠所以现在可信”和”历史可靠但现在已漂移”(见 S01 AI 认识论中介分层剖面 §4、A06 认识论决定产品设计 §5)。
反例：❌“对,可靠就够了,认识论辩论可以绕过”——忽略了”选哪些可靠性指标、阈值设在哪”本身就是一个认识论决定,CR 没取消认识论判断、只是把它藏进了指标选择里。

Q12 — 你被要求”用 AI 来验证另一个 AI 的输出,实现全自动质检”。从本专题看,这套设计的认识论风险是什么？

及格线：用 AI 验证 AI,会让三轴里的”有保证(warrant)“轴退化——验证过程本身不可靠。
优秀线：verification 的认识论功能是把”本不在断言游戏里的东西强行拉回断言游戏、给它补上一个会负责的人”(维特根斯坦语言游戏 + 言语行为承诺,见 S01 AI 认识论中介分层剖面 §5);两个都不可问责的”技术性信念”来源互相核对,补不上那个缺失的真诚条件与归责位置(L6 真空),只是把模拟叠加在模拟上。可作为降低成本的预筛,但不能替代”会负责的人”这一环——这正是本专题登记的 failure scenario 之一。
反例：❌“AI 互检能去掉人工瓶颈、还更客观”——把验证瓶颈当成可以用更多 AI 绕过的工程问题,而它是认识论结构问题。

[!note] 自测计分 12 题:及格 = 答对 ≥7 题的及格线(你已能用框架做基本判断);优秀 = ≥9 题达到优秀线(能落到产品机制、带证据或边界,可以上面试桌/选型会);任何一题答成了它的反例,回去重读对应节点——那说明你还在默认错误框架里。

三、反方对话训练(认识论领域 · 6 追问)

面试官、技术同事、老板会用这些话来打这个专题。下面每条给它的力量(为什么这么问会让你卡住)、别这么答(劣质回应)、这么答(接受+边界,带证据)。训练目标:不是把对手驳倒,是”接受它对的部分 + 标注本专题坚持的边界与赌注”——用反对的声音建造,而不是用赞同的声音装饰。

追问 1 — “这不就是’审阅瓶颈’换个说法吗?你这套认识论中介,跟 0418 审阅瓶颈到底差在哪?”

它的力量:本专题确实和 _审阅瓶颈系统化专题·总览大量重叠(都谈 rubber-stamping、Huemmer、HITL),一旦答不出区别,整个专题就显得是重复造轮子。
别这么答:❌“不一样,我这个更哲学。“(空洞,等于承认没有实质区别。)
这么答:接受——0418 和本专题确实共享 verification/rubber-stamping 这把刀,Huemmer 数据两边都用。边界——它们处在不同抽象层:0418 在产品机制层问”瓶颈在哪、怎么疏导审阅”;本专题在认识论哲学层问”疏导之后剩下的还是不是验证”。具体说:0418 假设”审阅是有意义的”并去优化它;本专题追问”审阅在什么认识论条件下才有意义”,给 verification vs rubber-stamping 一个 Goldman 式可判定标准(信念来源过程是否可靠)。0418 问机制,本专题给机制以认识论根(见总览 §4 升级对照表)。一句话:它是 0418 的地基,不是它的同义复述。

追问 2 — “认识论太玄了,我们是做产品的,这些哲学对我下周要交的 PRD 有什么用?”

它的力量:这是最常见的”反智识”防御,把哲学等同于不可落地,逼你证明 ROI。
别这么答:❌“哲学能提升你的思维深度。“(虚,正中对方下怀。)
这么答:接受——如果认识论停在术语层,那确实没用,空 invocation 是本专题自己明令禁止的。边界——本专题的每条哲学判断都编译成了可验收的产品契约:Goldman 过程可靠主义 → 审阅 UI 的 KPI 从”完成率”改成”置信度-真实正确率校准度”;Freiman 技术性信念 → citation 必须 claim-level 可落地、不可落地的引用降级展示;校准理论 → confidence 的来源白名单(禁用 logits/自报,只用检索一致性等外部信号)。R03 Confidence 与 Citation 的认识论设计给的就是能直接抄进 PRD 的字段级 schema 和验收指标。这不是”提升思维”,是”让你写得出’这个 confidence 系统达标的标准是哪个数字’“。说不清那个数字的团队,做的还是 UI 模仿。

追问 3 — “引用了就是有依据了吧?它都把来源列出来了,用户能自己点开核对,这不就够了?”

它的力量:这是产品圈对 citation 最普遍的直觉,听起来无懈可击——给了来源、给了核对能力,责任就尽到了。
别这么答:❌“用户其实不会去点。“(只是经验观察,没击中认识论要害,对方会说”那是用户的问题”。)
这么答:接受——可点开的来源确实保留了引用的可追溯性功能,比没有强。边界——引用在学术里承担两个功能,AI 把它们解耦了:可追溯性(保留)和辩护性(常缺失)。“作者写下断言是因为读过该来源、该来源支持它”——这个辩护实质在 AI 这里没有,断言由采样生成、引用事后装配。所以会出现三种坑:引用打不开(citation theater)、能打开但内容不支持断言(引用幻觉,最隐蔽)、Mata v. Avianca 案那种格式 100% 正确但判例 100% 虚构(律师因输出流畅专业而没核实,被法庭 Rule 11 制裁)。结论:“有引用” ≠ “引用可验证” ≠ “引用真的被验证了”,citation 的价值是可核验性不是存在性,产品该优化的是”用户真去点开核对”的转化率,不是脚注密度(见 E01 AI 研究助手的认识论剖解、A06 认识论决定产品设计 §2)。

追问 4 — “用户管它是真知识还是知识的模拟干嘛,好用就行。能解决他的问题不就是好产品?”

它的力量:这是实用主义/增长视角的强攻——把认识论区分说成无关用户的形而上学奢侈,而”好用”是产品的天条。
别这么答:❌“知识的模拟是危险的,我们要对用户负责。“(道德说教,空,对方会问”危险在哪、数据呢”。)
这么答:接受——在低后果、可即时验证、用户已是专家的场景(资深码农用 AI 补全),“好用就行”成立,强行做认识论体检反而是纯摩擦,这是本专题显式登记的 failure scenario。边界——“好用”和”认识论可靠”会脱钩,而且正是在最危险处脱钩:用户满意度可以和认识论失败同时为真,这恰是自动化自满最危险的地方——它感觉不像失败。模拟越逼真、用户越觉得好用,越容易把它当知识接受下来,而错误知识穿过六层链坍缩成”无人负责的事实”时,受害者是真实的(荷兰儿童福利算法案、Robodebt 案制度上都”有人在回路”、用户都觉得”系统好用”,认识论上监督已空转)。所以判据不是”好不好用”,是”这段输出错的时候、它好用的外观会不会让用户更信它”——这正是要按场景(后果高低、可逆性、核验成本)分级设防的理由(见 A02 知识 vs 知识的模拟、R01 评估一个 AI 输出的认识论地位)。

追问 5 — “你一直说审阅会退化成橡皮图章,那干脆别让人审了,反正人也是橡皮图章,全自动不是更省?”

它的力量:这是把本专题的悲观结论反过来用——既然人审无效,那 HITL 就是合规摆设,索性去掉。这会抽掉本专题的产品落点。
别这么答:❌“全自动太冒险了,出了事没人负责。“(只说了归责、没回应”人审本来也无效”这个真问题。)
这么答:接受——天真的 HITL(把人放进回路就指望他会审)确实常退化为橡皮图章,Huemmer/Bainbridge 都证明了;“有人在回路”本身不产生价值。边界——结论不是”去掉人”,是”重新设计人审赖以运转的过程”。橡皮图章不是人的属性、是结构的产物(自动化自满+验证瓶颈把审阅默认拉向退化),所以靠 R02 四道闸门逆着结构力造出真验证:强制溯源核对(断信任转移)、抽检+种子错误(断自满,捕获率就是审阅流可靠性的可监控数字)、异议成本设计、选择性触发(把人的稀缺注意力配到机器最不可靠处)。而且全自动会让 L6 归责真空(模型供应商说”只是工具”、产品方说”算法决定的”),错误知识有受害者、没责任人。互补性可靠论(Ferrario 2026)说得更准:要测的是”人+AI 复合过程”的可靠性,互补不是自动红利,得靠设计造出来(见 A03 Verification vs Rubber-stamping、R02 设计 Verification 而非 Rubber-stamp 的审阅流)。

追问 6 — “校准、置信度、可靠性指标——可靠就够了,为什么非要先想清认识论?数据会告诉我们答案,A/B 测试一跑不就知道了?”

它的力量:这是计算可靠主义 + 数据驱动文化的合流,最硬的一击——它暗示认识论辩论可以被指标和实验绕过。
别这么答:❌“A/B 测试测不出认识论。“(听起来像在为玄学辩护。)
这么答:接受——对成熟、分布稳定的任务,可靠性指标确实可以替代一部分”先想清认识论”的工作,黑箱不必先解释才可信(Durán & Formanek);如果一个团队纯靠转化率也”碰巧”做出了对的 confidence 设计,那说明他们隐含持有了某个认识论立场、只是没说出口。边界——三点:① CR 的”历史成功记录”依据恰在分布漂移下失效,而 AI 报告产品正是开放域漂移场景;② A/B 测试优化的常是转化率/满意度,而用户满意度可以和认识论失败同时为真——A/B 会把 explainability theater(可信外观提升了过度依赖)误判为成功;③ “用哪些指标、阈值设哪、A/B 的成功指标定义成什么”本身就是认识论决定,CR 和 A/B 都没取消认识论判断、只是把它藏进了指标选择里。所以收窄后的主张是:在开放域、高后果、分布漂移的 AI 报告产品里,认识论判断在因果上先于机制设计;在封闭、稳定、低后果场景,数据驱动路径可以是更经济的替代(见 A04 校准与信任的认识论、A06 认识论决定产品设计 §5、S01 AI 认识论中介分层剖面 §4)。

[!tip] 反方对话的元原则六条追问里没有一条是被”驳倒”的——每条都是”接受它对的部分、标注本专题坚持的边界与赌注”。这就是本专题(和 0411 标杆)的核心工艺:用反对的声音建造。如果你发现自己在某条上只会反驳、给不出”接受+边界”,那一节的对手框架你还没真正吃透,回 _AI 认识论中介系统化专题·总览 §6 跨域调度表与 §7 对手立场清单补课。

四、关联节点

专题内 17 节点(全真实 basename,按模块)

01 概念辨析：A01 AI 作为认识论中介概念谱系、A02 知识 vs 知识的模拟、A03 Verification vs Rubber-stamping、A04 校准与信任的认识论、A05 默会知识与 AI 的认识论张力、A06 认识论决定产品设计
02 代际演化：G01 知识中介技术代际谱系总图、G02 知识中介代际演化详解
03 架构剖面：S01 AI 认识论中介分层剖面、S02 认识论立场对照矩阵、S03 认识论友好 AI 全景
04 实例剖解：E01 AI 研究助手的认识论剖解、E02 AI 报告审阅的认识论剖解、E03 教育与学习 AI 的认识论剖解
05 复现指南：R01 评估一个 AI 输出的认识论地位、R02 设计 Verification 而非 Rubber-stamp 的审阅流、R03 Confidence 与 Citation 的认识论设计
06 阅读指南：_AI 认识论中介系统化专题·总览 + 本 README

升级对照的既有节点(真实存在,已核实)

c13 - 幻觉的不可消除性——模型架构层地基(为什么 AI 会编)
Polanyi 默会知识与提示工程的认识论张力——提示工程层(默会边界,注意是 Michael Polanyi,非 06人/ 的 Karl Polanyi)
0114认识论——哲学母库(JTB/Gettier/可靠主义/社会认识论/证言)
0601 维特根斯坦——语言游戏/言语行为承诺,L3 诊断工具
0117社会学——证言不正义/知识权力的社会学入口

跨专题链(已入库真实 basename)

_审阅瓶颈系统化专题·总览（0418,产品机制层)
_对齐哲学系统化专题·总览（0419,价值对齐侧)
_认知科学系统化专题·总览（0426,用户心智模型)
_信息检索与知识系统系统化专题·总览（0427,知识产品设计层)

技术底座与索引

RAG、Agent、幻觉、RLHF、AI PM 知识图谱·总索引

五、待建概念清单(本 README 引用但主库无确认节点 · 全部降级为普通文本 · 绝不在主库建 stub/概念卡/人物卡)

以下名称在本 README 的自测题与反方对话中被援引,均以普通文本承载,登记待 Rick 决定是否后续建库;凡需要链接哲学条目,一律走 0114认识论 / 0117社会学内既有概念条目(如社会认识论、可靠主义、盖梯尔问题),不建人物卡。本清单与总览 §8 待建清单合并去重后统一处理。

人物：Edmund Gettier、Alvin Goldman、Ori Freiman、Miranda Fricker、Michael Polanyi(区别于 06人/ Karl Polanyi)、Gilbert Ryle、Harry Collins、David Autor、Don Ihde、Lisanne Bainbridge、Raja Parasuraman & Dietrich Manzey、Lee & See、Andrea Ferrario、Alessandro Facchini、Juan Durán & Nico Formanek、Robert Bjork、Thomas Kuhn、Harold Innis、Marshall McLuhan、John Searle、J.L. Austin、C.A.J. Coady、Alvin Plantinga、Elizabeth Renieris。
概念：知识的模拟(simulation of knowledge)、认识论事故(epistemic accident)、技术性信念(technology-based beliefs)、计算可靠主义(computational reliabilism)、互补性可靠论、过程可靠主义(process reliabilism)、有保证的信念(warranted belief)、校准信任 / 适当依赖(calibrated trust / appropriate reliance)、自动化自满 / 自动化偏差(automation complacency / bias)、verification bottleneck(验证瓶颈)、explainability theater、citation theater、引用幻觉、合意困难(desirable difficulties)、流畅性错觉、范畴错误(category mistake,Ryle)、认识论不公(epistemic injustice,Fricker)、ECE / 校准曲线。
跨专题号写法（已入库核实）：本 README 内 0418/0427 等以括号注号、双链一律用真实 basename(_审阅瓶颈系统化专题·总览 等);0418/0419/0426/0427 四专题 2026-06-11 P3.4 校链已核实迁入 final_path,按 basename 正常解析,链接有效。

修订日志

R1（2026-06-07）：首稿(终轮综合产出)。三条阅读路径(求职速通 70–90min / 决策链 110–140min / 紧迫度 90–110min),各标时长+前置+可观测产出,并给路径专属的”贴墙口径”;12 题自测(每题及格线/优秀线/反例三档,覆盖六模块);反方对话训练 6 追问(审阅瓶颈换说法 / 认识论太玄 / 引用就是有依据 / 知识还是模拟好用就行 / 干脆别让人审 / 数据会告诉答案),每条按”接受+边界”工艺给劣质回应对照 + 带证据的标准回应;关联节点全用真实 basename(专题内 17 节点 + c13/Polanyi/0114/0601/0117 + 0418/0419/0426/0427 staging basename + 技术底座);待建概念清单全部降级为普通文本、与总览 §8 合并去重,未在主库建任何 stub。双链名遵守总览 §8 canonical 列表(专题内用真实标题,如总览写作 _AI 认识论中介系统化专题·总览,规避 staging 节点内残留的「A01 知识与知识的模拟」一类错误双链——此处刻意写作普通文本、不加双链括号,以免在 README 里新造一条死链)。
2026-06-11 P3.4 校链:核实本 README 全部双链有效(零裸死链);0418/0419/0426/0427 已迁入 final_path,跨专题链区标题与「写法待办」由「staging」更新为「已入库真实 basename」。