README·0431·多视图阅读指南
README · 多视图阅读指南
这张网不是用来从头读到尾的。它是一个认识论立方体——横向(A 是什么)、纵向(G 从哪来)、解剖(S 由什么组成)、病理(E 现实怎么走样)、操作(R 自己怎么动手),靠双链织成。本 README 是它的反向编织器:给你三条按身份裁好的路径、一套自测题、一组反方对话训练,让你不论从哪个入口进来,都能在最短时间里拿到这个专题承诺的产出——在面试桌、选型会、复现台上,30 秒说清”为什么我不会让团队直接信这份 AI 报告,以及我会在哪一层、用什么机制设防”。
本专题的一句话立场先放在这里,读任何路径前都先记住它:真正杀死知识质量的,不是模型答错,而是用户(包括专业审阅者)在一个误判了中介性质的姿态下,把流畅的模拟当成了有保证的知识接收下来。 整套立方体都是这句话的展开。
总览(MOC)见 _AI 认识论中介系统化专题·总览;本 README 是它的操作化伴侣——总览回答”这张网是什么”,README 回答”我这种人该怎么读、读完怎么自检”。
一、三条阅读路径(各标时长 · 前置 · 产出)
三条路径不是难度递进,是身份适配:你是在备面试、在岗做决策、还是想先看清”AI 到底特殊在哪”,决定了你该走哪条。每条都给了预计时长、前置(读它之前最好已有的底子)、读完的可观测产出。三条路径有交集节点(A06/S01/E02 是枢纽),重复读它们是值得的。
路径甲 · 求职速通(约 70–90 分钟)
适合谁:备战 AI PM 面试,要的是 30 秒高区分度答案,不是完整哲学训练。 前置:知道什么是 RAG、confidence display、human-in-the-loop 三个词的字面意思即可;不需要认识论背景。 产出:能在白板前 30 秒讲清”认识论判断→三套机制”的承重逻辑,并对”你怎么设计 AI 报告产品的可信度”给出一个让面试官从”会用组件”重新评估为”懂系统”的答案。
| 步 | 节点 | 时长 | 读它拿什么 |
|---|---|---|---|
| 1 | A06 认识论决定产品设计 | 25 min | 承重墙。confidence ← 校准、citation ← 证言/仪器地位、HITL ← verification vs rubber-stamping,三套机制各对应一条认识论判断 |
| 2 | S02 认识论立场对照矩阵 | 15 min | 四立场(工具/证言者/生成器/合作者)× 三后果(信任/验证/归责)矩阵,逼你显式选一种立场并承担全部后果 |
| 3 | E02 AI 报告审阅的认识论剖解 | 20 min | 现成反例库。“绝大多数 AI 报告审阅在认识论上是橡皮图章,且不是审阅者偷懒、是场景结构在逼出橡皮图章”——面试讲故事的弹药 |
| 4 | R03 Confidence 与 Citation 的认识论设计 | 15 min | 可验收契约。被追问”具体怎么落地”时,给出”禁止自报置信度 / claim-level / 低置信改变交互模式”的字段级答案 |
速通版 30 秒口径(背下来):可信度不是某一层的功能,是一条从来源层穿透到归责层的链;我会先定位 AI 在这个场景的认识论地位——它是不可问责的”技术性信念”来源,所以 citation 是把它降级回仪器姿态的必需契约;confidence 必须来自外部信号而非模型自报(自报系统性失真);HITL 必须选择性触发,因为 verification 才是瓶颈、不是生成。
路径乙 · 决策链(约 110–140 分钟)
适合谁:在岗 PM,手上有真实的选型 / 评审 / 设计任务,要把判断主轴打印贴墙。 前置:走过路径甲,或至少读过 A06 认识论决定产品设计;最好同时手边有一个真实的 AI 输出 / 一份供应商资料,边读边对着跑。 产出:拿到三件可立即用的工具——选型时的三问清单、一段输出的三轴体检表、一套能逼出真验证的审阅流闸门;能在评审会上指着六层剖面说”故障在第几层”。
| 步 | 节点 | 时长 | 读它拿什么 |
|---|---|---|---|
| 1 | A01 AI 作为认识论中介概念谱系 | 20 min | 先定性:AI 在用户与知识间占了”工具/证言者/生成器”哪个位置——位置而非智能决定认识责任如何分配 |
| 2 | S01 AI 认识论中介分层剖面 | 30 min | 旗舰。六层剖面(来源→检索→生成→校准→验证→归责)+ 三个层间致命耦合,把”AI 是中介”落成一张能贴评审会墙上的故障定位表 |
| 3 | R01 评估一个 AI 输出的认识论地位 | 25 min | 三轴体检(可溯源 / 可验证 / 有保证),把”我信不信”拆成可操作判定;关键洞察:同一段输出的认识论地位随场景、随你的核验能力、随决策可逆性而变 |
| 4 | R02 设计 Verification 而非 Rubber-stamp 的审阅流 | 25 min | 四道机制闸门(强制溯源核对 / 抽检+种子错误 / 异议成本 / 触发设计),把”人在回路”从组织结构问题改写成过程可靠性问题 |
| 5 | R03 Confidence 与 Citation 的认识论设计 | 20 min | 两条原则→两套可验收契约,写进 PRD 的字段级模板 |
决策链贴墙三问(带进选型会):① citation 是生成前穿透的、还是生成后贴的(耦合一);② confidence 是否校准、能否驱动注意力路由(耦合二);③ 有没有可审计的归责日志(耦合三)。这三问直接预测一个产品会不会系统性地制造过度信任。
路径丙 · 紧迫度 / 兴趣驱动(约 90–110 分钟)
适合谁:还没有具体任务,但想先看清”AI 作为知识中介到底特殊在哪、为什么不是更快的搜索引擎”。 前置:无;有一点认识论或媒介理论背景会读得更快,但不是必须。 产出:能讲清”从指引到代言”这次范式断裂——为什么搜索把知识”指给”你、生成把知识”替你说出来”是认识论上不可通约的格式塔切换,而不是检索精度的连续提升;以及默会知识为什么是 AI 中介最难逾越的原理性边界。
| 步 | 节点 | 时长 | 读它拿什么 |
|---|---|---|---|
| 1 | G01 知识中介技术代际谱系总图 | 20 min | 六代谱系(口传→文字→印刷→图书馆→搜索→AI),每代重新定义”何为知道”,且每代都是得失对冲、不是线性进步 |
| 2 | G02 知识中介代际演化详解 | 25 min | 逐代展开 + 年份接地。看清 AI 这代第一次开始”生产”看似知识、却无法追溯到任何证言者或可靠过程的内容 |
| 3 | A02 知识 vs 知识的模拟 | 25 min | 核心刀法。“模拟—接受”分析:LLM 仿真了知识的全部表层信号(流畅/命题形式/引用形式/自信度),独缺真值绑定;模拟越逼真,认识论风险越高 |
| 4 | A05 默会知识与 AI 的认识论张力 | 25 min | 边界。把默会专长当”可被 AI 替代的可显性化知识”是范畴错误;这条边界直接决定 HITL 触发条件画在哪 |
兴趣线一句话收束:AI 不是更快的搜索引擎,它是知识中介史上第一个把用户从”读取表征”(解释学关系)拽进”与之对话”(他者关系)、并第一个从”指引你去看原文”切换到”替你说出答案”的中介——核验路径随之坍缩,这才是它的认识论特殊性所在。
[!tip] 路径之外的两块拼图 三条路径为了控制时长,各自略过了一些节点。读完任意一条后,建议补两块:A03 Verification vs Rubber-stamping(验证 vs 橡皮图章的认识论分界线——“无认识论摩擦的审阅本质就是橡皮图章”)与 A04 校准与信任的认识论(信任校准的目标不是最大化信任、而是让信任度追踪真实可靠率)。这两节是整张网的概念枢纽,几乎每条路径的判断都回指它们。架构层若想读全,再补 S03 认识论友好 AI 全景(认识论友好 ≠ 显示更多信息);实例层补 E01 AI 研究助手的认识论剖解(引用 ≠ 验证)与 E03 教育与学习 AI 的认识论剖解(用户在学习还是获得”理解的表象”)。
二、自测题(12 题 · 每题给”及格线 / 优秀线 / 反例”)
自测的目的不是背诵,是检验你能不能用这套框架做判断。每题给三档标尺:及格线=抓住了核心区分;优秀线=能落到产品机制、带证据或边界;反例=一个看似对、实则栽进默认错误框架的典型错答(读到反例若心里”咦我刚才就想这么答”,说明那一节要重读)。
Q1 — 一个 AI 输出事实上完全正确,用户也据此做了对的决策。这算不算”用户获得了知识”?
- 及格线:不一定算;要看用户接受它的过程是否可靠,正确 ≠ 知识。
- 优秀线:援引 Gettier 结构——有辩护的真信念若”真”与”辩护”的连接是偶然的,就不是知识;LLM 下一 token 按概率采样,“为真”与”被生成”无真值导向连接,所以即便答对也是 Gettier 式的偶然真(见 A02 知识 vs 知识的模拟);风险在接受动作,这次没骗你的同一个动作下次会让你信下一个流畅的假命题。
- 反例:❌“答对了当然就是获得了知识,准确率到 95% 就接近给用户知识了”——这是栽进”准确率框架”,把碰巧为真当成知识。
Q2 — 产品想做 confidence display,工程师建议直接把模型的 softmax/logits 概率映射成红黄绿三色。对吗?
- 及格线:不对;模型自报置信度不可信。
- 优秀线:softmax 是 token 级局部确定性、不是命题级真值概率,二者系统性错位;且模型最不确定时最自信(RLHF 把这放大成谄媚式确定性,见 c13 - 幻觉的不可消除性)。置信度应来自外部可验证信号——检索命中数+来源一致性、是否触及训练分布边缘、self-consistency 采样方差(见 R03 Confidence 与 Citation 的认识论设计 置信度来源白名单)。
- 反例:❌“用温度=0 让输出更确定就能解决”——降温只是消灭了 self-consistency 这个有用的不确定性信号,稳定的错误依然是错误。
Q3 — 公司给每份 AI 报告都配了”人在回路”,上线后准确率却没提升、错误照样流出。为什么?该怎么修?
- 及格线:制度上有人在回路 ≠ 认识论上发生了 verification;审阅退化成了橡皮图章。
- 优秀线:诊断为耦合二(L4 校准缺失 → L5 无信号可分辨该重点查哪 → 整体性地”信”)叠加自动化自满(Parasuraman & Manzey:系统越可靠、监视注意力越分散,专家新手都中招且培训无法根治)。修法不是”培训更认真”或”加强制停留时间”(针对的是时长,而真假审阅分野在信念来源过程),而是把 HITL 选择性触发绑在 L4 校准信号上 + R02 四道闸门逼出可靠过程(见 A03 Verification vs Rubber-stamping、R02 设计 Verification 而非 Rubber-stamp 的审阅流)。
- 反例:❌“加个’我已仔细阅读’勾选框 + 延长强制停留时间”——这些针对注意力时长,会被橡皮图章直接吃掉。
Q4 — citation 系统在认识论上到底为什么必需,而不是可选的”加分项”?
- 及格线:因为 AI 不是可被问责的证言者,信念辩护负担必须从”信任说话者”外移到”可追溯来源链”。
- 优秀线:Freiman 论证从 AI 获得的信念既非仪器性也非证言性,而是新的”技术性信念”——传统证言理论以说话者可被问责为前提,AI 恰恰缺这个前提;citation 是把不可问责的中介降级回仪器姿态的唯一手段(见 A06 认识论决定产品设计 §2)。这也是它升 _信息检索与知识系统系统化专题·总览(0427)的地方:0427 把 citation 当产品契约,本专题补”为什么这个契约在认识论上必需而非可选”。
- 反例:❌“citation 是为了显得严谨、增强可信度”——把可信度的给予当目标,正中 Fricker 认识论不公的圈套:一堆精美脚注会不当抬高接受度,而 citation 的价值是可核验性不是存在性。
Q5 — 区分 verification 与 rubber-stamping,靠的是”审阅者有没有认真看 / 看了多久”吗?
- 及格线:不是;靠的是信念的来源过程是否可靠,与时长无关。
- 优秀线:Goldman 过程可靠主义——信念正当性取决于产生它的过程。来源 A(自己复算/检索原始证据/识别逻辑断点 → 信念由独立可靠过程产生)是 verification;来源 B(信念直接从 AI 流畅自信的输出被动转移)是 rubber-stamping。一个人可以花两小时被动盖章,也可以三分钟做一次真抽检(见 A03 Verification vs Rubber-stamping)。推论:审阅 UI 的核心 KPI 不该是完成率/平均时长,而该是审阅者置信度与报告真实正确率的校准度。
- 反例:❌“看得越仔细、停留越久就越是 verification”——把认识论结构问题误诊成个人态度/注意力问题。
Q6 — 用三轴体检一段 AI 输出:它列了三条”据 XX 研究”、链接都点得开。它的认识论地位高吗?
- 及格线:不一定;“可溯源”有层次,链接可打开只是第一步。
- 优秀线:可溯源四层——无引用 / 有引用但打不开(citation theater)/ 可打开但内容不支持断言(引用幻觉,最隐蔽最危险)/ 可打开且确实支持(真溯源)。链接可点开只排除了第二层,必须打开并确认它支持断言才到真溯源;再叠加”可验证”(相对核验者,同一条 SQL 对分析师可验证、对运营不可验证)与”有保证”两轴(见 R01 评估一个 AI 输出的认识论地位)。
- 反例:❌“链接能打开就说明有依据、可以信”——卡在第三层”引用幻觉”上:RAG 检索回正确文档,生成仍可能把引文张冠李戴。
Q7 — “AI 已经能干高级分析师的活了,Q4 升级后就能转全自动审核。” 这句 roadmap 的认识论病在哪?
- 及格线:它预设了专家判断力可被完全显性化、压进模型权重,而默会知识否认这点。
- 优秀线:Polanyi”We can know more than we can tell”——不是暂时没说清,是结构上说不清;Ryle 的 knowing-how 不可还原为 knowing-that(否则无穷后退)。把默会专长当可替代是范畴错误;这类缺口是原理性的、不随规模消失,所以 HITL 触发条件必须画在”默会判断真正不可替代”处,roadmap 不能写”再喂三个月数据就转无人审”(见 A05 默会知识与 AI 的认识论张力)。
- 反例:❌“现在差一点是因为数据/上下文/模型不够大,补够就能全自动”——把原理性缺口误诊成可量化的工程缺口,正是这句 roadmap 的灾难性根源。
Q8 — 为什么说”AI 不是更快的搜索引擎”是一次范式断裂,而非检索精度的连续提升?
- 及格线:搜索把知识”指给”你(指引),生成”替你说出来”(代言),两者认识论性质不同。
- 优秀线:用 Kuhn 不可通约性 + Ihde 人技关系——搜索是解释学关系(你读取中介产生的表征、可点开来源自核验),AI 把你拽进他者关系(你在跟它对话);从”指引你去看原文”到”替你说出答案”,核验路径随之坍缩,是格式塔切换不是连续提升(见 G01 知识中介技术代际谱系总图、G02 知识中介代际演化详解)。
- 反例:❌“AI 就是检索更准更快的下一代,本质和搜索一样”——只看检索史(图书馆目录→PageRank→RAG)会系统性地漏掉从”指引”到”代言”的那次断裂。
Q9 — 学习类 AI 流畅地把一个难题讲得清清楚楚,学生说”我懂了”。这是好的学习产品吗?
- 及格线:未必;“读懂了 AI 的解释” ≠ “自己理解了概念”,流畅易制造”我懂了”的错觉。
- 优秀线:understanding 锚在 knowing-how 那一档,是学习者自己跑完过程的残留物,不是可搬运的对象;代答型 AI 消灭”合意困难”(desirable difficulties,Bjork),在作业分数与长期理解之间制造反向耦合——作业越漂亮、理解可能越空。三档用法(代答/解释/苏格拉底)差别在”认知摩擦保留了多少”(见 E03 教育与学习 AI 的认识论剖解)。
- 反例:❌“AI 是史上最强管道,秒答、个性化、不失耐心,所以学习一定更好”——栽进”信息可得性框架”,默认知识=可无损搬运的命题。
Q10 — Perplexity / deep research 给的带编号引用的综述,是知识吗?
- 及格线:引用的存在不等于验证的发生;它给的是”可信表象”,未必是认识论可信。
- 优秀线:引用在学术里承担可追溯性 + 辩护性两功能,AI 研究助手把二者解耦——保留了修辞外观(脚注/编号/链接触发”这是被核查过的”心理预期),却不保证辩护实质(断言由采样生成、引用事后装配,不是断言的理由)。这是 explainability theater/citation theater(见 E01 AI 研究助手的认识论剖解)。
- 反例:❌“都给出处了,而且引用大多真实存在,那就是有依据的知识”——“引用真实存在”仍可能”内容不支持断言”,且即便支持,信念之为真与辩护的连接仍可能是偶然的(Gettier)。
Q11 — “只要系统历史上一直很可靠,用户就应当信任它,纠结每层认识论地位是不必要的洁癖。” 这个反方立场怎么回应?
- 及格线:接受它在封闭、稳定、低后果场景成立;坚持它在开放域 LLM 上失效。
- 优秀线:这是计算可靠主义(Durán & Formanek 2019)——可靠性可替代透明性,只需四类可靠性依据。接受:人本来就合理地依赖不透明的可靠系统(没人审计自己的计算器)。边界:其四依据里的”历史成功记录”恰在分布漂移(distribution shift)下失效,而开放域 AI 报告正是分布不断漂移的场景;且 LLM 失败无征兆(最不可靠时最自信、校准是反的),用户无法分辨”历史可靠所以现在可信”和”历史可靠但现在已漂移”(见 S01 AI 认识论中介分层剖面 §4、A06 认识论决定产品设计 §5)。
- 反例:❌“对,可靠就够了,认识论辩论可以绕过”——忽略了”选哪些可靠性指标、阈值设在哪”本身就是一个认识论决定,CR 没取消认识论判断、只是把它藏进了指标选择里。
Q12 — 你被要求”用 AI 来验证另一个 AI 的输出,实现全自动质检”。从本专题看,这套设计的认识论风险是什么?
- 及格线:用 AI 验证 AI,会让三轴里的”有保证(warrant)“轴退化——验证过程本身不可靠。
- 优秀线:verification 的认识论功能是把”本不在断言游戏里的东西强行拉回断言游戏、给它补上一个会负责的人”(维特根斯坦语言游戏 + 言语行为承诺,见 S01 AI 认识论中介分层剖面 §5);两个都不可问责的”技术性信念”来源互相核对,补不上那个缺失的真诚条件与归责位置(L6 真空),只是把模拟叠加在模拟上。可作为降低成本的预筛,但不能替代”会负责的人”这一环——这正是本专题登记的 failure scenario 之一。
- 反例:❌“AI 互检能去掉人工瓶颈、还更客观”——把验证瓶颈当成可以用更多 AI 绕过的工程问题,而它是认识论结构问题。
[!note] 自测计分 12 题:及格 = 答对 ≥7 题的及格线(你已能用框架做基本判断);优秀 = ≥9 题达到优秀线(能落到产品机制、带证据或边界,可以上面试桌/选型会);任何一题答成了它的反例,回去重读对应节点——那说明你还在默认错误框架里。
三、反方对话训练(认识论领域 · 6 追问)
面试官、技术同事、老板会用这些话来打这个专题。下面每条给它的力量(为什么这么问会让你卡住)、别这么答(劣质回应)、这么答(接受+边界,带证据)。训练目标:不是把对手驳倒,是”接受它对的部分 + 标注本专题坚持的边界与赌注”——用反对的声音建造,而不是用赞同的声音装饰。
追问 1 — “这不就是’审阅瓶颈’换个说法吗?你这套认识论中介,跟 0418 审阅瓶颈到底差在哪?”
- 它的力量:本专题确实和 _审阅瓶颈系统化专题·总览 大量重叠(都谈 rubber-stamping、Huemmer、HITL),一旦答不出区别,整个专题就显得是重复造轮子。
- 别这么答:❌“不一样,我这个更哲学。“(空洞,等于承认没有实质区别。)
- 这么答:接受——0418 和本专题确实共享 verification/rubber-stamping 这把刀,Huemmer 数据两边都用。边界——它们处在不同抽象层:0418 在产品机制层问”瓶颈在哪、怎么疏导审阅”;本专题在认识论哲学层问”疏导之后剩下的还是不是验证”。具体说:0418 假设”审阅是有意义的”并去优化它;本专题追问”审阅在什么认识论条件下才有意义”,给 verification vs rubber-stamping 一个 Goldman 式可判定标准(信念来源过程是否可靠)。0418 问机制,本专题给机制以认识论根(见总览 §4 升级对照表)。一句话:它是 0418 的地基,不是它的同义复述。
追问 2 — “认识论太玄了,我们是做产品的,这些哲学对我下周要交的 PRD 有什么用?”
- 它的力量:这是最常见的”反智识”防御,把哲学等同于不可落地,逼你证明 ROI。
- 别这么答:❌“哲学能提升你的思维深度。“(虚,正中对方下怀。)
- 这么答:接受——如果认识论停在术语层,那确实没用,空 invocation 是本专题自己明令禁止的。边界——本专题的每条哲学判断都编译成了可验收的产品契约:Goldman 过程可靠主义 → 审阅 UI 的 KPI 从”完成率”改成”置信度-真实正确率校准度”;Freiman 技术性信念 → citation 必须 claim-level 可落地、不可落地的引用降级展示;校准理论 → confidence 的来源白名单(禁用 logits/自报,只用检索一致性等外部信号)。R03 Confidence 与 Citation 的认识论设计 给的就是能直接抄进 PRD 的字段级 schema 和验收指标。这不是”提升思维”,是”让你写得出’这个 confidence 系统达标的标准是哪个数字’“。说不清那个数字的团队,做的还是 UI 模仿。
追问 3 — “引用了就是有依据了吧?它都把来源列出来了,用户能自己点开核对,这不就够了?”
- 它的力量:这是产品圈对 citation 最普遍的直觉,听起来无懈可击——给了来源、给了核对能力,责任就尽到了。
- 别这么答:❌“用户其实不会去点。“(只是经验观察,没击中认识论要害,对方会说”那是用户的问题”。)
- 这么答:接受——可点开的来源确实保留了引用的可追溯性功能,比没有强。边界——引用在学术里承担两个功能,AI 把它们解耦了:可追溯性(保留)和辩护性(常缺失)。“作者写下断言是因为读过该来源、该来源支持它”——这个辩护实质在 AI 这里没有,断言由采样生成、引用事后装配。所以会出现三种坑:引用打不开(citation theater)、能打开但内容不支持断言(引用幻觉,最隐蔽)、Mata v. Avianca 案那种格式 100% 正确但判例 100% 虚构(律师因输出流畅专业而没核实,被法庭 Rule 11 制裁)。结论:“有引用” ≠ “引用可验证” ≠ “引用真的被验证了”,citation 的价值是可核验性不是存在性,产品该优化的是”用户真去点开核对”的转化率,不是脚注密度(见 E01 AI 研究助手的认识论剖解、A06 认识论决定产品设计 §2)。
追问 4 — “用户管它是真知识还是知识的模拟干嘛,好用就行。能解决他的问题不就是好产品?”
- 它的力量:这是实用主义/增长视角的强攻——把认识论区分说成无关用户的形而上学奢侈,而”好用”是产品的天条。
- 别这么答:❌“知识的模拟是危险的,我们要对用户负责。“(道德说教,空,对方会问”危险在哪、数据呢”。)
- 这么答:接受——在低后果、可即时验证、用户已是专家的场景(资深码农用 AI 补全),“好用就行”成立,强行做认识论体检反而是纯摩擦,这是本专题显式登记的 failure scenario。边界——“好用”和”认识论可靠”会脱钩,而且正是在最危险处脱钩:用户满意度可以和认识论失败同时为真,这恰是自动化自满最危险的地方——它感觉不像失败。模拟越逼真、用户越觉得好用,越容易把它当知识接受下来,而错误知识穿过六层链坍缩成”无人负责的事实”时,受害者是真实的(荷兰儿童福利算法案、Robodebt 案制度上都”有人在回路”、用户都觉得”系统好用”,认识论上监督已空转)。所以判据不是”好不好用”,是”这段输出错的时候、它好用的外观会不会让用户更信它”——这正是要按场景(后果高低、可逆性、核验成本)分级设防的理由(见 A02 知识 vs 知识的模拟、R01 评估一个 AI 输出的认识论地位)。
追问 5 — “你一直说审阅会退化成橡皮图章,那干脆别让人审了,反正人也是橡皮图章,全自动不是更省?”
- 它的力量:这是把本专题的悲观结论反过来用——既然人审无效,那 HITL 就是合规摆设,索性去掉。这会抽掉本专题的产品落点。
- 别这么答:❌“全自动太冒险了,出了事没人负责。“(只说了归责、没回应”人审本来也无效”这个真问题。)
- 这么答:接受——天真的 HITL(把人放进回路就指望他会审)确实常退化为橡皮图章,Huemmer/Bainbridge 都证明了;“有人在回路”本身不产生价值。边界——结论不是”去掉人”,是”重新设计人审赖以运转的过程”。橡皮图章不是人的属性、是结构的产物(自动化自满+验证瓶颈把审阅默认拉向退化),所以靠 R02 四道闸门逆着结构力造出真验证:强制溯源核对(断信任转移)、抽检+种子错误(断自满,捕获率就是审阅流可靠性的可监控数字)、异议成本设计、选择性触发(把人的稀缺注意力配到机器最不可靠处)。而且全自动会让 L6 归责真空(模型供应商说”只是工具”、产品方说”算法决定的”),错误知识有受害者、没责任人。互补性可靠论(Ferrario 2026)说得更准:要测的是”人+AI 复合过程”的可靠性,互补不是自动红利,得靠设计造出来(见 A03 Verification vs Rubber-stamping、R02 设计 Verification 而非 Rubber-stamp 的审阅流)。
追问 6 — “校准、置信度、可靠性指标——可靠就够了,为什么非要先想清认识论?数据会告诉我们答案,A/B 测试一跑不就知道了?”
- 它的力量:这是计算可靠主义 + 数据驱动文化的合流,最硬的一击——它暗示认识论辩论可以被指标和实验绕过。
- 别这么答:❌“A/B 测试测不出认识论。“(听起来像在为玄学辩护。)
- 这么答:接受——对成熟、分布稳定的任务,可靠性指标确实可以替代一部分”先想清认识论”的工作,黑箱不必先解释才可信(Durán & Formanek);如果一个团队纯靠转化率也”碰巧”做出了对的 confidence 设计,那说明他们隐含持有了某个认识论立场、只是没说出口。边界——三点:① CR 的”历史成功记录”依据恰在分布漂移下失效,而 AI 报告产品正是开放域漂移场景;② A/B 测试优化的常是转化率/满意度,而用户满意度可以和认识论失败同时为真——A/B 会把 explainability theater(可信外观提升了过度依赖)误判为成功;③ “用哪些指标、阈值设哪、A/B 的成功指标定义成什么”本身就是认识论决定,CR 和 A/B 都没取消认识论判断、只是把它藏进了指标选择里。所以收窄后的主张是:在开放域、高后果、分布漂移的 AI 报告产品里,认识论判断在因果上先于机制设计;在封闭、稳定、低后果场景,数据驱动路径可以是更经济的替代(见 A04 校准与信任的认识论、A06 认识论决定产品设计 §5、S01 AI 认识论中介分层剖面 §4)。
[!tip] 反方对话的元原则 六条追问里没有一条是被”驳倒”的——每条都是”接受它对的部分、标注本专题坚持的边界与赌注”。这就是本专题(和 0411 标杆)的核心工艺:用反对的声音建造。如果你发现自己在某条上只会反驳、给不出”接受+边界”,那一节的对手框架你还没真正吃透,回 _AI 认识论中介系统化专题·总览 §6 跨域调度表与 §7 对手立场清单补课。
四、关联节点
专题内 17 节点(全真实 basename,按模块)
- 01 概念辨析:A01 AI 作为认识论中介概念谱系、A02 知识 vs 知识的模拟、A03 Verification vs Rubber-stamping、A04 校准与信任的认识论、A05 默会知识与 AI 的认识论张力、A06 认识论决定产品设计
- 02 代际演化:G01 知识中介技术代际谱系总图、G02 知识中介代际演化详解
- 03 架构剖面:S01 AI 认识论中介分层剖面、S02 认识论立场对照矩阵、S03 认识论友好 AI 全景
- 04 实例剖解:E01 AI 研究助手的认识论剖解、E02 AI 报告审阅的认识论剖解、E03 教育与学习 AI 的认识论剖解
- 05 复现指南:R01 评估一个 AI 输出的认识论地位、R02 设计 Verification 而非 Rubber-stamp 的审阅流、R03 Confidence 与 Citation 的认识论设计
- 06 阅读指南:_AI 认识论中介系统化专题·总览 + 本 README
升级对照的既有节点(真实存在,已核实)
- c13 - 幻觉的不可消除性——模型架构层地基(为什么 AI 会编)
- Polanyi 默会知识与提示工程的认识论张力——提示工程层(默会边界,注意是 Michael Polanyi,非 06人/ 的 Karl Polanyi)
- 0114认识论——哲学母库(JTB/Gettier/可靠主义/社会认识论/证言)
- 0601 维特根斯坦——语言游戏/言语行为承诺,L3 诊断工具
- 0117社会学——证言不正义/知识权力的社会学入口
跨专题链(已入库真实 basename)
- _审阅瓶颈系统化专题·总览(0418,产品机制层)
- _对齐哲学系统化专题·总览(0419,价值对齐侧)
- _认知科学系统化专题·总览(0426,用户心智模型)
- _信息检索与知识系统系统化专题·总览(0427,知识产品设计层)
技术底座与索引
五、待建概念清单(本 README 引用但主库无确认节点 · 全部降级为普通文本 · 绝不在主库建 stub/概念卡/人物卡)
以下名称在本 README 的自测题与反方对话中被援引,均以普通文本承载,登记待 Rick 决定是否后续建库;凡需要链接哲学条目,一律走 0114认识论 / 0117社会学 内既有概念条目(如社会认识论、可靠主义、盖梯尔问题),不建人物卡。本清单与总览 §8 待建清单合并去重后统一处理。
- 人物:Edmund Gettier、Alvin Goldman、Ori Freiman、Miranda Fricker、Michael Polanyi(区别于 06人/ Karl Polanyi)、Gilbert Ryle、Harry Collins、David Autor、Don Ihde、Lisanne Bainbridge、Raja Parasuraman & Dietrich Manzey、Lee & See、Andrea Ferrario、Alessandro Facchini、Juan Durán & Nico Formanek、Robert Bjork、Thomas Kuhn、Harold Innis、Marshall McLuhan、John Searle、J.L. Austin、C.A.J. Coady、Alvin Plantinga、Elizabeth Renieris。
- 概念:知识的模拟(simulation of knowledge)、认识论事故(epistemic accident)、技术性信念(technology-based beliefs)、计算可靠主义(computational reliabilism)、互补性可靠论、过程可靠主义(process reliabilism)、有保证的信念(warranted belief)、校准信任 / 适当依赖(calibrated trust / appropriate reliance)、自动化自满 / 自动化偏差(automation complacency / bias)、verification bottleneck(验证瓶颈)、explainability theater、citation theater、引用幻觉、合意困难(desirable difficulties)、流畅性错觉、范畴错误(category mistake,Ryle)、认识论不公(epistemic injustice,Fricker)、ECE / 校准曲线。
- 跨专题号写法(已入库核实):本 README 内 0418/0427 等以括号注号、双链一律用真实 basename(
_审阅瓶颈系统化专题·总览等);0418/0419/0426/0427 四专题 2026-06-11 P3.4 校链已核实迁入 final_path,按 basename 正常解析,链接有效。
修订日志
- R1(2026-06-07):首稿(终轮综合产出)。三条阅读路径(求职速通 70–90min / 决策链 110–140min / 紧迫度 90–110min),各标时长+前置+可观测产出,并给路径专属的”贴墙口径”;12 题自测(每题及格线/优秀线/反例三档,覆盖六模块);反方对话训练 6 追问(审阅瓶颈换说法 / 认识论太玄 / 引用就是有依据 / 知识还是模拟好用就行 / 干脆别让人审 / 数据会告诉答案),每条按”接受+边界”工艺给劣质回应对照 + 带证据的标准回应;关联节点全用真实 basename(专题内 17 节点 + c13/Polanyi/0114/0601/0117 + 0418/0419/0426/0427 staging basename + 技术底座);待建概念清单全部降级为普通文本、与总览 §8 合并去重,未在主库建任何 stub。双链名遵守总览 §8 canonical 列表(专题内用真实标题,如总览写作 _AI 认识论中介系统化专题·总览,规避 staging 节点内残留的「A01 知识与知识的模拟」一类错误双链——此处刻意写作普通文本、不加双链括号,以免在 README 里新造一条死链)。
- 2026-06-11 P3.4 校链:核实本 README 全部双链有效(零裸死链);0418/0419/0426/0427 已迁入 final_path,跨专题链区标题与「写法待办」由「staging」更新为「已入库真实 basename」。