A05 默会知识与 AI 的认识论张力

当一个 PM 说”AI 已经能干高级分析师的活了”，他在认识论上预设了一件大事：专家的判断力是一种可以被显性化、被压缩进模型权重、再被复刻出来的东西。本节要解决的问题是——这个预设在哪里成立、在哪里是认识论误判？框架取自 Michael Polanyi 的默会知识（tacit knowledge）与 Gilbert Ryle 的 knowing-how / knowing-that 之分。判断主轴只有一句话：把默会专长当作”可被 AI 替代的可显性化知识”，是一种系统性的认识论范畴错误（category mistake），而这个错误直接决定你的 human-in-the-loop 触发条件画在哪里。

§0 为什么是 Polanyi 而不是”知识压缩”框架

读者脑子里的默认框架通常是工程师式的：知识 = 信息，信息可压缩，模型参数足够多就能把专家脑子里的东西”装进去”。这个框架的隐含假设是知识的可加和性与可外化性——只要数据够多、上下文够长，默会的终将变成显性的。

Polanyi（1958/1966）的框架从根上否认这一点。他的命题是 “We can know more than we can tell”（我们能知道的，多于我们能言说的）。注意：不是”我们暂时还没说清”，而是结构上说不清。诊断医生看一眼片子就知道”不对劲”，能不能事后补出一份特征清单？能补一部分，但那份清单永远不等于他当时的判断本身——因为判断是从无数附属细节（subsidiary particulars）“整合”（integrate）到焦点整体（focal whole）的行为，而整合这个动作本身无法被对象化。

为什么必须用 Polanyi 而不是”知识压缩”框架？因为后者会让你把”AI 没复刻出专家判断”误诊为数据不够 / 上下文不够 / 模型不够大这类可量化的工程缺口，从而做出”再喂三个月数据就能上线无人审”的灾难性 roadmap。Polanyi 框架告诉你：有一类缺口是原理性的，不随规模消失——这对应本专题反复出现的”不可消除”姿态（见 c13 - 幻觉的不可消除性：幻觉不可降至 0 是架构性的，不是数据量问题）。

§1 Ryle 的范畴错误：knowing-how 不可还原为 knowing-that

Polanyi 之前，Gilbert Ryle 在《心的概念》（The Concept of Mind, 1949）里已经把刀磨好了。他区分两类知识：

	knowing-that（命题知识）	knowing-how（技能知识）
形式	可言说的事实陈述	技能性表现
例子	”我知道巴黎是法国首都”	骑车、辨味、带团队
还原性	是命题	不能完全还原为命题

Ryle 的杀手锏是反智识主义（anti-intellectualism）的无穷后退论证：如果每一个智能行动都必须先在脑中”查阅”一条规则，那么”查阅规则”本身也是一个智能行动，又需要查阅一条”如何查阅规则”的规则……无穷后退。结论：knowing-how 不可能奠基在 knowing-that 之上，否则人类将无法在有限时间内行动。

这个论证对 AI 是直接的。LLM 的全部知识都是 knowing-that 形态的——它处理的是 token 序列（命题、文本、可符号化的关系）。当我们把一项 knowing-how 的专长（比如”判断这份增长报告哪里在掩盖问题”）交给 LLM，我们实际上是在押注：这项技能可以被无损地翻译成命题序列。Ryle 说这是范畴错误——你在用描述命题知识的语法去谈技能知识，就像问”大学在哪栋楼”（大学不是一栋楼，而是楼群间的组织关系）。

[!note] 跨域呼应：Ryle × Polanyi 的互补 Ryle 从语言分析切入（knowing-how 的逻辑形态与 knowing-that 不同），Polanyi 从认知现象学切入（认知的from-to 结构无法被对象化）。两人结论同向：存在一类知识，其本质就是不可完全显性化。这不是同一论证的两次复述，而是从语言和身体/认知两个独立入口逼到同一个边界——这种”双入口逼近同一边界”本身增强了结论的稳健性。

§2 可显性化的边界：Collins 的抵抗梯度与 Polanyi 悖论

把”默会 vs 显性”当成一刀切的二分，是第二个常见错误。Harry Collins（Tacit and Explicit Knowledge, 2010）给了更有用的分级：

类型	定义	对 AI 的可习得性
Relational（关系性）	因社会情境偶然未显化，原则上说得清	最高——可被文本训练逼近
Somatic（躯体性）	嵌入身体/神经（如骑车的平衡）	中等——部分可被外部研究解析
Collective（集体性）	嵌入社会实践（语言规则、实验室文化、行业”潜规则”）	最低——无法脱离社会化传授

Collins 的论点（以引力波探测、激光复制实验为案例）：集体性默会知识必须通过直接协作传递，再多的文本也搬不动它。这给 PM 一个可操作的判别工具——当你评估”这项工作能不能交给 AI”时，先问它落在哪一档：关系性的（如”把这堆零散信息整理成结构化报告”）AI 能接得很好；集体性的（如”判断这个跨部门妥协方案在我们公司的政治生态里能不能落地”）AI 接不住，且不是再训练就能接住。

经济学家 David Autor（2014, NBER/Brookings, “Polanyi’s Paradox and the Shape of Employment Growth”）把这一边界命名为**“波兰尼悖论”：人类凭直觉能做却说不出规则的任务（驾车、识脸、整理凌乱房间）最难自动化；最容易自动化的反而是可被完整编码的例行任务。Autor 用它解释了就业极化**——信息技术吞掉中间技能的例行工作，却补足（而非替代）人类的抽象推理与社会互动能力。

这里要做一次诚实的进步主义叙事修正：2014 年 Autor 写这话时，识脸和驾驶是”AI 做不到”的典型例子；2026 年回看，人脸识别已基本攻克，自动驾驶在受限域内可用。所以波兰尼悖论的边界在移动——它不是一道铁幕，而是一条随技术推进而后退、但永远后退不到 0 的线。把这条线当铁幕（“AI 永远干不了专家活”)和把它当幻觉（“再过两年全自动”)是同一枚硬币的两个错误面。

§3 判断主轴：把默会专长当可被 AI 替代，错在哪四个点

这是本节的命门。90% 的产品决策在这里翻车，每一处都带”症状 → 为什么错 → 正确做法 → 真实反例”。

错误一：把”AI 输出像专家”当成”AI 拥有专家的判断”。

症状：demo 里 AI 生成的分析报告读起来很专业，于是判定”可以替代分析师初稿+轻审”。
为什么错：输出的命题形态相似 ≠ 产生输出的认知过程相同。专家的判断是 from-to 整合，AI 的输出是 next-token 统计。形态同构掩盖了认识论地位的根本差异（这正是幻觉校准问题的认识论根源：模型在最该不确定时给出最自信的命题）。
正确做法：审的不是”读起来对不对”，而是”它有没有调动到那些说不清的附属线索”。后者无法靠读输出判断，只能靠保留一个真专家做对照判断。
真实反例：医疗 AI 影像系统在论文级数据上超越放射科医生，但在真实科室部署时，遇到分布外的成像伪影、罕见合并症——那些资深医生”看一眼觉得不对”的默会触发——系统沉默地给出自信的正常诊断。这正是 §0 引出的”集体性/躯体性默会”无法被训练数据覆盖。

错误二：以为”加长上下文 / 加 RAG 就能注入默会知识”。

症状：把专家的 SOP 文档、历史案例、内部 wiki 全塞进 RAG，认为这就等于把专家”装进”了系统。
为什么错：进得了向量库的，定义上就是已显性化的（关系性默会，至多）。组织里最值钱的判断恰恰是没写进任何文档的集体性默会——它在走廊对话、在”我们这儿不这么干”的默契里。
正确做法：把 RAG 的覆盖率天花板显式标出来——L1（已文档化）覆盖率有原理性上限，剩下的必须靠 human-in-the-loop 补。参见 RAG 的检索边界与 Polanyi 默会知识与提示工程的认识论张力中”组织最值钱的判断进不了向量库”的论证。
真实反例：法律/合规审查 AI 能检索全部成文条款（knowing-that），但”这个条款监管方实际上怎么执法”是执业律师与监管打交道攒下的集体性默会，文档里没有。

错误三：把 human-in-the-loop 当成”让人盖个章”的形式环节。

症状：流程上保留了人审，但审阅者只是快速扫一眼就批准。
为什么错：当 AI 输出流畅自信、且大部分时候正确时，审阅者的默会”警觉”会被自动化自满（automation complacency）侵蚀，verification 退化为 rubber-stamping。这是本专题 _审阅瓶颈系统化专题·总览的核心发现——验证而非生成才是瓶颈。
正确做法：human-in-the-loop 的触发条件必须设计在”默会判断真正不可替代”之处（集体性/躯体性默会密集的决策），而不是均匀撒在所有输出上。把审阅注意力配置到 AI 默会能力最弱的地方。
真实反例：荷兰儿童福利算法、澳大利亚 Robodebt——制度上”有人在回路”，认识论上监督已失效，因为人的默会判断被边缘化为橡皮图章。

错误四：以为默会知识只是”暂时的工程缺口”，会随规模消失。

症状：roadmap 写”当前需人工复核，Q4 模型升级后转全自动”。
为什么错：把原理性边界误读为可量化缺口。Collins 意义的集体性默会，不随参数量、数据量、上下文长度收敛。
正确做法：区分”会随规模缩小的缺口”（关系性默会、长尾覆盖）与”不会的缺口”（集体性默会、具身判断），只对前者排消除计划，对后者排长期共存的契约设计——这与 c13 - 幻觉的不可消除性升级对照一致：按永久失败模式设计产品，而不是等它消失。
真实反例：自动驾驶承诺”明年全自动”已重复十年，受限域可用、开放域的长尾默会判断仍需人类接管。

§4 产品 PM 视角补盲

工程视角只问”AI 能不能输出对的结果”。产品视角要补三个看走眼点：

用户心理模型的错配：用户对”AI 给的”和”专家给的”会赋予不同的信任结构。当产品把 AI 输出包装得像专家证言（confident、流畅、有”理由”），用户会过度依赖——这制造了 testimony 层面的信任陷阱（见 0117社会学的证言可信度议题）。confidence display 的设计因此不是 UI 细节，而是认识论责任：要不要、如何外显”这是统计而非判断”。
商业模式的边界：“AI 替代专家”的定价叙事，在默会密集的领域会被现实击穿——你卖的”自动化”实际仍需专家兜底，成本结构没有想象中改善。更稳的叙事是”AI 处理关系性默会的量，专家集中处理集体性默会的质”。
合规边界：EU AI Act（2024-08-01 正式生效；高风险系统义务自 2026-08-02 适用）要求高风险系统支持”有效的人类监督”。但若监督对象是 AI 的默会盲区，而审阅者只能审显性输出，则法律要件可被满足、认识论有效性却落空——这是把”程序合规”误当”实质监督”的合规陷阱。

§5 对手框架回应（接受 + 边界）

对手一：Céline Budding（2025, Philosophy of Science, “What Do Large Language Models Know? Tacit Knowledge as a Potential Causal-Explanatory Structure”, arXiv:2504.12187）。 她论证 LLM 的架构满足 Martin Davies（1990）版默会知识的三约束（语义描述、句法结构、因果系统性），因此默会知识可作为解释 LLM 行为的因果-解释框架。

接受：在 Davies 的技术定义下，LLM 确实有某种”默会结构”——它的能力不可被它能输出的规则穷尽，这与默会知识的形式特征吻合。把 LLM 看成”全是显性 knowing-that”也是过度简化。
边界与赌注：Budding 用的是 Davies 1990 的默会知识定义，不等于 Polanyi 原版。Polanyi 的默会知识内含个人承诺（personal commitment）与热情投入——认知者对自己所知的切身负责。LLM 没有这种承诺结构。我赌的是：对 PM 决策而言，关键的不是”LLM 是否在 Davies 意义上有默会结构”，而是”它有没有 Polanyi 意义上的、能在分布外场景被恰当触发的整合判断”——后者目前没有可靠证据。两个定义不可混用，混用就会从”LLM 有某种默会形式结构”滑到”LLM 能替代默会专长”，这正是判断主轴要挡的滑变。

对手二（Rick 未读框架）：Jason Stanley & Timothy Williamson 的智识主义（“Knowing How”, The Journal of Philosophy 98(8), 2001, pp. 411–444；Stanley Know How, OUP, 2011）。 他们直接反驳 Ryle：knowing-how 其实就是 knowing-that，只是用一种”实践呈现方式”（practical mode of presentation）来把握命题。

接受：智识主义有真东西。Ryle 的二分可能过硬——有些”技能”确实可被部分命题化，跨语言的语法证据也对反智识主义构成挑战。如果智识主义成立，则 knowing-how 原则上可形式化，对 AI 友好得多。
边界与赌注：这场争论在哲学上未决（SEP “Knowledge How” 条目确认双方仍在交锋；认知科学的陈述性记忆/程序性记忆神经解离证据偏向反智识主义，但智识主义者主张程序性系统仍编码非概念命题）。对 PM，我的赌注是：即便智识主义在理论上对，“原则上可命题化”与”已被某个具体 LLM 习得”之间仍隔着 Collins 的集体性默会这道工程鸿沟。哲学赌局可以悬而未决，产品边界不能——在悬而未决期间，把默会密集决策当”不可全自动”是更小的期望损失。

§6 PM 决策启示

面试：被问”AI 会不会取代分析师/PM”，不要答”会/不会”，答范畴——“取代关系性默会（整理、初稿、检索），补足集体性默会（跨部门判断、政治可行性、客户默契）“；引 Ryle 范畴错误 + Autor 波兰尼悖论 + Collins 三分，30 秒建立认识论纵深。
选型：评估任何”自动化专家工作”的产品，先用 Collins 三分给目标任务分级；集体性默会占比高的，要求供应商给出 human-in-the-loop 设计，而非自动化率数字。
复现 / 设计：把 human-in-the-loop 触发条件、confidence display、citation 系统三者绑定到”默会盲区地图”上——审阅注意力配置到 AI 默会最弱处，而不是均匀分布；这是 _审阅瓶颈系统化专题·总览的”验证瓶颈”在概念层的根因。

§7 与已有节点的关系

对 Polanyi 默会知识与提示工程的认识论张力：升级 + 转层。旧节点在提示工程层用 Polanyi（prompt 永远小于意图、CoT 的代价、评测本身是默会的）。本节点上升到认识论中介层，处理的不是”怎么写 prompt”，而是”把默会专长当可替代是不是范畴错误”以及”它如何决定 human-in-the-loop 的触发条件”。不复述旧节点的四条张力，而是接它的结论往上走一层。
对 c13 - 幻觉的不可消除性：同构对话。c13 论证幻觉的不可消除是架构性的；本节论证默会缺口的不可消除是认识论性的——两者都属”不随规模收敛的原理性边界”，应对策略也同构（按永久模式设计契约，不排消除计划）。不复述 c13 的五分类与四级策略。
对 0114认识论：把认识论的 JTB / 可靠主义议题，落到”AI 中介的知识是不是知识”的具体张力上。

§8 关联节点

核心（必读）

Polanyi 默会知识与提示工程的认识论张力 — 本节点的下层（提示工程版）
c13 - 幻觉的不可消除性 — 同构的”不可消除”姿态
0114认识论 — knowing-how/that、JTB 的哲学母库
_审阅瓶颈系统化专题·总览 — 默会盲区如何变成验证瓶颈
RAG — 关系性默会的可检索性 vs 集体性默会的覆盖天花板

延伸（可选）

幻觉 — 校准问题与默会触发的失效
0117社会学 — 证言可信度、AI 输出的信任结构
_信息检索与知识系统系统化专题·总览 — 知识产品设计层的默会边界
Agent — 自主执行中默会判断的缺口

修订日志

2026-06-07 R0：首稿。建立 Ryle×Polanyi×Collins×Autor 四源主轴；判断主轴四错误四件套；接入 Budding(2025) 与 Stanley-Williamson(2001) 两个对手框架（一个支持 LLM 有默会结构、一个反 Ryle）；与 c13/0418/Polanyi 提示工程节点显式升级对照。
2026-06-07 R0 grounding：WebSearch 核实 Stanley & Williamson “Knowing How”, The Journal of Philosophy 98(8), 2001, pp. 411–444（已确证，非 Philosophical Review）；Budding “What Do Large Language Models Know?” arXiv:2504.12187，Philosophy of Science (2025)，用 Martin Davies(1990) 三约束（语义描述/句法结构/因果系统性）已确证。残留〔待核实〕：0427 总览节点的双链全名（staging 阶段，迁库时校正）。
2026-06-11 P3.4 校链：核实 0427 已迁入 final_path，本节 _信息检索与知识系统系统化专题·总览 basename 双链有效，上条「残留待核实/staging」已消解。
2026-06-12 内审修复：§3 合规边界 EU AI Act 生效口径统一为”2024-08-01 正式生效；高风险系统义务自 2026-08-02 适用”（权威值，呼应总览 §8 QC #5）。