A05 默会知识与 AI 的认识论张力
A05 默会知识与 AI 的认识论张力
当一个 PM 说”AI 已经能干高级分析师的活了”,他在认识论上预设了一件大事:专家的判断力是一种可以被显性化、被压缩进模型权重、再被复刻出来的东西。本节要解决的问题是——这个预设在哪里成立、在哪里是认识论误判?框架取自 Michael Polanyi 的默会知识(tacit knowledge)与 Gilbert Ryle 的 knowing-how / knowing-that 之分。判断主轴只有一句话:把默会专长当作”可被 AI 替代的可显性化知识”,是一种系统性的认识论范畴错误(category mistake),而这个错误直接决定你的 human-in-the-loop 触发条件画在哪里。
§0 为什么是 Polanyi 而不是”知识压缩”框架
读者脑子里的默认框架通常是工程师式的:知识 = 信息,信息可压缩,模型参数足够多就能把专家脑子里的东西”装进去”。这个框架的隐含假设是知识的可加和性与可外化性——只要数据够多、上下文够长,默会的终将变成显性的。
Polanyi(1958/1966)的框架从根上否认这一点。他的命题是 “We can know more than we can tell”(我们能知道的,多于我们能言说的)。注意:不是”我们暂时还没说清”,而是结构上说不清。诊断医生看一眼片子就知道”不对劲”,能不能事后补出一份特征清单?能补一部分,但那份清单永远不等于他当时的判断本身——因为判断是从无数附属细节(subsidiary particulars)“整合”(integrate)到焦点整体(focal whole)的行为,而整合这个动作本身无法被对象化。
为什么必须用 Polanyi 而不是”知识压缩”框架?因为后者会让你把”AI 没复刻出专家判断”误诊为数据不够 / 上下文不够 / 模型不够大这类可量化的工程缺口,从而做出”再喂三个月数据就能上线无人审”的灾难性 roadmap。Polanyi 框架告诉你:有一类缺口是原理性的,不随规模消失——这对应本专题反复出现的”不可消除”姿态(见 c13 - 幻觉的不可消除性:幻觉不可降至 0 是架构性的,不是数据量问题)。
§1 Ryle 的范畴错误:knowing-how 不可还原为 knowing-that
Polanyi 之前,Gilbert Ryle 在《心的概念》(The Concept of Mind, 1949)里已经把刀磨好了。他区分两类知识:
| knowing-that(命题知识) | knowing-how(技能知识) | |
|---|---|---|
| 形式 | 可言说的事实陈述 | 技能性表现 |
| 例子 | ”我知道巴黎是法国首都” | 骑车、辨味、带团队 |
| 还原性 | 是命题 | 不能完全还原为命题 |
Ryle 的杀手锏是反智识主义(anti-intellectualism)的无穷后退论证:如果每一个智能行动都必须先在脑中”查阅”一条规则,那么”查阅规则”本身也是一个智能行动,又需要查阅一条”如何查阅规则”的规则……无穷后退。结论:knowing-how 不可能奠基在 knowing-that 之上,否则人类将无法在有限时间内行动。
这个论证对 AI 是直接的。LLM 的全部知识都是 knowing-that 形态的——它处理的是 token 序列(命题、文本、可符号化的关系)。当我们把一项 knowing-how 的专长(比如”判断这份增长报告哪里在掩盖问题”)交给 LLM,我们实际上是在押注:这项技能可以被无损地翻译成命题序列。Ryle 说这是范畴错误——你在用描述命题知识的语法去谈技能知识,就像问”大学在哪栋楼”(大学不是一栋楼,而是楼群间的组织关系)。
[!note] 跨域呼应:Ryle × Polanyi 的互补 Ryle 从语言分析切入(knowing-how 的逻辑形态与 knowing-that 不同),Polanyi 从认知现象学切入(认知的from-to 结构无法被对象化)。两人结论同向:存在一类知识,其本质就是不可完全显性化。这不是同一论证的两次复述,而是从语言和身体/认知两个独立入口逼到同一个边界——这种”双入口逼近同一边界”本身增强了结论的稳健性。
§2 可显性化的边界:Collins 的抵抗梯度与 Polanyi 悖论
把”默会 vs 显性”当成一刀切的二分,是第二个常见错误。Harry Collins(Tacit and Explicit Knowledge, 2010)给了更有用的分级:
| 类型 | 定义 | 对 AI 的可习得性 |
|---|---|---|
| Relational(关系性) | 因社会情境偶然未显化,原则上说得清 | 最高——可被文本训练逼近 |
| Somatic(躯体性) | 嵌入身体/神经(如骑车的平衡) | 中等——部分可被外部研究解析 |
| Collective(集体性) | 嵌入社会实践(语言规则、实验室文化、行业”潜规则”) | 最低——无法脱离社会化传授 |
Collins 的论点(以引力波探测、激光复制实验为案例):集体性默会知识必须通过直接协作传递,再多的文本也搬不动它。这给 PM 一个可操作的判别工具——当你评估”这项工作能不能交给 AI”时,先问它落在哪一档:关系性的(如”把这堆零散信息整理成结构化报告”)AI 能接得很好;集体性的(如”判断这个跨部门妥协方案在我们公司的政治生态里能不能落地”)AI 接不住,且不是再训练就能接住。
经济学家 David Autor(2014, NBER/Brookings, “Polanyi’s Paradox and the Shape of Employment Growth”)把这一边界命名为**“波兰尼悖论”:人类凭直觉能做却说不出规则的任务(驾车、识脸、整理凌乱房间)最难自动化;最容易自动化的反而是可被完整编码的例行任务。Autor 用它解释了就业极化**——信息技术吞掉中间技能的例行工作,却补足(而非替代)人类的抽象推理与社会互动能力。
这里要做一次诚实的进步主义叙事修正:2014 年 Autor 写这话时,识脸和驾驶是”AI 做不到”的典型例子;2026 年回看,人脸识别已基本攻克,自动驾驶在受限域内可用。所以波兰尼悖论的边界在移动——它不是一道铁幕,而是一条随技术推进而后退、但永远后退不到 0 的线。把这条线当铁幕(“AI 永远干不了专家活”)和把它当幻觉(“再过两年全自动”)是同一枚硬币的两个错误面。
§3 判断主轴:把默会专长当可被 AI 替代,错在哪四个点
这是本节的命门。90% 的产品决策在这里翻车,每一处都带”症状 → 为什么错 → 正确做法 → 真实反例”。
错误一:把”AI 输出像专家”当成”AI 拥有专家的判断”。
- 症状:demo 里 AI 生成的分析报告读起来很专业,于是判定”可以替代分析师初稿+轻审”。
- 为什么错:输出的命题形态相似 ≠ 产生输出的认知过程相同。专家的判断是 from-to 整合,AI 的输出是 next-token 统计。形态同构掩盖了认识论地位的根本差异(这正是 幻觉 校准问题的认识论根源:模型在最该不确定时给出最自信的命题)。
- 正确做法:审的不是”读起来对不对”,而是”它有没有调动到那些说不清的附属线索”。后者无法靠读输出判断,只能靠保留一个真专家做对照判断。
- 真实反例:医疗 AI 影像系统在论文级数据上超越放射科医生,但在真实科室部署时,遇到分布外的成像伪影、罕见合并症——那些资深医生”看一眼觉得不对”的默会触发——系统沉默地给出自信的正常诊断。这正是 §0 引出的”集体性/躯体性默会”无法被训练数据覆盖。
错误二:以为”加长上下文 / 加 RAG 就能注入默会知识”。
- 症状:把专家的 SOP 文档、历史案例、内部 wiki 全塞进 RAG,认为这就等于把专家”装进”了系统。
- 为什么错:进得了向量库的,定义上就是已显性化的(关系性默会,至多)。组织里最值钱的判断恰恰是没写进任何文档的集体性默会——它在走廊对话、在”我们这儿不这么干”的默契里。
- 正确做法:把 RAG 的覆盖率天花板显式标出来——L1(已文档化)覆盖率有原理性上限,剩下的必须靠 human-in-the-loop 补。参见 RAG 的检索边界与 Polanyi 默会知识与提示工程的认识论张力 中”组织最值钱的判断进不了向量库”的论证。
- 真实反例:法律/合规审查 AI 能检索全部成文条款(knowing-that),但”这个条款监管方实际上怎么执法”是执业律师与监管打交道攒下的集体性默会,文档里没有。
错误三:把 human-in-the-loop 当成”让人盖个章”的形式环节。
- 症状:流程上保留了人审,但审阅者只是快速扫一眼就批准。
- 为什么错:当 AI 输出流畅自信、且大部分时候正确时,审阅者的默会”警觉”会被自动化自满(automation complacency)侵蚀,verification 退化为 rubber-stamping。这是本专题 _审阅瓶颈系统化专题·总览 的核心发现——验证而非生成才是瓶颈。
- 正确做法:human-in-the-loop 的触发条件必须设计在”默会判断真正不可替代”之处(集体性/躯体性默会密集的决策),而不是均匀撒在所有输出上。把审阅注意力配置到 AI 默会能力最弱的地方。
- 真实反例:荷兰儿童福利算法、澳大利亚 Robodebt——制度上”有人在回路”,认识论上监督已失效,因为人的默会判断被边缘化为橡皮图章。
错误四:以为默会知识只是”暂时的工程缺口”,会随规模消失。
- 症状:roadmap 写”当前需人工复核,Q4 模型升级后转全自动”。
- 为什么错:把原理性边界误读为可量化缺口。Collins 意义的集体性默会,不随参数量、数据量、上下文长度收敛。
- 正确做法:区分”会随规模缩小的缺口”(关系性默会、长尾覆盖)与”不会的缺口”(集体性默会、具身判断),只对前者排消除计划,对后者排长期共存的契约设计——这与 c13 - 幻觉的不可消除性 升级对照一致:按永久失败模式设计产品,而不是等它消失。
- 真实反例:自动驾驶承诺”明年全自动”已重复十年,受限域可用、开放域的长尾默会判断仍需人类接管。
§4 产品 PM 视角补盲
工程视角只问”AI 能不能输出对的结果”。产品视角要补三个看走眼点:
- 用户心理模型的错配:用户对”AI 给的”和”专家给的”会赋予不同的信任结构。当产品把 AI 输出包装得像专家证言(confident、流畅、有”理由”),用户会过度依赖——这制造了 testimony 层面的信任陷阱(见 0117社会学 的证言可信度议题)。confidence display 的设计因此不是 UI 细节,而是认识论责任:要不要、如何外显”这是统计而非判断”。
- 商业模式的边界:“AI 替代专家”的定价叙事,在默会密集的领域会被现实击穿——你卖的”自动化”实际仍需专家兜底,成本结构没有想象中改善。更稳的叙事是”AI 处理关系性默会的量,专家集中处理集体性默会的质”。
- 合规边界:EU AI Act(2024-08-01 正式生效;高风险系统义务自 2026-08-02 适用)要求高风险系统支持”有效的人类监督”。但若监督对象是 AI 的默会盲区,而审阅者只能审显性输出,则法律要件可被满足、认识论有效性却落空——这是把”程序合规”误当”实质监督”的合规陷阱。
§5 对手框架回应(接受 + 边界)
对手一:Céline Budding(2025, Philosophy of Science, “What Do Large Language Models Know? Tacit Knowledge as a Potential Causal-Explanatory Structure”, arXiv:2504.12187)。 她论证 LLM 的架构满足 Martin Davies(1990)版默会知识的三约束(语义描述、句法结构、因果系统性),因此默会知识可作为解释 LLM 行为的因果-解释框架。
- 接受:在 Davies 的技术定义下,LLM 确实有某种”默会结构”——它的能力不可被它能输出的规则穷尽,这与默会知识的形式特征吻合。把 LLM 看成”全是显性 knowing-that”也是过度简化。
- 边界与赌注:Budding 用的是 Davies 1990 的默会知识定义,不等于 Polanyi 原版。Polanyi 的默会知识内含个人承诺(personal commitment)与热情投入——认知者对自己所知的切身负责。LLM 没有这种承诺结构。我赌的是:对 PM 决策而言,关键的不是”LLM 是否在 Davies 意义上有默会结构”,而是”它有没有 Polanyi 意义上的、能在分布外场景被恰当触发的整合判断”——后者目前没有可靠证据。两个定义不可混用,混用就会从”LLM 有某种默会形式结构”滑到”LLM 能替代默会专长”,这正是判断主轴要挡的滑变。
对手二(Rick 未读框架):Jason Stanley & Timothy Williamson 的智识主义(“Knowing How”, The Journal of Philosophy 98(8), 2001, pp. 411–444;Stanley Know How, OUP, 2011)。 他们直接反驳 Ryle:knowing-how 其实就是 knowing-that,只是用一种”实践呈现方式”(practical mode of presentation)来把握命题。
- 接受:智识主义有真东西。Ryle 的二分可能过硬——有些”技能”确实可被部分命题化,跨语言的语法证据也对反智识主义构成挑战。如果智识主义成立,则 knowing-how 原则上可形式化,对 AI 友好得多。
- 边界与赌注:这场争论在哲学上未决(SEP “Knowledge How” 条目确认双方仍在交锋;认知科学的陈述性记忆/程序性记忆神经解离证据偏向反智识主义,但智识主义者主张程序性系统仍编码非概念命题)。对 PM,我的赌注是:即便智识主义在理论上对,“原则上可命题化”与”已被某个具体 LLM 习得”之间仍隔着 Collins 的集体性默会这道工程鸿沟。哲学赌局可以悬而未决,产品边界不能——在悬而未决期间,把默会密集决策当”不可全自动”是更小的期望损失。
§6 PM 决策启示
- 面试:被问”AI 会不会取代分析师/PM”,不要答”会/不会”,答范畴——“取代关系性默会(整理、初稿、检索),补足集体性默会(跨部门判断、政治可行性、客户默契)“;引 Ryle 范畴错误 + Autor 波兰尼悖论 + Collins 三分,30 秒建立认识论纵深。
- 选型:评估任何”自动化专家工作”的产品,先用 Collins 三分给目标任务分级;集体性默会占比高的,要求供应商给出 human-in-the-loop 设计,而非自动化率数字。
- 复现 / 设计:把 human-in-the-loop 触发条件、confidence display、citation 系统三者绑定到”默会盲区地图”上——审阅注意力配置到 AI 默会最弱处,而不是均匀分布;这是 _审阅瓶颈系统化专题·总览 的”验证瓶颈”在概念层的根因。
§7 与已有节点的关系
- 对 Polanyi 默会知识与提示工程的认识论张力:升级 + 转层。旧节点在提示工程层用 Polanyi(prompt 永远小于意图、CoT 的代价、评测本身是默会的)。本节点上升到认识论中介层,处理的不是”怎么写 prompt”,而是”把默会专长当可替代是不是范畴错误”以及”它如何决定 human-in-the-loop 的触发条件”。不复述旧节点的四条张力,而是接它的结论往上走一层。
- 对 c13 - 幻觉的不可消除性:同构对话。c13 论证幻觉的不可消除是架构性的;本节论证默会缺口的不可消除是认识论性的——两者都属”不随规模收敛的原理性边界”,应对策略也同构(按永久模式设计契约,不排消除计划)。不复述 c13 的五分类与四级策略。
- 对 0114认识论:把认识论的 JTB / 可靠主义议题,落到”AI 中介的知识是不是知识”的具体张力上。
§8 关联节点
核心(必读)
- Polanyi 默会知识与提示工程的认识论张力 — 本节点的下层(提示工程版)
- c13 - 幻觉的不可消除性 — 同构的”不可消除”姿态
- 0114认识论 — knowing-how/that、JTB 的哲学母库
- _审阅瓶颈系统化专题·总览 — 默会盲区如何变成验证瓶颈
- RAG — 关系性默会的可检索性 vs 集体性默会的覆盖天花板
延伸(可选)
- 幻觉 — 校准问题与默会触发的失效
- 0117社会学 — 证言可信度、AI 输出的信任结构
- _信息检索与知识系统系统化专题·总览 — 知识产品设计层的默会边界
- Agent — 自主执行中默会判断的缺口
修订日志
- 2026-06-07 R0:首稿。建立 Ryle×Polanyi×Collins×Autor 四源主轴;判断主轴四错误四件套;接入 Budding(2025) 与 Stanley-Williamson(2001) 两个对手框架(一个支持 LLM 有默会结构、一个反 Ryle);与 c13/0418/Polanyi 提示工程节点显式升级对照。
- 2026-06-07 R0 grounding:WebSearch 核实 Stanley & Williamson “Knowing How”, The Journal of Philosophy 98(8), 2001, pp. 411–444(已确证,非 Philosophical Review);Budding “What Do Large Language Models Know?” arXiv:2504.12187,Philosophy of Science (2025),用 Martin Davies(1990) 三约束(语义描述/句法结构/因果系统性)已确证。残留〔待核实〕:0427 总览节点的双链全名(staging 阶段,迁库时校正)。
- 2026-06-11 P3.4 校链:核实 0427 已迁入 final_path,本节 _信息检索与知识系统系统化专题·总览 basename 双链有效,上条「残留待核实/staging」已消解。
- 2026-06-12 内审修复:§3 合规边界 EU AI Act 生效口径统一为”2024-08-01 正式生效;高风险系统义务自 2026-08-02 适用”(权威值,呼应总览 §8 QC #5)。