R

A05 默会知识与 AI 的认识论张力

创建 2026-06-07 更新 2026-06-12 0 条双链 AI 认识论中介 专题 AI 整理

A05 默会知识与 AI 的认识论张力

当一个 PM 说”AI 已经能干高级分析师的活了”,他在认识论上预设了一件大事:专家的判断力是一种可以被显性化、被压缩进模型权重、再被复刻出来的东西。本节要解决的问题是——这个预设在哪里成立、在哪里是认识论误判?框架取自 Michael Polanyi 的默会知识(tacit knowledge)与 Gilbert Ryle 的 knowing-how / knowing-that 之分。判断主轴只有一句话:把默会专长当作”可被 AI 替代的可显性化知识”,是一种系统性的认识论范畴错误(category mistake),而这个错误直接决定你的 human-in-the-loop 触发条件画在哪里。

§0 为什么是 Polanyi 而不是”知识压缩”框架

读者脑子里的默认框架通常是工程师式的:知识 = 信息,信息可压缩,模型参数足够多就能把专家脑子里的东西”装进去”。这个框架的隐含假设是知识的可加和性与可外化性——只要数据够多、上下文够长,默会的终将变成显性的。

Polanyi(1958/1966)的框架从根上否认这一点。他的命题是 “We can know more than we can tell”(我们能知道的,多于我们能言说的)。注意:不是”我们暂时还没说清”,而是结构上说不清。诊断医生看一眼片子就知道”不对劲”,能不能事后补出一份特征清单?能补一部分,但那份清单永远不等于他当时的判断本身——因为判断是从无数附属细节(subsidiary particulars)“整合”(integrate)到焦点整体(focal whole)的行为,而整合这个动作本身无法被对象化。

为什么必须用 Polanyi 而不是”知识压缩”框架?因为后者会让你把”AI 没复刻出专家判断”误诊为数据不够 / 上下文不够 / 模型不够大这类可量化的工程缺口,从而做出”再喂三个月数据就能上线无人审”的灾难性 roadmap。Polanyi 框架告诉你:有一类缺口是原理性的,不随规模消失——这对应本专题反复出现的”不可消除”姿态(见 c13 - 幻觉的不可消除性:幻觉不可降至 0 是架构性的,不是数据量问题)。

§1 Ryle 的范畴错误:knowing-how 不可还原为 knowing-that

Polanyi 之前,Gilbert Ryle 在《心的概念》(The Concept of Mind, 1949)里已经把刀磨好了。他区分两类知识:

knowing-that(命题知识)knowing-how(技能知识)
形式可言说的事实陈述技能性表现
例子”我知道巴黎是法国首都”骑车、辨味、带团队
还原性是命题不能完全还原为命题

Ryle 的杀手锏是反智识主义(anti-intellectualism)的无穷后退论证:如果每一个智能行动都必须先在脑中”查阅”一条规则,那么”查阅规则”本身也是一个智能行动,又需要查阅一条”如何查阅规则”的规则……无穷后退。结论:knowing-how 不可能奠基在 knowing-that 之上,否则人类将无法在有限时间内行动。

这个论证对 AI 是直接的。LLM 的全部知识都是 knowing-that 形态的——它处理的是 token 序列(命题、文本、可符号化的关系)。当我们把一项 knowing-how 的专长(比如”判断这份增长报告哪里在掩盖问题”)交给 LLM,我们实际上是在押注:这项技能可以被无损地翻译成命题序列。Ryle 说这是范畴错误——你在用描述命题知识的语法去谈技能知识,就像问”大学在哪栋楼”(大学不是一栋楼,而是楼群间的组织关系)。

[!note] 跨域呼应:Ryle × Polanyi 的互补 Ryle 从语言分析切入(knowing-how 的逻辑形态与 knowing-that 不同),Polanyi 从认知现象学切入(认知的from-to 结构无法被对象化)。两人结论同向:存在一类知识,其本质就是不可完全显性化。这不是同一论证的两次复述,而是从语言身体/认知两个独立入口逼到同一个边界——这种”双入口逼近同一边界”本身增强了结论的稳健性。

§2 可显性化的边界:Collins 的抵抗梯度与 Polanyi 悖论

把”默会 vs 显性”当成一刀切的二分,是第二个常见错误。Harry Collins(Tacit and Explicit Knowledge, 2010)给了更有用的分级

类型定义对 AI 的可习得性
Relational(关系性)因社会情境偶然未显化,原则上说得清最高——可被文本训练逼近
Somatic(躯体性)嵌入身体/神经(如骑车的平衡)中等——部分可被外部研究解析
Collective(集体性)嵌入社会实践(语言规则、实验室文化、行业”潜规则”)最低——无法脱离社会化传授

Collins 的论点(以引力波探测、激光复制实验为案例):集体性默会知识必须通过直接协作传递,再多的文本也搬不动它。这给 PM 一个可操作的判别工具——当你评估”这项工作能不能交给 AI”时,先问它落在哪一档:关系性的(如”把这堆零散信息整理成结构化报告”)AI 能接得很好;集体性的(如”判断这个跨部门妥协方案在我们公司的政治生态里能不能落地”)AI 接不住,且不是再训练就能接住

经济学家 David Autor(2014, NBER/Brookings, “Polanyi’s Paradox and the Shape of Employment Growth”)把这一边界命名为**“波兰尼悖论”:人类凭直觉能做却说不出规则的任务(驾车、识脸、整理凌乱房间)最难自动化;最容易自动化的反而是可被完整编码的例行任务。Autor 用它解释了就业极化**——信息技术吞掉中间技能的例行工作,却补足(而非替代)人类的抽象推理与社会互动能力。

这里要做一次诚实的进步主义叙事修正:2014 年 Autor 写这话时,识脸和驾驶是”AI 做不到”的典型例子;2026 年回看,人脸识别已基本攻克,自动驾驶在受限域内可用。所以波兰尼悖论的边界在移动——它不是一道铁幕,而是一条随技术推进而后退、但永远后退不到 0 的线。把这条线当铁幕(“AI 永远干不了专家活”)和把它当幻觉(“再过两年全自动”)是同一枚硬币的两个错误面。

§3 判断主轴:把默会专长当可被 AI 替代,错在哪四个点

这是本节的命门。90% 的产品决策在这里翻车,每一处都带”症状 → 为什么错 → 正确做法 → 真实反例”。

错误一:把”AI 输出像专家”当成”AI 拥有专家的判断”。

  • 症状:demo 里 AI 生成的分析报告读起来很专业,于是判定”可以替代分析师初稿+轻审”。
  • 为什么错:输出的命题形态相似 ≠ 产生输出的认知过程相同。专家的判断是 from-to 整合,AI 的输出是 next-token 统计。形态同构掩盖了认识论地位的根本差异(这正是 幻觉 校准问题的认识论根源:模型在最该不确定时给出最自信的命题)。
  • 正确做法:审的不是”读起来对不对”,而是”它有没有调动到那些说不清的附属线索”。后者无法靠读输出判断,只能靠保留一个真专家做对照判断
  • 真实反例:医疗 AI 影像系统在论文级数据上超越放射科医生,但在真实科室部署时,遇到分布外的成像伪影、罕见合并症——那些资深医生”看一眼觉得不对”的默会触发——系统沉默地给出自信的正常诊断。这正是 §0 引出的”集体性/躯体性默会”无法被训练数据覆盖。

错误二:以为”加长上下文 / 加 RAG 就能注入默会知识”。

  • 症状:把专家的 SOP 文档、历史案例、内部 wiki 全塞进 RAG,认为这就等于把专家”装进”了系统。
  • 为什么错:进得了向量库的,定义上就是已显性化的(关系性默会,至多)。组织里最值钱的判断恰恰是没写进任何文档的集体性默会——它在走廊对话、在”我们这儿不这么干”的默契里。
  • 正确做法:把 RAG 的覆盖率天花板显式标出来——L1(已文档化)覆盖率有原理性上限,剩下的必须靠 human-in-the-loop 补。参见 RAG 的检索边界与 Polanyi 默会知识与提示工程的认识论张力 中”组织最值钱的判断进不了向量库”的论证。
  • 真实反例:法律/合规审查 AI 能检索全部成文条款(knowing-that),但”这个条款监管方实际上怎么执法”是执业律师与监管打交道攒下的集体性默会,文档里没有。

错误三:把 human-in-the-loop 当成”让人盖个章”的形式环节。

  • 症状:流程上保留了人审,但审阅者只是快速扫一眼就批准。
  • 为什么错:当 AI 输出流畅自信、且大部分时候正确时,审阅者的默会”警觉”会被自动化自满(automation complacency)侵蚀,verification 退化为 rubber-stamping。这是本专题 _审阅瓶颈系统化专题·总览 的核心发现——验证而非生成才是瓶颈
  • 正确做法:human-in-the-loop 的触发条件必须设计在”默会判断真正不可替代”之处(集体性/躯体性默会密集的决策),而不是均匀撒在所有输出上。把审阅注意力配置到 AI 默会能力最弱的地方。
  • 真实反例:荷兰儿童福利算法、澳大利亚 Robodebt——制度上”有人在回路”,认识论上监督已失效,因为人的默会判断被边缘化为橡皮图章。

错误四:以为默会知识只是”暂时的工程缺口”,会随规模消失。

  • 症状:roadmap 写”当前需人工复核,Q4 模型升级后转全自动”。
  • 为什么错:把原理性边界误读为可量化缺口。Collins 意义的集体性默会,不随参数量、数据量、上下文长度收敛。
  • 正确做法:区分”会随规模缩小的缺口”(关系性默会、长尾覆盖)与”不会的缺口”(集体性默会、具身判断),只对前者排消除计划,对后者排长期共存的契约设计——这与 c13 - 幻觉的不可消除性 升级对照一致:按永久失败模式设计产品,而不是等它消失。
  • 真实反例:自动驾驶承诺”明年全自动”已重复十年,受限域可用、开放域的长尾默会判断仍需人类接管。

§4 产品 PM 视角补盲

工程视角只问”AI 能不能输出对的结果”。产品视角要补三个看走眼点:

  1. 用户心理模型的错配:用户对”AI 给的”和”专家给的”会赋予不同的信任结构。当产品把 AI 输出包装得像专家证言(confident、流畅、有”理由”),用户会过度依赖——这制造了 testimony 层面的信任陷阱(见 0117社会学 的证言可信度议题)。confidence display 的设计因此不是 UI 细节,而是认识论责任:要不要、如何外显”这是统计而非判断”。
  2. 商业模式的边界:“AI 替代专家”的定价叙事,在默会密集的领域会被现实击穿——你卖的”自动化”实际仍需专家兜底,成本结构没有想象中改善。更稳的叙事是”AI 处理关系性默会的量,专家集中处理集体性默会的质”。
  3. 合规边界:EU AI Act(2024-08-01 正式生效;高风险系统义务自 2026-08-02 适用)要求高风险系统支持”有效的人类监督”。但若监督对象是 AI 的默会盲区,而审阅者只能审显性输出,则法律要件可被满足、认识论有效性却落空——这是把”程序合规”误当”实质监督”的合规陷阱。

§5 对手框架回应(接受 + 边界)

对手一:Céline Budding(2025, Philosophy of Science, “What Do Large Language Models Know? Tacit Knowledge as a Potential Causal-Explanatory Structure”, arXiv:2504.12187)。 她论证 LLM 的架构满足 Martin Davies(1990)版默会知识的三约束(语义描述、句法结构、因果系统性),因此默会知识可作为解释 LLM 行为的因果-解释框架。

  • 接受:在 Davies 的技术定义下,LLM 确实有某种”默会结构”——它的能力不可被它能输出的规则穷尽,这与默会知识的形式特征吻合。把 LLM 看成”全是显性 knowing-that”也是过度简化。
  • 边界与赌注:Budding 用的是 Davies 1990 的默会知识定义,不等于 Polanyi 原版。Polanyi 的默会知识内含个人承诺(personal commitment)与热情投入——认知者对自己所知的切身负责。LLM 没有这种承诺结构。我赌的是:对 PM 决策而言,关键的不是”LLM 是否在 Davies 意义上有默会结构”,而是”它有没有 Polanyi 意义上的、能在分布外场景被恰当触发的整合判断”——后者目前没有可靠证据。两个定义不可混用,混用就会从”LLM 有某种默会形式结构”滑到”LLM 能替代默会专长”,这正是判断主轴要挡的滑变。

对手二(Rick 未读框架):Jason Stanley & Timothy Williamson 的智识主义(“Knowing How”, The Journal of Philosophy 98(8), 2001, pp. 411–444;Stanley Know How, OUP, 2011)。 他们直接反驳 Ryle:knowing-how 其实就是 knowing-that,只是用一种”实践呈现方式”(practical mode of presentation)来把握命题。

  • 接受:智识主义有真东西。Ryle 的二分可能过硬——有些”技能”确实可被部分命题化,跨语言的语法证据也对反智识主义构成挑战。如果智识主义成立,则 knowing-how 原则上可形式化,对 AI 友好得多。
  • 边界与赌注:这场争论在哲学上未决(SEP “Knowledge How” 条目确认双方仍在交锋;认知科学的陈述性记忆/程序性记忆神经解离证据偏向反智识主义,但智识主义者主张程序性系统仍编码非概念命题)。对 PM,我的赌注是:即便智识主义在理论上对,“原则上可命题化”与”已被某个具体 LLM 习得”之间仍隔着 Collins 的集体性默会这道工程鸿沟。哲学赌局可以悬而未决,产品边界不能——在悬而未决期间,把默会密集决策当”不可全自动”是更小的期望损失。

§6 PM 决策启示

  • 面试:被问”AI 会不会取代分析师/PM”,不要答”会/不会”,答范畴——“取代关系性默会(整理、初稿、检索),补足集体性默会(跨部门判断、政治可行性、客户默契)“;引 Ryle 范畴错误 + Autor 波兰尼悖论 + Collins 三分,30 秒建立认识论纵深。
  • 选型:评估任何”自动化专家工作”的产品,先用 Collins 三分给目标任务分级;集体性默会占比高的,要求供应商给出 human-in-the-loop 设计,而非自动化率数字。
  • 复现 / 设计:把 human-in-the-loop 触发条件、confidence display、citation 系统三者绑定到”默会盲区地图”上——审阅注意力配置到 AI 默会最弱处,而不是均匀分布;这是 _审阅瓶颈系统化专题·总览 的”验证瓶颈”在概念层的根因。

§7 与已有节点的关系

  • Polanyi 默会知识与提示工程的认识论张力升级 + 转层。旧节点在提示工程层用 Polanyi(prompt 永远小于意图、CoT 的代价、评测本身是默会的)。本节点上升到认识论中介层,处理的不是”怎么写 prompt”,而是”把默会专长当可替代是不是范畴错误”以及”它如何决定 human-in-the-loop 的触发条件”。不复述旧节点的四条张力,而是接它的结论往上走一层。
  • c13 - 幻觉的不可消除性同构对话。c13 论证幻觉的不可消除是架构性的;本节论证默会缺口的不可消除是认识论性的——两者都属”不随规模收敛的原理性边界”,应对策略也同构(按永久模式设计契约,不排消除计划)。不复述 c13 的五分类与四级策略。
  • 对 0114认识论:把认识论的 JTB / 可靠主义议题,落到”AI 中介的知识是不是知识”的具体张力上。

§8 关联节点

核心(必读)

延伸(可选)

修订日志

  • 2026-06-07 R0:首稿。建立 Ryle×Polanyi×Collins×Autor 四源主轴;判断主轴四错误四件套;接入 Budding(2025) 与 Stanley-Williamson(2001) 两个对手框架(一个支持 LLM 有默会结构、一个反 Ryle);与 c13/0418/Polanyi 提示工程节点显式升级对照。
  • 2026-06-07 R0 grounding:WebSearch 核实 Stanley & Williamson “Knowing How”, The Journal of Philosophy 98(8), 2001, pp. 411–444(已确证,非 Philosophical Review);Budding “What Do Large Language Models Know?” arXiv:2504.12187,Philosophy of Science (2025),用 Martin Davies(1990) 三约束(语义描述/句法结构/因果系统性)已确证。残留〔待核实〕:0427 总览节点的双链全名(staging 阶段,迁库时校正)。
  • 2026-06-11 P3.4 校链:核实 0427 已迁入 final_path,本节 _信息检索与知识系统系统化专题·总览 basename 双链有效,上条「残留待核实/staging」已消解。
  • 2026-06-12 内审修复:§3 合规边界 EU AI Act 生效口径统一为”2024-08-01 正式生效;高风险系统义务自 2026-08-02 适用”(权威值,呼应总览 §8 QC #5)。