A02 知识 vs 知识的模拟
用户从 LLM 拿到的那段流畅、自洽、引述得体的文本,到底是”知识”,还是”知识的模拟”——一种在表面上与知识无法区分、但不携带真值保证的语言制品?本节点要解决的核心问题是:当一个系统能可靠地产生”看起来像被知道的命题”,但其产生过程与”命题为真”之间没有任何结构性绑定时,把它的输出当作知识来消费、来转发、来据以决策,是不是一桩认识论事故(epistemic accident)。本节的框架名叫”模拟—接受”分析(simulation-acceptance analysis):把风险定位在接受动作而非输出本身。
§0 为什么是”模拟 vs 知识”这个框架,而不是”对 vs 错”
读者脑中的默认框架是准确率框架:模型答对了就是知识,答错了就是错误,所以”提高准确率 = 逼近知识”。这个框架会让你设计出错误的产品——它把问题误诊为”减少错误率”,于是你会去刷 benchmark、加 RAG、上更大的模型,以为准确率到 95% 就接近”给用户知识”了。
错在哪?知识不是”碰巧为真的信念”。这是认识论自柏拉图《泰阿泰德篇》以来的底线共识,也是 0114认识论 里”有辩护的真信念(JTB)“传统的核心。Edmund Gettier 1963 年那篇仅三页的 “Is Justified True Belief Knowledge?”(Analysis)用两个反例证明:一个信念可以同时为真、且有辩护,却仍然不是知识——因为它的”真”和它的”辩护”之间的连接是偶然的、走了运的。知识要求辩护与真值之间有非偶然的连接。
把这一刀架到 LLM 上:模型输出的命题即便为真(准确率框架里的”对”),它的”为真”与它的”被生成”之间也没有真值导向的连接。下一个 token 是按上下文条件概率采样出来的,目标函数是似然,不是真。一段正确的输出和一段幻觉,在生成机制上是同质的——都是高概率续写,区别只在于碰巧落在了语料的真值分布里还是分布外。这正是 c13 - 幻觉的不可消除性 揭示的架构性事实:Softmax 强制输出 + 概率采样必有低概率路径,幻觉不可降至 0。准确率框架看到的是”错误率”,模拟框架看到的是”即便答对也是 Gettier 式的偶然真”。
所以正确的框架是:模型产生的是”知识的模拟”——一种在句法、风格、引用形式、自信度上完美仿真”被知道的命题”,但在真值绑定这个决定性维度上空缺的语言制品。产品的真正风险不在输出有没有错,而在用户有没有把这种模拟当成知识来接受。
§1 “模拟”的精确含义:仿真了知识的哪些面、空缺了哪一面
“模拟”不是贬义的”假”。它是一个精确的认识论刻画:LLM 仿真了知识的全部可观测表层特征,独缺那个不可观测的、决定性的内核。
| 知识的特征维度 | LLM 输出是否仿真 | 说明 |
|---|---|---|
| 句法/流畅度 | ✅ 完美仿真 | 语法、连贯、术语得体,常优于人类专家 |
| 命题形式 | ✅ 仿真 | 以陈述句断言事实,“X 是 Y” |
| 引用形式 | ✅ 仿真(含伪造) | 给出作者、年份、期刊——格式正确,内容可能虚构 |
| 自信度表达 | ✅ 仿真(且反向校准) | 最不确定时输出最自信,见 c13 - 幻觉的不可消除性 校准问题 |
| 真值绑定 | ❌ 空缺 | 生成过程不以”为真”为目标,无真值导向连接 |
| 辩护链可追溯 | ❌ 空缺 | 内部推导对用户认识不透明,无法审查是否”经由可靠过程” |
这张表是本节点的命门。它说明了一件反直觉的事:模拟越逼真,认识论风险越高,而不是越低。一个会犯低级语法错误、引用格式混乱的系统,反而会触发用户的警惕;一个流畅、得体、自信、引用格式完美的系统,恰恰是最容易被当成知识接受的——因为它仿真了人类用来识别”可信知识”的全部表层信号。这就是为什么 Searle 1980 年”中文屋”(Behavioral and Brain Sciences 3(3))至今未死:屋里的人完美操纵符号、通过图灵测试,但句法不等于语义、操纵不等于理解。LLM 是中文屋的工业化规模版。
把这一点产品化:confidence display 不能照搬模型的自信度,因为模型的自信度本身就是被仿真出来的表层信号,且反向校准。直接把 logprob 或模型语气当成置信度展示给用户,等于把”模拟的一个面”误当成”知识的一个面”放大——这是设计层面的认识论事故。
§2 判断主轴:把流畅输出当知识 = 认识论事故的四种现场
这是本节点最关键的一节。“认识论事故”是我对一类失败的命名:用户获得了一个为真的信念,但他获得它的方式根本不可靠——他信的是模拟,碰巧模拟这次没骗他。即便结果为真,这个接受动作已经坏了,因为同样的接受动作在下一次会让他信下一个流畅的假命题。Gettier 式的”走运的真”被规模化、自动化、日常化了。以下是四种现场,每种带”症状 → 为什么会错 → 正确做法 → 真实反例”四件套。
现场一:流畅度替代真值(fluency-as-truth)
- 症状:用户读完一段通顺、结构清晰、术语密集的回答,产生”这写得真专业,应该是对的”的判断,直接采纳。
- 为什么会错:把可观测的表层信号(流畅)当成不可观测的内核(真值)。流畅度由语言建模能力决定,与真值正交——模型可以极其流畅地说错。
- 正确做法:在产品中切断流畅度与可信度的视觉绑定——越是高风险领域,越要把”流畅”和”已核实”在 UI 上分离(如未核实声明加灰底/待核标记),不让排版替真值背书。
- 真实反例:法律领域的 Mata v. Avianca 案(678 F.Supp.3d 443,S.D.N.Y. 22-cv-1461 (PKC),2023-06-22,法官 P. Kevin Castel,已 WebSearch 核实)——律师 Steven A. Schwartz 用 ChatGPT 检索案例,模型生成了多个格式完美、引用得体却完全虚构的判例(如 “Varghese v. China Southern Airlines Co Ltd., 925 F.3d 1339 (11th Cir. 2019)“——卷宗号、法院、年份俱全,案件本身不存在),律师因输出流畅专业而未核实,直接提交法庭,两名律师与律所被处 Rule 11 制裁、罚款 5000 美元。流畅度完美仿真了”被知道的判例”,律师把模拟当成了知识。
现场二:引用形式替代引用真实性(citation theater)
- 症状:回答带”(Smith, 2019, Nature)“式引用,用户因”它都给出处了”而提高信任。
- 为什么会错:引用的形式被仿真,引用的指称可能为空。给出处这个动作在人类世界里是辩护信号,在 LLM 这里只是又一种被学到的句法模式。
- 正确做法:citation 系统必须做指称落地(每条引用回链到可验证源),不可落地的引用一律降级展示或不展示;让”有引用”和”引用可验证”成为两种不同的 UI 状态。
- 真实反例:见 §0 起首引证链——Gettier 1963、Searle 1980 这类引用本节点都附了可查线索;而 Mata 案里的虚构判例正是”citation theater”的极端形态:引用格式 100% 正确,指称 100% 虚构。
现场三:审阅退化为橡皮图章(review-as-rubber-stamp)
- 症状:“有人在 review AI 输出”这个流程存在,但 reviewer 因输出流畅自信而只做表层扫读,验证置信度虚高,实际验证深度趋近于零。
- 为什么会错:把”流程上存在 human-in-the-loop”误当成”认识论上发生了 verification”。真正的 verification 要求 reviewer 形成自主的、由其自身可靠评估过程产生的判断;rubber-stamping 只是把信念从 AI 被动转移过来。
- 正确做法:human-in-the-loop 的触发条件不能只看”是否有人点了通过”,要看是否提供了可独立核验的证据(置信分、审计日志、可追溯引用),并设计成 reviewer 必须主动核验某些抽样项才能放行。
- 真实反例:Huemmer 等 “AI, Metacognition, and the Verification Bottleneck”(2026,arXiv:2601.17055,已 WebFetch 核实摘要)的三波纵向研究:参与者对困难任务的 AI 依赖率 73.9%,验证置信度下降 68.1%,复杂任务实际准确率仅 47.8%(随难度从 95.2%→81.0%→66.7%→47.8% 系统性下滑),信念—表现差距扩大到 34.6 个百分点(均已 WebFetch 核实摘要)。论文核心结论是”验证而非解决方案生成成了瓶颈”——这正是”审阅退化”在实证上的刻度。本节点据此与 _审阅瓶颈系统化专题·总览 显式对话(见 §6)。
现场四:模拟的规模化外包(scale outsourcing)
- 症状:组织/个人把大量”需要理解才能做”的认知工作整体外包给 LLM,长期看习惯于消费模拟,逐渐丧失自己生成与核验知识的能力。
- 为什么会错:单次接受模拟或许无害,但规模化、长期化后,集体层面真正知识的生产被贫化——大家都在转发模拟,没人在生产辩护。
- 正确做法:在产品和组织流程上区分”可外包的命题检索”与”不可外包的判断生成”,对后者保留摩擦、保留人类的核验环节。
- 真实反例:这条与 Hila “The Epistemological Consequences of Large Language Models”(arXiv:2512.19570,已 WebFetch 核实)的论点同向——LLM 接近外在主义可靠论(可靠传递已建立信息),但无法生成需要理解的”反思性知识”,大规模外包将”贫化反思性知识的生产”。〔此处为合成推论,Hila 论文提供方向性支持,但”集体能力下降”的实证证据本身尚不充分,标为赌注,见 §6 边界。〕
§3 产品 PM 视角补盲:模拟为什么在商业上”卖相更好”
工程 PM 会停在”怎么减少幻觉”。产品 PM 必须看到一个更难的张力:模拟的卖相天然优于知识,而这与认识论安全直接冲突。
- 用户心理模型:用户对”知识”的识别依赖表层信号(流畅、自信、有引用、回答得快)。LLM 在这些信号上全面碾压”诚实但笨拙”的真知识系统(如一个会说”我不确定,这超出我的训练范围”的系统)。结果是:越诚实的 confidence display,用户满意度越低,留存越差。这是产品设计的认识论囚徒困境——对用户认识论最负责的设计,往往是最反增长指标的设计。
- 商业模式:按”流畅交付”计费(chat 轮次、生成 token、任务完成率)的产品,与”按真值负责”的激励完全脱钩。计费结构默认奖励模拟的产量,不奖励真值的兑现。这解释了为什么 confidence display 和 human-in-the-loop 触发器在很多产品里被做得很弱——它们都在给增长指标踩刹车。
- 合规边界:在高风险域(医疗/法律/金融),把模拟当知识的事故有法律后果(见 Mata 案、各国监管对”AI 辅助决策须有有效人类监督”的要求,如 EU AI Act(2024-08-01 正式生效;高风险系统义务自 2026-08-02 适用)对高风险系统的 effective human oversight 条款)。PM 必须把”区分知识与模拟”从认识论问题翻译成责任归属问题:当事故发生,是谁接受了模拟?产品有没有在接受点设防?
一句给面试桌的锋利话:不要比谁的模型答得更对,要比谁的产品更难把模拟当成知识接受。前者是模型团队的 KPI,后者才是 PM 的护城河。
§4 对手框架回应:模拟和知识的边界真有那么清楚吗
接受 + 边界,不做廉价反驳。这里引入两个对本节点构成真实威胁的对手框架。
对手一:可靠论的”外在主义”立场(Goldman 传统 + 当代 computational reliabilism)。 Alvin Goldman 的过程可靠主义(“What is Justified Belief?”, 1979;Epistemology and Cognition, 1986)主张:信念有辩护,当且仅当它由可靠的认知过程产生——不要求认识者能反思性地理解这个过程。Juan Durán 与 Nico Formanek “Grounds for Trust: Essential Epistemic Opacity and Computational Reliabilism”(2019,arXiv:1904.01052,已核实)据此论证:计算系统的输出可以被信任,即便不透明,只要满足验证、鲁棒性、历史成功记录、专家判断等可靠性指标。按这个框架,如果某个 LLM 在某域被证明高度可靠,那么用户接受它的输出就不是认识论事故,而是有辩护的外在主义知识——“模拟 vs 知识”的二分被瓦解了。
我接受这个框架对的部分:在可靠性可被独立度量、且确实达标的封闭域,“接受 AI 输出”确实可以是有辩护的。一个在数百万案例上验证过、有审计记录的医学影像分类器,其输出对放射科医生而言可以是合法的外在主义辩护来源。本节点的”模拟”刻画在这种情形下应当退让。
但我坚持的边界与赌注:(1) computational reliabilism 要求的可靠性指标——验证程序、历史成功记录——在开放域生成式 LLM 上恰恰最难满足。c13 已论证幻觉架构性不可消除,意味着”可靠性”在开放域是分布相关的、随 distribution shift 失效的,不存在 Durán 框架要的那种稳定可靠过程。(2) 即便外在主义辩护成立,它产出的也只是 Hila 所说的”动物性知识”(可靠传递的真信念),而非”反思性知识”(对为何为真有理解)。对需要理解的任务,外在主义辩护不够。我赌的是:在开放域、高风险、需要理解的场景里,“模拟 vs 知识”的二分仍然成立且决策上必要;在封闭域、可度量可靠性、纯检索的场景里,我承认它弱化。 这条边界恰恰应当成为 human-in-the-loop 触发条件的设计依据——按”是否封闭可靠域”决定要不要把人拉进回路。
对手二:“LLM 携带稀薄语义/默会结构”立场。 Céline Budding “What Do Large Language Models Know? Tacit Knowledge as a Potential Causal-Explanatory Structure”(2025,Philosophy of Science,arXiv:2504.12187,已核实)论证:LLM 的架构满足 Martin Davies(1990)版默会知识的三约束(语义描述、句法结构、因果系统性),因而默会知识可作为解释 LLM 行为的因果—解释框架。若成立,则”模拟”低估了模型——它不是纯查找表式的句法仿真,而是携带了某种结构化的、稀薄的语义。我接受这个框架对的部分:把 LLM 简单等同于查找表是错的,它的内部表征确有可解释的因果结构。但我坚持的边界是:即便有内部结构,这种结构不以真值为目标函数(训练目标是似然),因此不改变本节点的核心论点——产品消费的是输出,而输出的真值绑定依旧空缺;Budding 用的是 Davies 版默会知识,不等同于 Polanyi 原版的”切身承诺”标准(见 §5)。这场争议(Searle 传统 vs. “LLM 有某种理解”派)至今未决,我把”模拟 vs 知识二分在内核层成立”标为赌注而非定论。〔注:另有物理学家 Sabine Hossenfelder 等公众科学人曾就 LLM 是否”有限理解”发表过对立看法,但具体出处与表述未能核实,故此处不以其立场为论据。〕
§5 跨域呼应:维特根斯坦的语言游戏与”模拟”的边界
调度 0601 维特根斯坦 的语言游戏理论,具体展开它如何改变对”模拟 vs 知识”的技术判断,而非装饰性点名。
后期维特根斯坦(《哲学研究》,1953)主张:一个词的意义在于它在语言游戏中的用法,意义不是私有的内在对应,而是嵌在公共的、规则约束的实践里。这给本节点一个反直觉的逼问:如果意义就是用法,而 LLM 恰恰掌握了”用法的统计规律”,那么 LLM 是不是在维特根斯坦的意义上”会用”这些词、因而”懂”?这正是对”模拟”刻画最尖锐的内部攻击。
我的回应改变了判断的精度:LLM 学到的是用法的表层统计规律,但维特根斯坦的语言游戏有一个本节点容易忽略的维度——游戏是有后果的、嵌在生活形式(form of life)里的。“我知道这是水”这个断言在人类语言游戏里之所以是知识断言,是因为说话者要为它负责、要承受它为假时的后果、要在被追问时给出辩护。LLM 玩的是一个被抽掉了责任与后果的语言游戏——它能续写”我知道 X”,但不在任何”知道”的游戏里承担”知道”所要求的承诺。这与 Polanyi 的”热情投入/切身承诺”标准同向(见 Polanyi 默会知识与提示工程的认识论张力:认识者须对其知识有切身承诺,LLM 无此资格)。
这个跨域呼应的产品后果是具体的:“模拟”的边界不在模型内部(懂不懂),而在语言游戏的责任结构里。所以 confidence display 和 citation 系统的真正功能,不是去测量”模型懂多少”,而是在用户与输出之间重建被抽掉的责任结构——把”谁为这个断言负责""它在被追问时能否给出辩护”这两个语言游戏要素,用 UI 重新接回去。这也呼应了 0117社会学 视角下的证言责任:人类证言之所以能传递知识,靠的是可追责的社会结构,而 LLM 证言缺这一环。
§6 与已有节点的关系(升级对照,不复述)
-
对 c13 - 幻觉的不可消除性:对话 + 抽象层升级。 c13 在工程/架构层论证幻觉为何架构性不可消除(Softmax + 概率采样 + 校准反向)。本节点把这一事实升到认识论层重新框定:c13 说的”幻觉不可消除”,在本节点是”即便输出为真也只是 Gettier 式偶然真——真值绑定本就空缺”。c13 的结论是”按永久失败模式设计护栏”;本节点补的是”护栏防的不只是错误输出,更是用户把模拟当知识的接受动作”。不复述 c13 的五分类与四级策略。
-
对 _审阅瓶颈系统化专题·总览:提供认识论地基。 0418 在产品机制层研究审阅为何成为瓶颈、注意力经济如何反转。本节点为它补认识论底座:审阅退化为 rubber-stamping(§2 现场三)本质是”verification(自主可靠评估)→ 被动信念转移”的认识论降级——0418 看到的”审阅瓶颈”,在本节点是”接受模拟的事故被流程合法化”。本节点据此为 0418 的 human-in-the-loop 触发条件提供判据:按§4的”封闭可靠域 vs 开放域”边界设触发。
-
对 _信息检索与知识系统系统化专题·总览:哲学层 vs 产品层。 0427 在知识产品设计层处理 RAG、grounding、引用层。本节点是其下的认识论哲学层:0427 的 citation 系统要解决的”引用可验证”,在本节点是”citation theater——引用形式被仿真、指称空缺”(§2 现场二)的根治。不复述 0427 的检索分层。
-
对 _对齐哲学系统化专题·总览 / _认知科学系统化专题·总览:横向呼应。 0419 的”AI 意识/理解不可判定”与本节点”模拟 vs 知识”是姊妹的不可判定问题(中文屋之争两边都在用);0426 的近端—远端、默会维度为§5 维特根斯坦”用法”论提供认知科学侧证。均不复述。
§7 PM 决策启示
- 面试怎么用:被问”怎么降低 LLM 幻觉”时,先重构问题——“幻觉率只是症状,真问题是产品有没有在’用户接受点’设防,防止把流畅模拟当成知识。我会区分封闭可靠域(可外在主义信任)与开放高风险域(必须重建责任结构)“。30 秒拉开与”加 RAG 加大模型”答案的身位。
- 选型怎么用:评估两个 AI 产品别只比 benchmark 准确率,比它们的接受点防护——confidence 是否反映真实校准而非模型语气、引用是否落地可验、human-in-the-loop 触发是否按风险域分层。
- 复现怎么用:做 LLM-as-judge 或自动审阅时,警惕”评测本身在消费模拟”——judge 模型的流畅评分同样无真值绑定。设计抽样的人类核验项作为 ground truth 锚点(与 Polanyi 默会知识与提示工程的认识论张力 的”评测本身是默会的”同向)。
§8 关联节点
核心(必读)
- c13 - 幻觉的不可消除性 —— 本节点的工程地基,“模拟”的架构性来源
- 0114认识论 —— JTB / Gettier / 可靠论的概念源头
- 0601 维特根斯坦 —— §5 语言游戏与”用法即懂”的逼问
- 幻觉 —— 基础概念卡
- _审阅瓶颈系统化专题·总览 —— verification vs rubber-stamping 的产品层
延伸(可选)
- Polanyi 默会知识与提示工程的认识论张力 —— 切身承诺 / 评测的默会性
- _信息检索与知识系统系统化专题·总览 —— citation 系统 / grounding 产品层
- _对齐哲学系统化专题·总览 —— 理解不可判定的姊妹问题
- _认知科学系统化专题·总览 —— 近端—远端 / 默会维度的认知侧
- 0117社会学 —— 证言责任的社会结构
- RAG —— 一种”给模拟接上真值”的工程尝试及其边界
- Agent —— 当模拟被外包进自主执行回路时风险放大
§9 待建概念清单(死链登记,不在主库建 stub)
- Gettier 问题 / JTB —— vault 内 0114认识论 有概念条目,无独立卡,引用时用 0114认识论
- Goldman / 过程可靠主义 —— 06人 无 Goldman 人物卡,正文以普通文本引述
- Searle / 中文屋 —— 无独立节点,正文普通文本
- 认识论事故(epistemic accident)—— 本节点提出的合成术语,待考虑入概念词典
修订日志
- R1(2026-06-07):首稿。建立”模拟—接受”分析框架;§0 用 Gettier/c13 挡掉准确率框架;§2 四现场四件套(Mata 案、Huemmer 2026、Hila);§4 接入 Goldman/Durán computational reliabilism 与 Budding 2025 两个对手框架并标边界赌注;§5 维特根斯坦语言游戏跨域呼应落到 confidence/citation 的责任结构设计;§6 与 c13/0418/0427/0419/0426 显式升级对照。
- R1 grounding pass(2026-06-07):WebSearch 核实 Mata v. Avianca(678 F.Supp.3d 443,22-cv-1461 (PKC),Castel 法官,Varghese 925 F.3d 1339,Rule 11 罚款 5000 美元);WebFetch 核实 Huemmer 2026 全部数值(73.9/68.1/47.8/34.6,难度梯度 95.2→81.0→66.7→47.8);撤下未能核实出处的 Hossenfelder 2023”有限理解”论据,改以已核实的 Budding 2025(arXiv:2504.12187)作为对手框架二。剩余待核实项:EU AI Act effective human oversight 条款具体表述〔待核实〕、§2 现场四”集体能力下降”实证(已标赌注,Hila arXiv:2512.19570 仅提供方向性支持)。
- 2026-06-12 内审修复:§合规边界 EU AI Act 生效口径由模糊”2024”统一为”2024-08-01 正式生效;高风险系统义务自 2026-08-02 适用”(权威值,呼应总览 §8 QC #5);条款具体表述仍诚实保留〔待核实〕。