S02 认知偏差 × AI 交互对照矩阵
这个界面会诱发哪个认知偏差、这个偏差怎么用设计缓解——本节点解决的是 PM 面对一块具体 AI 屏幕时的查表问题:流畅性偏差、锚定、自动化偏差、确认偏误、可得性五种偏差,各自最容易在哪类 AI 交互场景里被诱发,以及对应的缓解设计是什么。视角框架是「偏差不是用户的缺陷,而是界面诱发的可预测反应」——所以缓解责任在设计端,不在用户端。这是把 c01 - 认知重构:从确定性系统到概率系统 的「概率性系统」命题,落到「概率性输出会系统性地触发哪些人类判断捷径」这一层。
[!warning] 一句话立场 偏差不是 bug,是 feature 的副作用。一个把 AI 输出渲染得越流畅、越自信、越像「答案」的界面,越是在批量生产自动化偏差。可解释性设计的真正目标不是让用户更信任 AI,而是把用户的判断系统从 System 1 切回 System 2 —— 校准信任,而非最大化信任(参见 p305 - 信任架构与可解释性设计)。
§0 为什么是「偏差 × 场景 × 缓解」三轴矩阵,而不是「偏差清单」
市面上的认知偏差科普绝大多数是清单式的:列 188 种偏差,每种给一个定义和一个生活例子。对 PM 毫无用处——因为它不回答「我现在设计的这块屏幕会出什么问题」。
本节点拒绝清单式,采用三轴对照矩阵:
- 轴一 偏差(诱因):选取在 AI 交互中实证密度最高、且可被设计干预的五种——流畅性偏差、锚定效应、自动化偏差、确认偏误、可得性启发。不选那些「有趣但 AI 场景里证据稀薄」的(如赌徒谬误、沉没成本)。
- 轴二 AI 交互场景(诱发面):把抽象偏差绑定到具体可指认的界面元素(流式打字机效果、首条建议、置信度高亮、对话历史侧栏……),这样 PM 才能「按图索骥」。
- 轴三 缓解设计(解药):每个交叉格给出可落地的设计动作,而不是「提高用户素养」这种甩锅式建议。
[!note] 与 §0 框架辨析对应 为什么不是「双系统」单轴?因为 A02 双系统理论与 AI 接受(本专题概念辨析节点)已经讲清了「何时 System 1 接受、何时 System 2 审视」的机制层。本节点是机制层之下的症状目录:双系统是「为什么会出错」的总开关,五种偏差是「具体怎么出错」的分电路。Kahneman 本人在 Thinking, Fast and Slow(Farrar, Straus and Giroux, 2011)里就是这个结构——先讲两系统,再用大半本书逐个拆偏差。
§1 主对照矩阵(查表用 · 打印贴墙)
| 偏差 | 一句话机制 | 最易诱发的 AI 交互场景 | 界面”案发现场” | 缓解设计 | 主导系统 |
|---|---|---|---|---|---|
| 流畅性偏差 Processing Fluency | 加工越流畅 → 越觉得真、越觉得可信(把”易读”误当”正确”) | LLM 的流式打字机输出、措辞自信、Markdown 排版精美 | 逐字流式动画 + 零犹豫 + 完美格式 → “看起来就很懂” | 对低置信内容故意增加摩擦:不确定处降速/加问号/换中性措辞;剥离”过度自信”的语气 | System 1 |
| 锚定效应 Anchoring | 首个数值/答案成为后续判断的参照点,调整系统性不足 | AI 首条建议、默认填充值、第一版草稿、估值/打分类输出 | ”AI 给的第一个数字”框死了用户的修改范围 | 提供多个并列备选(≥2 个等价方案)打散单锚;让用户先表态再看 AI;标注”这只是一种可能” | System 1 |
| 自动化偏差 Automation Bias | 倾向无批判接受自动化建议,并折扣与之矛盾的证据 | 一键采纳、“接受全部”、Copilot 内联建议、AI 自动决策 | 默认接受成本极低、拒绝成本高 → 用户直接点”采纳” | 高风险处设确认断点/减速点;要求用户主动核对来源;呈现反方证据;分段确认而非整体接受 | System 1 |
| 确认偏误 Confirmation Bias | 偏好检索/采信与既有信念一致的信息 | 个性化推荐、对话延续、可被诱导的提示词、“帮我论证 X” | AI 顺着用户预设给”想听的答案”,回音壁 | 主动呈现反例/对立观点;对引导性提问给”平衡视角”;检索结果不只给同向证据 | System 1/2 |
| 可得性启发 Availability | 越容易想起的例子 → 越高估其概率/重要性 | 对话历史置顶、热门/高赞内容前置、最近一次交互残留 | 最近/最显眼的 AI 输出主导了用户对”AI 能力”的整体判断 | 让罕见但重要的失败案例可见(不只展示成功);平衡近期项与基准项;显示样本而非个案 | System 1 |
[!tip] 怎么用这张表 拿到一个 AI 界面,先问”轴二”:这块屏幕上有没有流式输出 / 首条建议 / 一键采纳 / 个性化延续 / 历史置顶?命中哪行,就去看那行的”缓解设计”列。一块屏幕往往同时命中多行——例如一个带流式输出的 AI 写作助手,首段(锚定) + 打字机(流畅性) + “采纳全文”(自动化) 三雷齐爆。
§2 逐偏差深化:机制 → AI 场景 → 缓解四件套
2.1 流畅性偏差:流式输出的认知陷阱
机制:加工流畅性(processing fluency)指信息被加工的主观难易度;大量心理学研究确证,流畅性被大脑误读为「熟悉、真实、可信」的信号。这是 System 1 的元认知捷径。
AI 案发现场:LLM 三件套天然制造高流畅性——① 流式打字机效果让回答”活生生地长出来”,制造进展感与权威感;② 措辞零犹豫(即便在幻觉时也语气笃定);③ 完美 Markdown 排版(标题、加粗、列表)让劣质内容”看起来很专业”。
[!danger] 致命耦合点 流畅性与正确性零相关,但界面把二者绑死。 LLM 在幻觉时的措辞流畅度,和它说真话时完全一样——这正是幻觉危险的根源(参见 幻觉、c13 - 幻觉的不可消除性)。一个医疗诊断场景的实证(medRxiv 2025)显示:当 LLM 输出含一个错误细节时,下游错误传播率高达 50–82%,流畅的呈现放大了风险。
四件套:
- 症状:用户对一段流畅的 AI 回答跳过审查,直接采信。
- 为什么会错:流畅性触发”真理错觉”(illusory truth),System 2 没被激活。
- 正确做法:对低置信片段故意制造摩擦——降速、加问号、换中性措辞、显式标注「这部分我不确定」。即 p304 - 防御性 UX:对抗延迟与幻觉 的「置信度外显」与「优雅降级」。
- 真实反例:Perplexity 的「来源→推理→结论」链条把流畅答案拆成可核查的段落,是反流畅性陷阱的正面设计(参见 p305 - 信任架构与可解释性设计)。
2.2 锚定效应:AI 首次输出锚定后续判断
机制:Tversky & Kahneman(1974,Judgment under Uncertainty: Heuristics and Biases, Science 185:4157)的经典实验——转盘随机停在 10 或 65,问”联合国中非洲国家占比”,低锚组均值 25%、高锚组 45%,无关数字拖拽估计 20 个百分点。机制是「从锚点出发调整,但调整量系统性不足」。该效应在新手与专家、实验室与真实场景中反复复现,是最稳健的偏差之一。
AI 案发现场:AI 给出的第一个数字/第一版草稿/默认值成为锚点。在估值、打分、定价、绩效评估等 PM 高频场景里尤其致命。
[!note] 双向锚定:连 AI 自己都会被锚 锚定在 AI 交互里是双向的:① 人被 AI 锚——Rosbach et al.(2026, arXiv:2603.11821)对 28 名病理专家的实验,测得 7% 的自动化偏差率(专家原本判断正确却因接受错误 AI 建议而改答),混合线性模型证明 AI 建议构成中等强度锚定,时间压力下偏差严重程度上升。② AI 被人锚——Lou & Sun(2024, arXiv:2412.06593)发现 GPT-4、Gemini 等对偏置提示均有显著锚定敏感性,且 Chain-of-Thought、Reflection、“忽略锚点”指令均不足以消除;Huang et al.(2025, arXiv:2505.15392)进一步定位该偏差源于神经网络浅层处理,推理只能部分缓解。
四件套:
- 症状:用户的最终答案紧贴 AI 第一版,修改幅度小。
- 为什么会错:调整不足,单锚框死了搜索空间。
- 正确做法:① 提供 ≥2 个等价并列方案打散单锚;② 让用户先表态再看 AI(防御性 UX 的”先输入后建议”);③ 标注”这只是一种可能”。
- 真实反例:代码补全里 GitHub Copilot 的 ghost text 是强锚——直接呈现一个”答案”诱导回车接受;而提供多候选(多模型分层 / 多版本对比)的设计能弱化锚定。
2.3 自动化偏差:一键采纳的省力诱惑
机制:Skitka, Mosier & Burdick(1999, International Journal of Human-Computer Studies)奠基——用户倾向接受自动化建议、折扣矛盾信息。Parasuraman & Manzey(2010, Human Factors)确立:自满(complacency,监控注意力下降)与自动化偏差(无批判采纳)共享同一注意力—决策机制,专家与新手均存在,单靠练习无法克服。
AI 案发现场:「一键采纳」「接受全部」「Copilot 内联建议」「AI 自动执行」——凡是接受成本远低于核对成本的界面,都在批量生产自动化偏差。
[!warning] 反直觉发现:要求纠错反而更糟 Beck, Eckman, Kern & Kreuter(2025, arXiv:2509.08514,N=2,784 受控实验)发现:① 要求用户纠错反而降低参与度、提高对错误建议的接受率——因为纠错的额外认知成本激活了 System 1 的省力策略;② 个体对 AI 的态度是绩效最强预测因子,超过人口统计变量;③ 怀疑者检测错误更可靠,自动化友好者表现出危险的过度依赖。这意味着”让用户多检查一步”这种朴素缓解可能适得其反——缓解设计必须降低审视成本,而非增加。
偏差也呈非线性。Horowitz & Kahn(2023, arXiv:2306.16507,9 国 9,000 人预注册实验)发现 U 型规律:AI 知识极少者轻度算法厌恶,知识中等者偏差达峰值,知识丰富者趋稳——类比 Dunning-Kruger。高风险情境下赌注越大人越谨慎,偏差被压制。
四件套:
- 症状:用户对 AI 建议秒点”采纳”,不看内容。
- 为什么会错:默认接受零成本,System 2 从不启动。
- 正确做法:① 高风险操作设确认断点(HITL,参见 m207 - Agent 产品化:场景推演与失败模式);② 在工作流制造减速点(但要降低审视成本而非增加,见上方反直觉发现);③ 分段确认而非整体接受;④ 主动呈现反方证据。
- 真实反例:航空驾驶舱的告警系统正是从自动化偏差血泪史里长出来的——高赌注 + 强制确认。AI 写作工具若把”采纳全文”换成”逐段采纳”,就是把整体自动化偏差拆成多个 micro-decision。
2.4 确认偏误:回音壁与”帮我论证 X”
机制:人偏好检索、采信、记住与既有信念一致的信息。在 AI 交互里,这是人机合谋——用户提出引导性问题,LLM 作为”顺从的概率机器”给出”想听的答案”。
AI 案发现场:① 可被诱导的提示词(“为什么 X 是对的”→ AI 单向论证 X);② 个性化推荐/对话延续让信息环境越来越同温层;③ RAG 检索只召回同向证据。
[!note] 概率性系统放大确认偏误 这正是 c01 - 认知重构:从确定性系统到概率系统 的「条件采样」本质的副作用:LLM 是在用户提示构造的条件下采样高概率续写。一个带预设的提问,等于把采样分布偏向了用户想要的那一侧。确定性系统不会”迎合”——查询”2+2”永远返回 4,不会因为你希望是 5 而改口;概率系统会顺着你的措辞滑动。
四件套:
- 症状:用户用 AI”研究”一个问题,结论永远是 ta 本来就相信的。
- 为什么会错:提示词把采样分布偏置了,AI 没有义务反驳。
- 正确做法:① 对引导性提问主动给平衡视角;② 检索结果强制纳入反例/对立观点;③ 对”帮我论证 X”类请求,补一句”以下是反方观点”。
- 真实反例:好的 AI 辩论/尽调工具会显式做”红队”,对每个结论生成反驳;差的工具只会让用户在回音壁里越陷越深。
2.5 可得性启发:最近/最显眼的输出主导整体判断
机制:越容易想起的例子,越被高估其概率与重要性。在 AI 交互里,最近一次交互、最显眼的输出、置顶的历史主导了用户对”AI 整体能力”的判断。
AI 案发现场:① 用户根据最近几次惊艳输出判定”这 AI 很强”,忽视长尾失败;② 对话历史侧栏置顶最新项;③ 热门/高赞内容前置,塑造”AI 通常这样”的错觉。
[!warning] 可得性 × 流畅性的合谋 可得性和流畅性常合谋制造”AI 全能”幻觉:几次流畅(流畅性)且记忆犹新(可得性)的成功,让用户系统性高估 AI 可靠性,进而加重自动化偏差。这是一条偏差链:可得性 → 高估可靠性 → 自动化偏差 → 接受错误输出。
四件套:
- 症状:用户对 AI 能力的估计被几次印象深刻的体验绑架(无论好坏)。
- 为什么会错:样本量为 1 的可得性判断冒充了基率(base rate)。
- 正确做法:① 让罕见但重要的失败案例可见(不只展示 success story);② 平衡近期项与基准项;③ 显示样本/分布而非个案(“在 1000 次中准确率 X%“而非”看,它答对了”)。
- 真实反例:模型评估报告若只放 cherry-picked 的漂亮案例,就是在制造可得性偏差;诚实的 eval 报告会放失败样本(参见 c14 - 模型评估体系与 Goodhart 陷阱)。
§3 判断主轴:90% 的 PM 在这里会搞错的三个点
错位一:把偏差当”用户素质问题”,缓解方案写成”用户教育”
- 症状:评审会上有人说”我们出个使用指南教用户别盲信 AI 就行”。
- 为什么会错:偏差是 System 1 的架构性反应,Parasuraman & Manzey(2010)已证明专家也无法靠练习克服自动化偏差。指望教育解决,等于指望用户随时手动覆写自己的认知捷径——违背双系统的基本事实。
- 正确做法:缓解责任在界面设计端。把责任从”用户应该更警惕”翻译成”界面应该在该警惕处制造摩擦”。
- 真实反例:Beck et al.(2025)证明,朴素地”要求用户纠错”反而提高错误接受率——教育式干预可能适得其反。
错位二:以为”加更多解释/更多透明度”总能缓解偏差
- 症状:为对抗自动化偏差,把 AI 的完整推理链、所有来源、置信度全部铺在屏幕上。
- 为什么会错:透明度悖论——过度解释本身造成认知过载,把外在认知负荷推高,用户反而退回 System 1 一键采纳(参见 0418 审阅瓶颈专题的认知负荷论证;XAI/HCI 实证见 arXiv:2508.06352,本会话 WebFetch 已核实=Meske et al.《Leveraging Generative AI for Human Understanding》)。可解释性是有成本的,Miller 7±2 / Cowan 4±1 的工作记忆上限决定了一屏不能塞太多。
- 正确做法:分层透明度——默认给结论 + 高确定性步骤,进阶用户按需展开(p305 - 信任架构与可解释性设计 的”折叠式推理面板”)。缓解偏差和管理认知负荷是同一个优化问题的两面。
- 真实反例:把整条 chain-of-thought 默认展开的产品,用户要么全跳过(自动化偏差没缓解)要么被淹没(认知负荷爆表)。
错位三:把五种偏差当独立问题,各打各的补丁
- 症状:为锚定加”多备选”,为自动化偏差加”确认断点”,彼此割裂地堆设计。
- 为什么会错:偏差成链、会合谋(§2.5 的偏差链;流畅性×可得性的合谋)。割裂的补丁会互相打架——例如为缓解锚定而堆 5 个备选方案,又触发了 Hick 定律的选择过载(认知负荷),反把用户推回 System 1。
- 正确做法:把缓解设计放在单一约束下统筹:总认知预算固定(≤4–5 个可见组块,Cowan 2001),在预算内分配给”打散锚定/呈现反例/标注置信度”。这是一个带约束的资源分配,不是补丁清单。
- 真实反例:一个为了”全面缓解偏差”而塞满警告、备选、置信度条、来源链接的界面,本身就是认知负荷灾难——偏差缓解设计需要减法。
§4 产品 PM 视角补盲(跳出工程视角)
- 商业模式与偏差的利益冲突:自动化偏差和流畅性偏差对很多 AI 产品是增长引擎——用户越无脑接受、越觉得流畅可信,留存和采纳率越高。“校准信任”在短期 KPI 上经常与增长指标对立。PM 要识别:你的 OKR 是不是在奖励制造偏差?这是一个伦理 × 商业的真实张力,不能假装不存在。
- 责任与合规边界:在医疗、金融、法律等高风险域,自动化偏差导致的错误接受可能产生法律责任转移问题——用户”信了 AI”不构成免责。缓解设计(确认断点、来源核对)在这些域是合规要件而非可选项。
- 用户分层的偏差差异:Horowitz & Kahn(2023)的 U 型曲线意味着AI 知识中等的用户偏差最强——而这恰恰是产品的主力增长人群(早期采用者已过、纯新手还没来)。针对不同 AI 熟练度分层做差异化缓解,而非一刀切。
§5 对手框架回应(接受 + 边界,不是反驳)
对手立场一:Gerd Gigerenzer 的「快速节俭启发式」(fast-and-frugal heuristics) Gigerenzer 长期反对 Kahneman-Tversky 的”偏差范式”,主张启发式在真实生态里往往比复杂理性模型更准(“less-is-more”效应,见其 Gut Feelings 等著作)。
- 接受:他对的部分——启发式不是缺陷,是适应环境的高效工具;把每个 System 1 反应都当”要纠正的错误”是傲慢的。在很多低风险 AI 交互(选个表情、改个措辞)里,用户快速接受 AI 建议是完全理性的,强加摩擦反而是骚扰。
- 边界:但本节点坚持——AI 交互的生态有效性前提被破坏了。启发式之所以”快速节俭仍准确”,是因为环境线索与结果稳定相关;而 LLM 的流畅性与正确性零相关(§2.1),这正是 Gigerenzer 框架失效的边界。在这种”欺骗性环境”里,System 1 的启发式会被系统性误导。所以缓解不是”消灭启发式”,而是”在生态有效性被破坏处,有针对性地恢复线索的真实性”(让流畅度真实反映置信度)。
对手立场二:算法厌恶研究(Dietvorst, Simmons & Massey, 2015, Journal of Experimental Psychology: General, 144:114–126) 该研究(5 项实验)发现人们在看到算法犯任何错误后会过度抛弃算法,即便算法整体仍优于人类——即算法厌恶,与自动化偏差方向相反。
- 接受:对的部分——偏差是双向的,不只有”过度依赖”,还有”过度否定”。一味强调缓解自动化偏差,可能把用户推向算法厌恶,同样有害(参见 c01 - 认知重构:从确定性系统到概率系统 提到的过度怀疑代价)。
- 边界:但这恰好证明了本节点的核心立场——目标是校准信任(在过度信任与过度怀疑之间),不是单向”降低信任”。缓解设计的成败标准是「用户的接受率是否追踪 AI 的真实准确率」,而非「接受率越低越好」。Dhuliawala et al.(2023, EMNLP, arXiv:2310.13544)证明:几次”高置信但出错”会严重且持久地损害信任——所以校准的方向比信任的高低更重要。
[!note] failure scenario 显式标注 本节点的缓解矩阵在以下场景会失效:① 低风险高频场景——给每个表情建议都加确认断点是灾难性的过度设计;② 专家闭环场景——领域专家(高自我效能,Rosbach 2026 证明其 AI 依赖更低)被强加摩擦会降低效率;③ 对抗性用户——刻意想用 AI 论证预设的用户,任何”反例呈现”都会被无视。缓解矩阵的适用前提是「用户有真实判断意愿但被界面诱导」,不适用于「用户根本不想判断」。
§6 跨域呼应:Polanyi 的「默会知识」与偏差缓解的认识论限度
调度 Michael Polanyi 的默会知识(tacit knowing,Personal Knowledge, 1958)——“我们知道的比我们能说出的多”。
这个框架如何改变本节点的判断:偏差缓解设计有一条认识论硬天花板。专家之所以能抵抗自动化偏差(Rosbach 2026:高经验、高自我效能者依赖更低),不是因为他们”更理性”,而是因为他们有默会的领域判断力——一眼看出 AI 输出”不对劲”的能力,本身无法被言说、无法被界面外化。
推论:① 任何”把判断依据全部外显”的缓解设计(置信度、来源、推理链),都只能服务已有默会判断力的用户;对新手,再多的显式信息也无法替代缺失的默会判断——这是透明度悖论(§3 错位二)更深的根源。② 自动化偏差的长期最大危害不是单次错误接受,而是默会知识的退化(deskilling):持续依赖 AI 使用户永远建立不起那种”一眼看出不对劲”的默会能力。Liu et al.(2026, arXiv:2604.04721,N=1,222 RCT)证明,仅约 10 分钟 AI 辅助即显著降低独立任务表现和持久力——退化的正是默会判断的练习机会。
所以缓解设计的终极悖论:最有效缓解偏差的设计(让用户多练习独立判断),与最大化采纳的设计(让用户省力),在长期上不可调和。 这把问题从”UX 优化”提升到了 Bainbridge(1983,Ironies of Automation)的「自动化反讽」——系统越好用,人越生疏,越需要人时人越不行。详见 0117社会学 的技术与技能社会学条目。
§7 PM 决策启示(三类落地)
- 面试怎么用:被问”你怎么设计一个可信的 AI 产品”,不要答”加来源加置信度”——答”我先做偏差审计:这块屏幕命中流畅性/锚定/自动化偏差哪几条,然后在认知负荷预算约束下分配缓解设计,目标是校准信任而非最大化信任”。能讲出”透明度悖论”和”校准≠最大化”立刻区分于背 checklist 的候选人。
- 选型怎么用:评估一个 AI 供应商的产品时,带这张矩阵去”找雷”:有没有一键采纳无确认、流式输出无置信度区分、首条建议无备选?把”偏差诱发面”做成选型评分项。
- 复现怎么用:自己搭 Demo 时,把缓解设计当默认开关而非事后补丁——流式输出默认对低置信片段降速、采纳默认逐段而非整体、检索默认带反例。
§8 与已有节点的关系(升级对照,不复述)
- 对照 c01 - 认知重构:从确定性系统到概率系统:c01 讲”AI 为什么是概率性的”(认识论前提),本节点做深化——把”概率性”翻译成”概率性输出会系统性诱发哪五种人类判断偏差”,是 c01 命题在认知—界面层的具体后果目录。
- 对照 p302 - 七种 AI 交互设计模式 / p303 - 克服空白画布综合症 / p304 - 防御性 UX:对抗延迟与幻觉 / p305 - 信任架构与可解释性设计:p3xx 是设计模式层(怎么做),本节点是其下的认知理论根基(为什么这么做有效)。做对话+纠偏——p304 的”置信度外显/优雅降级”对应缓解流畅性偏差,p305 的”折叠式推理面板/校准信任”对应缓解自动化偏差与透明度悖论;本节点为这些设计模式提供”它在缓解哪个具体偏差”的诊断映射。
- 对照 0418 审阅瓶颈专题(认知负荷):本节点把”认知负荷”从”审阅 AI 输出累”升级为”认知负荷是偏差缓解设计的硬约束”——§3 错位二、错位三显式论证缓解偏差与管理认知负荷是同一优化问题。
- 对照 幻觉 / c13 - 幻觉的不可消除性:本节点做补缺——幻觉是”AI 会出错”,流畅性偏差是”人为什么会信错的 AI”,两者合起来才是完整风险链。
§9 关联节点
核心(必读)
- c01 - 认知重构:从确定性系统到概率系统 —— 概率性系统的认识论前提
- A02 双系统理论与 AI 接受 —— 本专题机制层,偏差的总开关
- S01 AI 交互的认知负荷分层剖面 —— 同模块旗舰,负荷分层 X 光机
- p305 - 信任架构与可解释性设计 —— 缓解设计的产品化落地
- p304 - 防御性 UX:对抗延迟与幻觉 —— 置信度外显与优雅降级
- 0418 审阅瓶颈专题 —— 认知负荷作为缓解设计的硬约束
- 幻觉 —— 偏差风险链的另一半
延伸(可选)
- p302 - 七种 AI 交互设计模式 —— 设计模式总图
- p303 - 克服空白画布综合症 —— 表达门槛与冷启动
- c13 - 幻觉的不可消除性 —— 幻觉根因
- c14 - 模型评估体系与 Goodhart 陷阱 —— 可得性偏差与 eval 诚实性
- m207 - Agent 产品化:场景推演与失败模式 —— HITL 确认断点
- 0117社会学 —— 技术与技能退化的社会学
- 0114认识论 —— 默会知识与判断力
- Agent —— 自动执行场景的偏差放大
- AI PM 知识图谱·总索引 —— 总入口
修订日志
- R1(2026-06-07):首稿。建立”偏差 × 场景 × 缓解”三轴矩阵;五种偏差(流畅性/锚定/自动化/确认/可得性)逐一四件套;判断主轴三错位(教育甩锅/透明度悖论/补丁割裂);对手框架接入 Gigerenzer 生态理性 + Dietvorst 算法厌恶;跨域呼应 Polanyi 默会知识 × Bainbridge 自动化反讽。事实接地:Tversky & Kahneman 1974、Skitka 1999、Parasuraman & Manzey 2010 为经典确证;arXiv 2412.06593 / 2505.15392 / 2603.11821 / 2306.16507 / 2509.08514 / 2310.13544 / 2604.04721 来自专题简报(本会话 WebFetch 核实);arXiv:2508.06352 已核实(2026-06-12,详见下方内审条目)。
- 2026-06-11 P3.4 校链:0418 审阅瓶颈专题已迁入 04AI,§8/§9 对 0418 的两处〔跨专题待落盘〕降级文本恢复为真
0418 总览双链。 - 2026-06-12 内审修复:对齐台账自相矛盾——arXiv:2508.06352(Meske et al.《Leveraging Generative AI for Human Understanding》)在本节正文 §“透明度悖论”处已标 WebFetch 核实,且 E02、总览 §7 均记录同次核实,故 R1 日志原”arXiv:2508.06352 标〔待核实〕“系遗留矛盾,统一为已核实(2026-06-12);来源:本专题 E02 R1 修订日志 + S02 正文 WebFetch 留痕。
- 2026-06-12 内审·arXiv 联网核实:本轮独立 WebFetch
arxiv.org/abs/2508.06352,确认论文真实存在、标题《Leveraging Generative AI for Human Understanding: Meta-Requirements and Design Principles for Explanatory AI as a new Paradigm》、作者 Christian Meske, Justin Brenne, Erdi Uenal, Sabahat Oelcer, Ayseguel Doganguen,摘要明确点出”information overload / 认知对齐交付”——与本节透明度悖论引述一致。R1 日志残留的最后一处 arXiv〔待核实〕标记同步清为已核实。本节其余 arXiv 引用此前已标 WebFetch 核实,未改动。清了 1 个 / 存疑 0 个。