A05 锚定效应与 AI 输出

AI 产品的设计者习惯把注意力放在”输出对不对”上，却很少追问一个更前置的问题：用户第一次看到的那段输出，会不会反过来劫持他对之后所有内容的判断——哪怕第一次是错的？ 这一节用 Tversky 与 Kahneman 的锚定效应（anchoring effect）框架，论证一个对 AI 交互设计有不成比例后果的命题：在概率系统里，首次输出的质量与框定方式，对用户的最终判断拥有结构性的、远超其信息含量的影响力；产品必须把”管理首因”当成一等公民，而不是把它埋在”反正用户可以再问一次”的乐观假设里。

这是一个认知科学命题，不是一个 UI 技巧。它要回答的是：为什么在一个”可以无限重来”的对话系统里，第一次仍然是决定性的。

§0 为什么是锚定效应，而不是”首因效应”或”确认偏误”

读者脑中现成的框架可能是社会心理学的首因效应（primacy effect）——“先出现的信息记得更牢”。但锚定效应说的是更危险的事：锚点不只是”被记住”,它会成为后续数值估计和判断的起算基准，并且调整量系统性不足（insufficient adjustment）。Tversky & Kahneman（1974，Science, 185(4157)，《Judgment under Uncertainty: Heuristics and Biases》）那个著名实验里，一个与问题完全无关的随机转盘数字（停在 10 或 65），就能把”联合国中非洲国家占比”的估计从 25% 拖到 45%，差出 20 个百分点。关键不在记忆，在于人会拿一个起点去锚，然后从锚点往外挪，但挪得不够远。

也容易和确认偏误（confirmation bias）混淆。确认偏误是”我已有一个立场，去找支持它的证据”;锚定是”我本来没有立场，但你给的第一个数字/第一版答案,凭空给了我一个立场”。在 AI 交互里这个区别要命：AI 的首次输出常常进入的是用户完全没有先验的领域（这正是他求助 AI 的原因），于是 AI 的第一版回答不是”被验证的候选”,而是用户心智里凭空出现的第一个、也往往是唯一的锚。

选锚定而非首因/确认偏误，是因为只有锚定框架能解释那个反直觉的事实：即使用户被明确告知”这只是初稿,请批判”、即使他有能力判断对错,首次输出仍然拽着他的最终判断走。 下面的实证会反复印证这一点。

§1 经典锚的三个性质,逐条平移到 AI 输出

锚定效应在五十年的复制研究里被列为最稳健的认知偏差之一(实验室与真实场景、新手与专家群体均复现;来源:Anchoring Effect — Wikipedia 含原始引文;ResearchGate 2019 复制研究)。它有三个对 AI 设计致命的性质:

经典锚的性质	实验室证据	平移到 AI 输出
锚可以完全无关也起作用	随机转盘数字即可拖拽估计(T&K 1974)	AI 给的第一个数字/第一版方案,哪怕是占位、是低置信采样,也会成为锚
告知”这是随机的”也无法消除	受试知道转盘随机,仍被锚	标注”此为草稿”不足以解除锚定;免责声明 ≠ 解锚
专家不免疫,只是程度轻	房产中介对挂牌价锚定	领域专家被 AI 锚的概率更低但非零(见 §4 病理 7% 数据)

这三条合起来,推翻了 AI 产品里一个普遍的隐性假设——“用户拿到的是一个可平等评估的候选答案”。不是。用户拿到的是一个锚。 候选答案在被评估之前,已经先污染了评估它的那把尺子。

§2 概率系统让锚定从”偏差”升级为”结构性风险”

在确定性系统里,第一次输出和第十次输出是同一个值——锚定无从发生,因为不存在”第一版 vs 修订版”的张力(传统计算器按一次和按十次,2+2 永远是 4)。正是概率系统的”同一输入→不同输出”本质,才给了锚定效应施展的舞台。 这一点直接接 c01 - 认知重构：从确定性系统到概率系统 §1.1 的概率分布采样命题:AI 的首次输出只是从一个分布里采的一个样本,但用户的心智会把这个样本当成”分布的中心”乃至”唯一真相”。

这就构成一个不对称:系统知道自己输出的是分布,用户却把第一个样本当成了点估计,并以它为锚。 设计的任务,本质上是在缩小这个”系统的概率本体”与”用户的确定性误读”之间的鸿沟——这正是 p305 - 信任架构与可解释性设计讲的”校准信任”在认知源头上的对应物。p305 是设计模式(怎么做置信度外显、折叠式推理面板),本节是它的认知底座(为什么不做就会被首版采样锚死)。

[!note] 赌注我赌:在概率系统里,锚定效应的产品后果比在传统决策场景里更严重一个量级——因为用户不仅被首版数值锚,还被首版的框定方式(它把问题理解成了什么、采取了什么口吻、罗列了哪几个选项)锚。我可能错的地方:目前直接以”锚定”为框架研究 LLM 人机交互的实验仍少(见 §6),多数证据是从自动化偏差文献侧面推断出来的。这是个有方向性证据、但尚未被直接大样本证实的赌注。

§3 判断主轴:管理首因时,90% 的产品会搞错的四件事

这是本节的命门。AI 产品在”首次输出”上反复栽的四个跟头,每个都给出症状→为什么会错→正确做法→真实反例。

错位一:把”可以重新生成”当成了”锚可以被覆盖”。

症状:产品逻辑是”用户不满意就点重新生成/追问,所以首版不必苛求”。
为什么会错:锚定的核心机制是调整量不足。用户即使重生成,新答案也会被旧答案锚住——他往往是在第一版的框架内微调,而非另起炉灶。重生成≠解锚。
正确做法:把首版当成不可撤销的认知事件来设计;若首版置信度低,宁可不给点估计,先给问题澄清或多候选并列(避免单锚)。
真实反例:Lou & Sun(2024,arXiv:2412.06593)对 GPT-4、Gemini 等主流模型的实验发现,连模型自己对偏置提示都表现出显著锚定敏感,且 Chain-of-Thought、Reflection、“忽略锚点”指令等缓解策略均不充分。如果模型本身都无法靠”再想一遍”解锚,指望用户靠”再问一遍”解锚就更不现实。

错位二:用免责声明替代解锚设计。

症状:在错误的首版下面挂一行”AI 可能出错,请核实”就当尽到了责任。
为什么会错:§1 第二性质——告知”锚是随机的/可能错的”不能解除锚定。免责声明降低的是法律风险,不是认知锚定。
正确做法:用结构而非文字解锚——并列多个候选(打散单锚)、显式标注不确定区间、在高风险处插入主动确认断点(对应 p304 - 防御性 UX：对抗延迟与幻觉的优雅降级与 p305 - 信任架构与可解释性设计的 HITL 断点)。
真实反例:医疗场景(medRxiv 2025)中,当 LLM 输出含一个错误细节时,诊断幻觉被采纳率达 50–82%;免责声明的存在并未阻止自动化偏差放大风险。

错位三:让首版又长又笃定,以为”详尽=可信”。

症状:首次输出洋洋洒洒、口吻斩钉截铁,产品以为这是”高质量”。
为什么会错:高置信 + 出错(overconfident and wrong)是对信任破坏性最强的模式——比”低置信但正确”破坏性大得多(Dhuliawala et al., EMNLP 2023, arXiv:2310.13544)。一个笃定的长答案若错,既加深了锚定,又在暴露后引发信任崩塌,而信任”累积缓慢、崩塌迅速”。
正确做法:首版的笃定程度要与真实置信度校准;不确定时用语言和视觉同时降调,把”这是初步判断”做成可感知的信号而非脚注。
真实反例:Dhuliawala et al. 的纵时研究显示,少数几次”置信度与准确率不匹配”的错误,就会严重且持久地损害用户对 AI 的信任,恢复极慢。

错位四:只防”用户全盘接受”,忽略”用户全盘否定”这个对称陷阱。

症状:所有缓解设计都瞄准”别让用户盲信首版”。
为什么会错:锚定的反面是算法厌恶(algorithmic aversion)——一次糟糕的首版可能把用户锚到”这工具不行”的负向位置,从此过度否定。Horowitz & Kahn(2023,arXiv:2306.16507,9 国 9000 人预注册实验)发现 AI 知识与依赖呈 U 型:知识极少者轻度算法厌恶,知识中等者自动化偏差达峰,类比 Dunning-Kruger。锚可以往两个方向拽。
正确做法:把目标定为校准而非单向的”提升接受”或”提升警惕”;对新用户尤其要管理首版的第一印象,因为它同时锚定了”信不信这个答案”和”信不信这个产品”。
真实反例:同一份 Horowitz & Kahn 数据显示,高风险情境下赌注越大用户越谨慎、偏差被压制——说明用户的锚定位置是被情境调节的,产品不能用一套静态策略通吃。

§4 病理学切片:首因锚定在真实专家身上的强度

把上面四件事落到一个高资质人群的实测上。Rosbach et al.(2026,arXiv:2603.11821,《Stuck on Suggestions》)让 28 名病理学专家在有/无 AI 辅助、有/无时间压力下估计肿瘤细胞百分比,得到一组对设计极有参考价值的数字:

7% 自动化偏差率:专家原本判断正确,却因接受了错误的 AI 建议而改答案。看似不高,但发生在领域专家、有动机仔细看的最有利条件下——这是锚定强度的下限而非上限。
混合线性模型显示 AI 建议系数显著为正,证明存在中等强度的锚定。
时间压力加重严重程度,但未显著提高频率:压力不会让更多人被锚,但会让被锚的人错得更离谱。
调节变量:专业经验与自我效能感越高,对 AI 的依赖越低(与 §1 第三性质一致:专家不免疫,只是轻)。

PM 读这组数字的方式:不要问”用户会不会被锚”,要问”在我的场景里,被锚的那部分用户错得有多致命”。 病理学是高风险场景,7% 已经需要 HITL 断点;在低风险场景(如营销文案初稿),被锚反而是可接受甚至期望的——首版给个起点,正是 p303 - 克服空白画布综合症要解决的冷启动问题。锚定不是绝对的恶,是一个要按场景风险分级管理的力。

§5 产品 PM 视角补盲:锚定不只是认知问题,还是商业与权力问题

跳出工程视角,首版锚定有三个常被工程 PM 看走眼的维度:

商业模式维度——锚是可被设计偏置的。 如果首版默认推荐的方案恰好是平台佣金更高的那个,锚定效应就成了暗模式(dark pattern)的认知引擎。用户以为自己在 AI 给的”中立首版”上做选择,实际上选择空间已被锚预设。这是合规与伦理红线。
用户心理维度——首版定义了用户的”心智模型起点”。 用户对一个 AI 产品”能做什么”的理解,极大程度由头几次交互的首版输出锚定。一次把简单问题答得过度复杂的首版,会让用户长期高估使用成本而流失。
GTM 维度——demo 即锚。 销售 demo、首屏示例 prompt 给出的首版输出,会锚定整个采购方对产品能力的预期。一个过度打磨的 demo 首版,会把真实使用体验锚到”不如 demo”的失望区。

§6 对手框架回应:锚定框架自己的边界

接受:双系统/启发式偏差范式本身正在被质疑。 Melnikoff & Bargh(2018,Trends in Cognitive Sciences,《The Mythical Number Two》,DOI:10.1016/j.tics.2018.02.001)指出,启发式-偏差框架在预测失败时总能诉诸”第三因素”来解释,结构上抗反驳。把锚定效应当成一个可独立测量、机制清晰的实体,可能是过度具体化。我接受这一批评的对的部分:本节不应宣称”锚定”是一个像电荷一样确切的认知常量。

但坚持的边界: 即便”锚定”作为理论实体存疑,作为可复现的现象它的稳健性五十年未被撼动——这对 PM 决策足够了。我不需要它机制纯粹,只需要它”在你的产品里大概率会发生,且方向可预测”。Huang et al.(2025,arXiv:2505.15392,SynAnchors 数据集)进一步发现 LLM 的锚定源于浅层网络处理而非深度推理,推理过程可部分缓解但无法根除——这说明它至少在 LLM 这一侧有可定位的机制承载,不全是”抗反驳的幽灵”。

未读对手框架的引入(破 echo chamber): Gerd Gigerenzer 的**生态理性(ecological rationality)**学派会反问:把锚定一律当”偏差”是 Kahneman 范式的傲慢——在信息不足时,拿第一个可得信息当起点本身是适应性的快速启发式,不必然是缺陷。这个反方很有力,它提醒 PM:首版锚定在低风险、需快速起步的场景(空白画布)里是 feature,不是 bug(呼应 §4 的风险分级)。把所有锚定都当成要消除的偏差,会过度设计、拖慢交互。

显式 failure scenario: 本节”首版有不成比例影响”的结论,在用户高度专业且低时间压力的场景下会减弱(Rosbach 数据:经验越高依赖越低);在用户对该 AI 已建立成熟心智模型的场景下也会减弱(老用户不再把首版当唯一锚)。结论最强的地方是新用户 + 陌生领域 + 中等时间压力——这恰恰是大多数 C 端 AI 产品的主战场。

§7 跨域呼应:维特根斯坦的”第一步”与判断的语法

[!note] 跨域调度维特根斯坦在《论确定性》(On Certainty, §471:“It is so difficult to find the beginning”)里有一个对锚定极有穿透力的洞见:最难的是找到”从哪里开始”。 以及他在《哲学研究》中反复强调的——我们用什么概念去框定(framing)一个问题,已经决定了能给出什么答案(语言游戏的”语法”先于具体判断)。

把这个移到 AI 交互:AI 的首次输出不只是”一个答案”,它是对问题的一次框定(framing)——它已经决定了把用户的模糊请求理解成了什么、用什么概念格点(grid)去切分它、把哪些选项摆上桌、把哪些默默排除。用户随后的”调整”全都发生在这个被给定的框架之内。这就是为什么锚定的影响”不成比例”:锚定的不只是数值,是问题的语法。维特根斯坦提醒 PM 的事是:真正的设计权力不在”答得对不对”,而在”用什么框架把问题接住的第一下”。 一个把开放问题强行框成单选题的首版,锁死的是用户的整个思考空间——这比一个数字错了严重得多。这条呼应链入 0114认识论(框定即认识的前结构)。

§8 PM 决策启示:面试 / 选型 / 复现

面试怎么用: 当被问”你怎么评估一个 AI 功能的质量”,不要只答准确率。答:“我会区分首版与修订版,因为锚定效应——Tversky-Kahneman 1974 的稳健结论——意味着首次输出对用户最终判断有不成比例的影响。我会专门为’高风险场景下错误的首版’设计 HITL 断点,因为 Rosbach 2026 显示连病理专家都有 7% 的自动化偏差率。“这一句话同时展示了认知科学底座 + 产品落地 + 接地证据。
选型怎么用: 评估模型时,不只看 benchmark 平均分,要看首 token 后的笃定程度是否与置信度校准——一个倾向于”高置信地说错话”的模型(overconfident and wrong)在交互产品里比一个老实承认不确定的模型危险得多(Dhuliawala 2023)。
复现怎么用: 做 prototype 时,刻意做 A/B——A 组首版给单一笃定答案,B 组首版给”2–3 个候选 + 不确定标注”。测量用户最终决策质量与修改深度。预期:B 组解锚更彻底、错误传染更少,但首次满意度可能略低(这正是校准 vs 即时满足的权衡)。

§9 与已有节点的关系

对 c01 - 认知重构：从确定性系统到概率系统:深化。c01 论证”AI 是概率系统、输出是分布采样”;本节接着论证”用户会把首个采样误当点估计并以之为锚”,把 c01 的本体论命题落到一个具体的认知后果上。不复述 c01 的概率分布基础。
对 p305 - 信任架构与可解释性设计:提供底座。p305 讲”校准信任”的设计模式;本节提供它的认知动因——首版锚定正是”过度信任/过度怀疑”的发生学源头。p305 是 how,本节是 why。
对 p304 - 防御性 UX：对抗延迟与幻觉:补缺。p304 的”优雅降级”和”置信度外显”在本节获得了一个新的论证理由:它们不只是防幻觉,更是解锚手段。
对 p303 - 克服空白画布综合症:对话/纠偏。p303 把”给首版起点”当成解药(对抗冷启动);本节补一个边界——同一个首版起点,在高风险场景里是毒(锚死错误判断)。两节合起来才是完整的风险分级图。
对 0426 专题内同级节点(双系统、认知负荷、心智模型、自动化偏差):本节是它们在”时间维度第一击”上的交汇点——锚定是 System 1 快速接受(双系统)、首版高负荷压制审视(认知负荷)、首版定义心智模型起点(心智模型)、首版被无批判采纳(自动化偏差)的共同初始条件。

§10 关联节点

核心(必读)

c01 - 认知重构：从确定性系统到概率系统 — 锚定为何在概率系统才成为结构性风险
p305 - 信任架构与可解释性设计 — 校准信任,本节的设计落地出口
p304 - 防御性 UX：对抗延迟与幻觉 — 优雅降级/置信度外显作为解锚手段
p303 - 克服空白画布综合症 — 首版起点的”解药/毒药”双面性
幻觉 — 高置信错误首版与幻觉采纳率的耦合

延伸(可选)

p302 - 七种 AI 交互设计模式 — 多候选并列、渐进披露等打散单锚的模式
Agent — 多步 Agent 中首步规划对后续步骤的锚定传染
0114认识论 — 框定即认识前结构(维特根斯坦呼应入口)
0117社会学 — 锚作为可被平台偏置的权力技术(暗模式维度)
AI PM 知识图谱·总索引 — 回到知识图谱主干

修订日志

R1(2026-06-07):首稿。建立”首版锚定=概率系统结构性风险”主轴;四件套判断主轴(重生成≠解锚/免责≠解锚/笃定≠可信/对称陷阱);接入 Tversky-Kahneman 1974、Lou&Sun 2024、Huang 2025、Rosbach 2026、Horowitz&Kahn 2023、Dhuliawala 2023 六组接地证据;Melnikoff&Bargh 2018 与 Gigerenzer 生态理性双反方;维特根斯坦”框定即语法”跨域呼应;与 c01/p303/p304/p305 显式升级对照。