A03 Face Work 与 AI 错误恢复 · 知识库

用户对 AI 犯错的反应，为什么不能用”功能性 bug”的框架去设计错误恢复——而要用 Goffman 的 face work（面子工程）框架？这一节解决的问题是：当一个 AI 道歉的时候，用户接收到的到底是”系统状态通知”还是”一次社交修复”。我的判断是后者，而 90% 的错误恢复设计踩的就是把它当前者的坑。本节的视角框架是 Erving Goffman 的「面子工程」（Face-Work, 1955/1967）——把”AI 犯错”重新定义为「面子威胁事件」（face-threatening act），把”错误恢复”重新定义为「仪式性社交修复」（ritual repair）。

§0 为什么是 face work 而不是”error handling”

读到”AI 犯错恢复”，工程 PM 脑里默认弹出的框架是 HCI 经典的 error handling：检测错误 → 通知用户 → 提供恢复路径（retry / undo / fallback）。这套框架来自 Norman 的《设计心理学》传统，假设错误是「人-工具」回路里的一次状态偏离，目标是让用户用最低成本回到正确状态。这个框架没错，但它对会话式 AI 的错误算少了一项：用户对一个被自己拟人化的对话方犯错，反应不止是功能性挫败，还有社交性失望。

这就是为什么要换 Goffman 的框架。Goffman 在 “On Face-Work”（原发表 1955，收入 Interaction Ritual: Essays on Face-to-Face Behavior, Pantheon, 1967）里定义：面子（face）是个体在一次互动中为自己争取的正面社会形象，“既非内在于人，也非永久属于人”——它是互动现场被分配、被维护、被威胁的临时资产。当互动中出现破坏某方正面形象的事件（说错话、失态、被揭穿），就是一次 face-threatening act，互动双方会本能地启动「修复工作」（corrective work / face-work）来挽回，使互动秩序得以延续。

把这套搬到 AI 上的关键一跳是：用户已经对 AI 做了面子投射。CASA 理论（Reeves & Nass, The Media Equation, 1996；Nass & Moon, “Machines and Mindlessness”, Journal of Social Issues 56, 2000）证明人会”无意识地”（mindlessly）把人际社交脚本套在计算机上。当 AI 犯错，用户调用的不是”工具坏了”脚本，而是”互动对方失态了”脚本——这个脚本里，对方欠我一次社交修复，而不只是一个 retry 按钮。error handling 修的是任务状态，face-work 修的是互动秩序；会话式 AI 的错误同时损坏了这两样，只修前者就会留下一个”它根本没把我当回事”的社交伤口。

[!note] 框架级辨析一句话 error handling 问”用户怎么回到正确状态”；face work 问”这次失态怎么不让互动关系崩掉”。会话式 AI 必须同时回答两个问题，而绝大多数错误设计只回答了第一个。

§1 面子投射：用户为什么对 AI 犯错”动了情绪”

要把 face work 用对，先要看清用户那份”社交性失望”是怎么来的、有多结构化。

ELIZA effect 给了最早的证据。Joseph Weizenbaum 1966 年在 Communications of the ACM 发表 ELIZA（DOCTOR 脚本用模式匹配模拟罗杰斯式治疗师），他本人震惊地发现”极短时间接触一个相对简单的程序，就能在相当正常的人身上诱发强烈的妄念式思维”——他的秘书甚至要求他离开房间好和 ELIZA”独处”。（“ELIZA effect”这个术语其实是 Douglas Hofstadter 1995 年在 Fluid Concepts and Creative Analogies 命名的，不是 Weizenbaum。）一个连”理解”都谈不上的程序，用户都会投射出一个值得隐私独处的”对象”——今天流畅得多的 LLM，投射只会更强。

近期实证把这份投射拆成了可操作的维度。Kadambi et al.（“Anthropomorphism and Trust in Human-Large Language Model interactions”, arXiv:2604.15316，含 Antonio Damasio 合作团队；115 名参与者、2000+ 次人-LLM 交互）发现：温暖度（warmth）与认知共情（cognitive empathy）显著预测拟人化感知、信任、关系亲近度，而能力（competence）预测除拟人化外的几乎所有结果；主观话题（情感建议、生活方式）比客观话题更易激发拟人化。这条很关键：用户对 AI 的”人格期待”主要挂在温暖/共情上，而错误恰恰最容易被读成”温暖崩塌”——它本该体谅我，结果它敷衍我。

这就是 Goffman face-work 两条核心规则的 AI 版错位：用户预期 AI 遵守体谅规则（Rule of Considerateness，维护对方面子），而一个冷冰冰的 error 弹窗违反了这条规则——它没有维护”正在被它服务、刚刚因为它犯错而显得有点蠢”的用户的面子。用户的社交性失望，本质是面子被对方的失态连带损伤后，对方却没有履行修复义务。

§2 把”道歉”重新定义为仪式性修复

Goffman 的修复工作不是单一动作，而是一套有序列的「仪式」。把它落到 AI 道歉设计，可以拆成四个可操作环节（对应 Goffman 的 corrective interchange 结构）：

Goffman 修复环节	含义	AI 错误恢复的对应设计
Challenge（挑战）	标记冒犯发生了	主动承认错误，而非等用户揪出来——“我前面那个数据算错了”
Offering（补偿）	冒犯方提出修复	不只道歉，给出纠正后的正确结果 + 行动计划
Acceptance（接受）	被冒犯方接受补偿	给用户低摩擦的确认/继续路径，不强迫追问
Thanks（致谢）	关系秩序恢复	轻量收尾，不反复道歉拖累对话

这张表的价值在于它给出了为什么”弹个 error”必然不够的结构性解释：一个 error 弹窗只完成了 Challenge（甚至连这个都被动），完全跳过了 Offering 和 Acceptance——而 Goffman 说，修复仪式必须走完序列，互动秩序才能恢复。半途而废的修复，比不修复更显失态，因为它暴露了”对方知道自己错了却不愿意做完整修复”。

实证完全吻合这个结构。HRI/HCI 研究一致显示：仅道歉而无行动计划时，对能力评价的提升有限；同时”道歉 + 提供纠错行动计划”被评为最高能力表现（整合自多项 HRI 研究）。换 Goffman 的话说：只有 Challenge 没有 Offering 的修复，挽回了一点”诚意面子”却没挽回”能力面子”。

更细的颗粒度来自 Ashktorab et al.（“Who’s Sorry Now: User Preferences Among Rote, Empathic, and Explanatory Apologies from LLM Chatbots”, arXiv:2507.02745, IBM Research；预注册研究、162 名 Prolific 参与者、3×3 阶乘设计）：

错误类型	最受偏好道歉类型	关键发现
事实错误	解释性道歉（explanatory）	强烈偏好——用户要”为什么错了”
偏见性错误	共情性道歉（empathic）	此时解释性道歉有时像”找借口”
幻觉/捏造	无显著偏好	用户不确定该期待什么——设计空白区

整体排序：解释性道歉 > 共情性道歉 >> 套话式道歉（rote）。这正是 face-work 的精确化：不同类型的面子威胁，需要不同形态的修复仪式——事实错误威胁的是”能力面子”，要靠解释（恢复对方的可信性）修；偏见错误威胁的是”道德/关系面子”，要靠共情（承认伤害）修；而万能套话式”抱歉给您带来不便”对哪种面子都没修，所以全场垫底。

§3 判断主轴：错误恢复设计的 4 个致命错位

这是本节的命门——把 AI 错误恢复当 error handling 的人，会在这四处系统性翻车，每条带「症状 → 为什么会错 → 正确做法 → 真实反例」。

错位 1：把社交失望误读为功能挫败，于是只给 retry。

症状：用户报错后情绪明显（“你又错了""你到底懂不懂”），产品只给”重试/换个说法”按钮。
为什么会错：设计者用 Norman 的 error 框架，假设用户唯一诉求是回到正确状态。但 Kadambi et al. 显示用户的信任挂在温暖/共情上，纯功能修复没碰那条线。
正确做法：先做 face-work（承认 + 体谅），再给功能恢复路径。Offering 必须包含”对你刚才的处境的承认”，不只是新结果。
真实反例：早期客服 bot 对”你给我的航班号是错的，我差点误机”只回”已为您重新查询如下”——功能上修了，关系上把用户气炸了，因为它跳过了对”差点误机”这个面子受损的承认。

错位 2：套话式道歉滥用，把道歉”廉价化”。

症状：每个回合都”抱歉，作为 AI 我可能会出错”，道歉变成口头禅。
为什么会错：以为道歉越多越显谦逊。但 Ashktorab et al. 证明 rote 道歉是三类里垫底的；HRI 研究也指出频繁道歉降低道歉的信号价值。Goffman 意义上，仪式被滥用就丧失了修复力——修复仪式的有效性来自它标记”这是一次真正的失态”，逢错就道歉等于宣布”我的失态毫无分量”。
正确做法：道歉要稀缺、要匹配错误类型（事实错→解释性，偏见错→共情性），用完整的 Offering 替代重复的 Challenge。
真实反例：某些 LLM 助手对任何质疑都先”您说得对，抱歉”——这恰好和 sycophancy（奉承）合流，道歉沦为讨好，反而削弱可信。

错位 3：忽视署名效应，以为”道歉内容”等于”道歉效果”。

症状：精心写好道歉文案，假设文案好效果就好。
为什么会错：研究发现同样的道歉内容，用户知道是 AI 撰写时真诚度感知显著更低、引发更多负面情绪（“When Chatbots Make Errors”, Telematics and Informatics, 2024）。这是一个去拟人化反效应：人会拟人化到对 AI 犯错动情绪（投射面子），又会在道歉环节突然”想起它是 AI”而打折真诚度。
正确做法：用关系性语气（relational tone）部分调节这一折扣（同研究证实可调节）；不要试图伪装成人类道歉，而是用 AI 能真诚承担的方式——具体、可验证、给出修正机制，而非情感表演。
真实反例：把 AI 道歉写得极尽人类情感化（“我真的非常非常难过让您失望了”），反而触发”它在演”的反感，比朴素的”我错了，正确答案是 X，原因是 Y”更差。

错位 4：对幻觉错误也套用统一道歉模板。

症状：把幻觉当成普通事实错误处理，给一句解释性道歉了事。
为什么会错：Ashktorab et al. 发现用户对幻觉类错误没有明确道歉偏好——这类错误”在概念上对用户仍是模糊的”，用户不知道该期待什么。套用事实错误的解释性模板，会变成”为编造的内容编造解释”，是二次面子威胁。
正确做法：幻觉恢复的重点不在道歉风格，而在让错误可被用户提前识别（不确定性标注、来源可溯，链 p305 - 信任架构与可解释性设计）；事后修复要诚实标注”我之前那段是我编的，没有依据”，而不是给一个像模像样的”解释”。
真实反例：模型捏造一篇不存在的论文被指出后，回”抱歉，可能是我记忆有误，该论文应为……”又编了第二个——把幻觉的修复又变成一次幻觉。

[!warning] 把这条贴墙上错误恢复不是”弹个 error”，是”走完一次社交修复仪式”。仪式走不完（只 Challenge 不 Offering）、走错型（事实错给共情、偏见错给解释）、或滥用到廉价（逢错就道歉），都会让一次小错误升级成关系裂痕。

§4 产品 PM 视角补盲

工程视角到这就够了，但 PM 必须再补三个”看走眼”点：

用户心理模型层：错误恢复设计实际上在校准用户的拟人化预期。修复仪式做得越像人，用户越会把后续的局限也按”人”来期待（“它会道歉，那它应该会记住我刚说的”）——错误恢复和Anthropic「Claude’s Character」式的人格设定要协同，否则”温暖的道歉 + 冷漠的失忆”会制造更大的认知失调。
商业模式层：在订阅制陪伴类产品里，错误恢复是留存杠杆；在一次性工具型产品里，过度社交化的道歉反而是噪音。同一个 face-work 强度，在不同商业模式下是资产还是负债，方向相反——别把陪伴产品的道歉范式抄进生产力工具。
合规边界层：道歉在某些领域是法律承认。医疗、金融、自动驾驶场景，AI 说”是我的错”可能构成责任承认。face-work 的”体谅规则”在这里和法务的”不轻易认责”直接冲突——修复仪式的措辞要过法务，“我错了”和”结果与预期不符，请以官方为准”是两套面子策略。

§5 对手框架回应

接受 + 边界，不反驳。

业界主流反方立场（以 Norman 传统的 HCI 设计者 + 部分极简主义产品观为代表）会说：“别把简单的错误恢复社交化，用户要的是快速回到正确状态，加一堆道歉仪式是摩擦。” 这个立场对很大一部分场景是对的——我接受：在高频、低情感卷入、工具属性强的交互里（代码补全、搜索纠错），最好的 face-work 就是没有 face-work，直接给正确结果就是最大的体谅。

但我坚持的边界是：情感卷入度和拟人化程度越高的产品，error handling 框架的覆盖率越低。Kadambi et al. 证明主观话题、温暖/共情维度上拟人化最强；这些场景里”快速回到正确状态”根本不是用户的全部诉求。我赌的是：随着会话式 AI 渗透到陪伴、咨询、教育这些高卷入场景，face-work 框架的适用面会扩大而非缩小。

[!note] failure scenario（本节结论何时失效）

极低拟人化产品：纯 API、批处理、无对话人格的场景，face-work 是过度设计，error handling 足矣。

专家用户：开发者/重度用户往往明确知道在和工具打交道，社交化道歉对他们是噪音（与”署名效应”叠加更糟）。

跨文化错位：Goffman 框架以西方个人主义互动规范为基础（这是 dramaturgy 的公认争议点之一），东亚语境”面子”指向群体和谐而非个人形象，Ashktorab/Kadambi 等样本又以西方 Prolific/英语用户为主——本节的道歉偏好结论的跨文化外推性〔待核实〕，是明确的待验证区。

[!note] confirmation-bias 砍除本节早期容易反复引”AI 道歉提升好感度”作为正面证据，强化”多道歉=好设计”。这是 bias。补入反例：①署名效应（AI 道歉真诚度被打折）；②道歉廉价化（频繁道歉降低信号价值）；③推理型模型会用貌似合理的论证包装道歉性结论使其更难察觉（“Good Arguments Against People Pleasers”, arXiv:2603.16643, 2026）。道歉不是越多越好，是越准越好。

§6 跨域呼应：Goffman 面子工程

本节调度的跨域资源就是主框架本身——Erving Goffman 的拟剧论与面子工程，这里把它对本技术问题的具体改判讲透，而非装饰性点名。

Goffman 的根本贡献是把”互动”从心理学的”个体行为”提升为社会学的”仪式秩序”：互动不是两个人各自做事，而是双方共同维护一个脆弱的、需要持续修复的「社会场」。这一步改判直接重写了”AI 错误”的本体论——错误不是 AI 这一端的故障，而是”AI-用户互动秩序”这个共同体的一次破裂。故障是单方的，破裂是双方的；修复故障是 debug，修复破裂是 ritual。

具体落地有三处不可替代：（1）它解释了为什么纯功能修复留下社交伤口——因为它只修了 AI 端的输出，没修共同维护的互动秩序；（2）它的”修复仪式必须走完序列”给出了”为什么只 Challenge 不 Offering 比不修复更糟”的结构性预测，这是 error handling 框架推不出来的；（3）它的”体谅规则”把”道歉措辞”从文案问题升级为”维护对方面子”的策略问题，直接解释了署名效应（用户在道歉环节意识到”它没有面子可输，所以它的体谅是免费的，因而廉价”）。

但要标 Goffman 的边界：Goffman 的互动双方都是有面子可输的真实主体——双向对称。AI 这一端没有面子可输（这正是署名效应的根源），所以 AI-用户的 face-work 是不对称的：用户的面子是真的，AI 的”面子”是用户投射的。这个不对称是 Goffman 原框架没有的，是把它用于 AI 时必须显式承担的改造。（关联 0117社会学、0115道德哲学-伦理学。）

§7 PM 决策启示

面试怎么用：被问”怎么设计 AI 的错误处理”，不要答 retry/fallback 那套——答”我把它分成两层：功能层用 error handling，社交层用 Goffman face-work，并按错误类型（事实/偏见/幻觉）选道歉形态（解释性/共情性/不道歉只标注），还要考虑署名效应和法务认责边界”。一句话把技术博客答案升级成产品决策框架。
选型怎么用：评估对话产品的错误恢复成熟度，别只看”会不会道歉”，看四件事：是否主动 Challenge、Offering 是否含纠正后结果+行动计划、道歉形态是否随错误类型变化、是否对幻觉做了”可提前识别”而非”事后编解释”。
复现怎么用：做错误恢复模块时，先建一张”错误类型 × 道歉形态 × 商业场景”的决策表（本节 §2、§3 可直接转成 prompt 的 system 规则），再用 Ashktorab 的三类错误做 A/B，而不是上来就写一个万能道歉模板。

§8 与已有节点的关系

对照 p305 - 信任架构与可解释性设计：p305 讲信任的校准（calibrated trust，事前防过度信任/过度怀疑），本节讲信任的修复（破裂之后怎么补）——是 p305 在”错误已发生”时间点上的下游补缺。p305 的不确定性标注、可解释面板是本节”幻觉错误让其可提前识别”的实现底座，二者互为前后件，不复述 p305 的事实基础。
对照本专题 A04 Performativity·AI Persona 的表演性建构（Butler 分支）：A04 解决”AI 人格是被反复表演建构的、没有先在本质”，本节是其推论之一——既然人格是每次互动表演出来的，那么一次失态的修复就是人格一致性的关键表演时刻，搞砸修复 = 人格当场崩人设。
对照本专题 A02 前台后台与 AI 推理可见性 / A05 印象管理与 AI 人设设计：A02/A05 讲常态下的印象管理（前台维持），本节讲前台破裂时的应急管理，是同一拟剧框架的”异常分支”。
链入幻觉：本节把幻觉错误单列为”无明确道歉偏好”的特殊类，是对幻觉节点在”用户接受面”的补充——幻觉不只是技术不可消除性问题，也是一个无成熟修复仪式的社交难题。

§9 关联节点

核心（必读）

延伸（可选）

修订日志

R1（2026-06-07）首稿：建立 Goffman face-work → AI 错误恢复的主框架；判断主轴 4 错位（功能/社交错读、道歉廉价化、署名效应、幻觉特殊类）；对手框架接入 Norman 极简派 + 3 条 failure scenario + bias 砍除；跨域呼应落到”互动秩序破裂 vs 单方故障”与 AI face-work 不对称性。接地：Goffman 1955/1967、ELIZA/Hofstadter、Kadambi arXiv:2604.15316、Ashktorab arXiv:2507.02745、Telematics 2024、arXiv:2603.16643——arXiv ID 已核实（2026-06-12 台账对齐：2604.15316 经本专题 R02／S01 节点 WebFetch 复核标题/作者/年份/核心发现吻合；2603.16643 经 A02 节点 WebFetch 复核《Good Arguments Against the People Pleasers》Feng et al. 2026 确证；本节原”待 WebFetch 复核”标记与同专题已核实记录矛盾，统一为已核实）；跨文化外推仍标〔待核实〕。
2026-06-12 内审修复：台账对齐——arXiv:2604.15316、arXiv:2603.16643 在本专题他处已有 WebFetch 确证，本节 R1 日志原标”待 WebFetch 复核”属台账自相矛盾，统一改为”已核实（2026-06-12）“并注明确证出处节点。
2026-06-12 内审·arXiv 联网核实：清了 2 个/存疑 0 个。本节直接 WebFetch 复核——2604.15316 确证为 Kadambi《Anthropomorphism and Trust in Human-Large Language Model interactions》（2026-03-01 提交，warmth+认知共情预测全部结果、competence 除拟人化外预测全部，与本节引述吻合）；2603.16643 确证为 Feng et al.《Good Arguments Against the People Pleasers…》（2026）。§跨文化外推〔待核实〕属非 arXiv 项（理论外推性），维持不动。