A03 Face Work 与 AI 错误恢复
用户对 AI 犯错的反应,为什么不能用”功能性 bug”的框架去设计错误恢复——而要用 Goffman 的 face work(面子工程)框架?这一节解决的问题是:当一个 AI 道歉的时候,用户接收到的到底是”系统状态通知”还是”一次社交修复”。我的判断是后者,而 90% 的错误恢复设计踩的就是把它当前者的坑。本节的视角框架是 Erving Goffman 的「面子工程」(Face-Work, 1955/1967)——把”AI 犯错”重新定义为「面子威胁事件」(face-threatening act),把”错误恢复”重新定义为「仪式性社交修复」(ritual repair)。
§0 为什么是 face work 而不是”error handling”
读到”AI 犯错恢复”,工程 PM 脑里默认弹出的框架是 HCI 经典的 error handling:检测错误 → 通知用户 → 提供恢复路径(retry / undo / fallback)。这套框架来自 Norman 的《设计心理学》传统,假设错误是「人-工具」回路里的一次状态偏离,目标是让用户用最低成本回到正确状态。这个框架没错,但它对会话式 AI 的错误算少了一项:用户对一个被自己拟人化的对话方犯错,反应不止是功能性挫败,还有社交性失望。
这就是为什么要换 Goffman 的框架。Goffman 在 “On Face-Work”(原发表 1955,收入 Interaction Ritual: Essays on Face-to-Face Behavior, Pantheon, 1967)里定义:面子(face)是个体在一次互动中为自己争取的正面社会形象,“既非内在于人,也非永久属于人”——它是互动现场被分配、被维护、被威胁的临时资产。当互动中出现破坏某方正面形象的事件(说错话、失态、被揭穿),就是一次 face-threatening act,互动双方会本能地启动「修复工作」(corrective work / face-work)来挽回,使互动秩序得以延续。
把这套搬到 AI 上的关键一跳是:用户已经对 AI 做了面子投射。CASA 理论(Reeves & Nass, The Media Equation, 1996;Nass & Moon, “Machines and Mindlessness”, Journal of Social Issues 56, 2000)证明人会”无意识地”(mindlessly)把人际社交脚本套在计算机上。当 AI 犯错,用户调用的不是”工具坏了”脚本,而是”互动对方失态了”脚本——这个脚本里,对方欠我一次社交修复,而不只是一个 retry 按钮。error handling 修的是任务状态,face-work 修的是互动秩序;会话式 AI 的错误同时损坏了这两样,只修前者就会留下一个”它根本没把我当回事”的社交伤口。
[!note] 框架级辨析一句话 error handling 问”用户怎么回到正确状态”;face work 问”这次失态怎么不让互动关系崩掉”。会话式 AI 必须同时回答两个问题,而绝大多数错误设计只回答了第一个。
§1 面子投射:用户为什么对 AI 犯错”动了情绪”
要把 face work 用对,先要看清用户那份”社交性失望”是怎么来的、有多结构化。
ELIZA effect 给了最早的证据。Joseph Weizenbaum 1966 年在 Communications of the ACM 发表 ELIZA(DOCTOR 脚本用模式匹配模拟罗杰斯式治疗师),他本人震惊地发现”极短时间接触一个相对简单的程序,就能在相当正常的人身上诱发强烈的妄念式思维”——他的秘书甚至要求他离开房间好和 ELIZA”独处”。(“ELIZA effect”这个术语其实是 Douglas Hofstadter 1995 年在 Fluid Concepts and Creative Analogies 命名的,不是 Weizenbaum。)一个连”理解”都谈不上的程序,用户都会投射出一个值得隐私独处的”对象”——今天流畅得多的 LLM,投射只会更强。
近期实证把这份投射拆成了可操作的维度。Kadambi et al.(“Anthropomorphism and Trust in Human-Large Language Model interactions”, arXiv:2604.15316,含 Antonio Damasio 合作团队;115 名参与者、2000+ 次人-LLM 交互)发现:温暖度(warmth)与认知共情(cognitive empathy)显著预测拟人化感知、信任、关系亲近度,而能力(competence)预测除拟人化外的几乎所有结果;主观话题(情感建议、生活方式)比客观话题更易激发拟人化。这条很关键:用户对 AI 的”人格期待”主要挂在温暖/共情上,而错误恰恰最容易被读成”温暖崩塌”——它本该体谅我,结果它敷衍我。
这就是 Goffman face-work 两条核心规则的 AI 版错位:用户预期 AI 遵守体谅规则(Rule of Considerateness,维护对方面子),而一个冷冰冰的 error 弹窗违反了这条规则——它没有维护”正在被它服务、刚刚因为它犯错而显得有点蠢”的用户的面子。用户的社交性失望,本质是面子被对方的失态连带损伤后,对方却没有履行修复义务。
§2 把”道歉”重新定义为仪式性修复
Goffman 的修复工作不是单一动作,而是一套有序列的「仪式」。把它落到 AI 道歉设计,可以拆成四个可操作环节(对应 Goffman 的 corrective interchange 结构):
| Goffman 修复环节 | 含义 | AI 错误恢复的对应设计 |
|---|---|---|
| Challenge(挑战) | 标记冒犯发生了 | 主动承认错误,而非等用户揪出来——“我前面那个数据算错了” |
| Offering(补偿) | 冒犯方提出修复 | 不只道歉,给出纠正后的正确结果 + 行动计划 |
| Acceptance(接受) | 被冒犯方接受补偿 | 给用户低摩擦的确认/继续路径,不强迫追问 |
| Thanks(致谢) | 关系秩序恢复 | 轻量收尾,不反复道歉拖累对话 |
这张表的价值在于它给出了为什么”弹个 error”必然不够的结构性解释:一个 error 弹窗只完成了 Challenge(甚至连这个都被动),完全跳过了 Offering 和 Acceptance——而 Goffman 说,修复仪式必须走完序列,互动秩序才能恢复。半途而废的修复,比不修复更显失态,因为它暴露了”对方知道自己错了却不愿意做完整修复”。
实证完全吻合这个结构。HRI/HCI 研究一致显示:仅道歉而无行动计划时,对能力评价的提升有限;同时”道歉 + 提供纠错行动计划”被评为最高能力表现(整合自多项 HRI 研究)。换 Goffman 的话说:只有 Challenge 没有 Offering 的修复,挽回了一点”诚意面子”却没挽回”能力面子”。
更细的颗粒度来自 Ashktorab et al.(“Who’s Sorry Now: User Preferences Among Rote, Empathic, and Explanatory Apologies from LLM Chatbots”, arXiv:2507.02745, IBM Research;预注册研究、162 名 Prolific 参与者、3×3 阶乘设计):
| 错误类型 | 最受偏好道歉类型 | 关键发现 |
|---|---|---|
| 事实错误 | 解释性道歉(explanatory) | 强烈偏好——用户要”为什么错了” |
| 偏见性错误 | 共情性道歉(empathic) | 此时解释性道歉有时像”找借口” |
| 幻觉/捏造 | 无显著偏好 | 用户不确定该期待什么——设计空白区 |
整体排序:解释性道歉 > 共情性道歉 >> 套话式道歉(rote)。这正是 face-work 的精确化:不同类型的面子威胁,需要不同形态的修复仪式——事实错误威胁的是”能力面子”,要靠解释(恢复对方的可信性)修;偏见错误威胁的是”道德/关系面子”,要靠共情(承认伤害)修;而万能套话式”抱歉给您带来不便”对哪种面子都没修,所以全场垫底。
§3 判断主轴:错误恢复设计的 4 个致命错位
这是本节的命门——把 AI 错误恢复当 error handling 的人,会在这四处系统性翻车,每条带「症状 → 为什么会错 → 正确做法 → 真实反例」。
错位 1:把社交失望误读为功能挫败,于是只给 retry。
- 症状:用户报错后情绪明显(“你又错了""你到底懂不懂”),产品只给”重试/换个说法”按钮。
- 为什么会错:设计者用 Norman 的 error 框架,假设用户唯一诉求是回到正确状态。但 Kadambi et al. 显示用户的信任挂在温暖/共情上,纯功能修复没碰那条线。
- 正确做法:先做 face-work(承认 + 体谅),再给功能恢复路径。Offering 必须包含”对你刚才的处境的承认”,不只是新结果。
- 真实反例:早期客服 bot 对”你给我的航班号是错的,我差点误机”只回”已为您重新查询如下”——功能上修了,关系上把用户气炸了,因为它跳过了对”差点误机”这个面子受损的承认。
错位 2:套话式道歉滥用,把道歉”廉价化”。
- 症状:每个回合都”抱歉,作为 AI 我可能会出错”,道歉变成口头禅。
- 为什么会错:以为道歉越多越显谦逊。但 Ashktorab et al. 证明 rote 道歉是三类里垫底的;HRI 研究也指出频繁道歉降低道歉的信号价值。Goffman 意义上,仪式被滥用就丧失了修复力——修复仪式的有效性来自它标记”这是一次真正的失态”,逢错就道歉等于宣布”我的失态毫无分量”。
- 正确做法:道歉要稀缺、要匹配错误类型(事实错→解释性,偏见错→共情性),用完整的 Offering 替代重复的 Challenge。
- 真实反例:某些 LLM 助手对任何质疑都先”您说得对,抱歉”——这恰好和 sycophancy(奉承)合流,道歉沦为讨好,反而削弱可信。
错位 3:忽视署名效应,以为”道歉内容”等于”道歉效果”。
- 症状:精心写好道歉文案,假设文案好效果就好。
- 为什么会错:研究发现同样的道歉内容,用户知道是 AI 撰写时真诚度感知显著更低、引发更多负面情绪(“When Chatbots Make Errors”, Telematics and Informatics, 2024)。这是一个去拟人化反效应:人会拟人化到对 AI 犯错动情绪(投射面子),又会在道歉环节突然”想起它是 AI”而打折真诚度。
- 正确做法:用关系性语气(relational tone)部分调节这一折扣(同研究证实可调节);不要试图伪装成人类道歉,而是用 AI 能真诚承担的方式——具体、可验证、给出修正机制,而非情感表演。
- 真实反例:把 AI 道歉写得极尽人类情感化(“我真的非常非常难过让您失望了”),反而触发”它在演”的反感,比朴素的”我错了,正确答案是 X,原因是 Y”更差。
错位 4:对幻觉错误也套用统一道歉模板。
- 症状:把幻觉当成普通事实错误处理,给一句解释性道歉了事。
- 为什么会错:Ashktorab et al. 发现用户对幻觉类错误没有明确道歉偏好——这类错误”在概念上对用户仍是模糊的”,用户不知道该期待什么。套用事实错误的解释性模板,会变成”为编造的内容编造解释”,是二次面子威胁。
- 正确做法:幻觉恢复的重点不在道歉风格,而在让错误可被用户提前识别(不确定性标注、来源可溯,链 p305 - 信任架构与可解释性设计);事后修复要诚实标注”我之前那段是我编的,没有依据”,而不是给一个像模像样的”解释”。
- 真实反例:模型捏造一篇不存在的论文被指出后,回”抱歉,可能是我记忆有误,该论文应为……”又编了第二个——把幻觉的修复又变成一次幻觉。
[!warning] 把这条贴墙上 错误恢复不是”弹个 error”,是”走完一次社交修复仪式”。仪式走不完(只 Challenge 不 Offering)、走错型(事实错给共情、偏见错给解释)、或滥用到廉价(逢错就道歉),都会让一次小错误升级成关系裂痕。
§4 产品 PM 视角补盲
工程视角到这就够了,但 PM 必须再补三个”看走眼”点:
- 用户心理模型层:错误恢复设计实际上在校准用户的拟人化预期。修复仪式做得越像人,用户越会把后续的局限也按”人”来期待(“它会道歉,那它应该会记住我刚说的”)——错误恢复和Anthropic「Claude’s Character」式的人格设定要协同,否则”温暖的道歉 + 冷漠的失忆”会制造更大的认知失调。
- 商业模式层:在订阅制陪伴类产品里,错误恢复是留存杠杆;在一次性工具型产品里,过度社交化的道歉反而是噪音。同一个 face-work 强度,在不同商业模式下是资产还是负债,方向相反——别把陪伴产品的道歉范式抄进生产力工具。
- 合规边界层:道歉在某些领域是法律承认。医疗、金融、自动驾驶场景,AI 说”是我的错”可能构成责任承认。face-work 的”体谅规则”在这里和法务的”不轻易认责”直接冲突——修复仪式的措辞要过法务,“我错了”和”结果与预期不符,请以官方为准”是两套面子策略。
§5 对手框架回应
接受 + 边界,不反驳。
业界主流反方立场(以 Norman 传统的 HCI 设计者 + 部分极简主义产品观为代表)会说:“别把简单的错误恢复社交化,用户要的是快速回到正确状态,加一堆道歉仪式是摩擦。” 这个立场对很大一部分场景是对的——我接受:在高频、低情感卷入、工具属性强的交互里(代码补全、搜索纠错),最好的 face-work 就是没有 face-work,直接给正确结果就是最大的体谅。
但我坚持的边界是:情感卷入度和拟人化程度越高的产品,error handling 框架的覆盖率越低。Kadambi et al. 证明主观话题、温暖/共情维度上拟人化最强;这些场景里”快速回到正确状态”根本不是用户的全部诉求。我赌的是:随着会话式 AI 渗透到陪伴、咨询、教育这些高卷入场景,face-work 框架的适用面会扩大而非缩小。
[!note] failure scenario(本节结论何时失效)
- 极低拟人化产品:纯 API、批处理、无对话人格的场景,face-work 是过度设计,error handling 足矣。
- 专家用户:开发者/重度用户往往明确知道在和工具打交道,社交化道歉对他们是噪音(与”署名效应”叠加更糟)。
- 跨文化错位:Goffman 框架以西方个人主义互动规范为基础(这是 dramaturgy 的公认争议点之一),东亚语境”面子”指向群体和谐而非个人形象,Ashktorab/Kadambi 等样本又以西方 Prolific/英语用户为主——本节的道歉偏好结论的跨文化外推性〔待核实〕,是明确的待验证区。
[!note] confirmation-bias 砍除 本节早期容易反复引”AI 道歉提升好感度”作为正面证据,强化”多道歉=好设计”。这是 bias。补入反例:①署名效应(AI 道歉真诚度被打折);②道歉廉价化(频繁道歉降低信号价值);③推理型模型会用貌似合理的论证包装道歉性结论使其更难察觉(“Good Arguments Against People Pleasers”, arXiv:2603.16643, 2026)。道歉不是越多越好,是越准越好。
§6 跨域呼应:Goffman 面子工程
本节调度的跨域资源就是主框架本身——Erving Goffman 的拟剧论与面子工程,这里把它对本技术问题的具体改判讲透,而非装饰性点名。
Goffman 的根本贡献是把”互动”从心理学的”个体行为”提升为社会学的”仪式秩序”:互动不是两个人各自做事,而是双方共同维护一个脆弱的、需要持续修复的「社会场」。这一步改判直接重写了”AI 错误”的本体论——错误不是 AI 这一端的故障,而是”AI-用户互动秩序”这个共同体的一次破裂。故障是单方的,破裂是双方的;修复故障是 debug,修复破裂是 ritual。
具体落地有三处不可替代:(1)它解释了为什么纯功能修复留下社交伤口——因为它只修了 AI 端的输出,没修共同维护的互动秩序;(2)它的”修复仪式必须走完序列”给出了”为什么只 Challenge 不 Offering 比不修复更糟”的结构性预测,这是 error handling 框架推不出来的;(3)它的”体谅规则”把”道歉措辞”从文案问题升级为”维护对方面子”的策略问题,直接解释了署名效应(用户在道歉环节意识到”它没有面子可输,所以它的体谅是免费的,因而廉价”)。
但要标 Goffman 的边界:Goffman 的互动双方都是有面子可输的真实主体——双向对称。AI 这一端没有面子可输(这正是署名效应的根源),所以 AI-用户的 face-work 是不对称的:用户的面子是真的,AI 的”面子”是用户投射的。这个不对称是 Goffman 原框架没有的,是把它用于 AI 时必须显式承担的改造。(关联 0117社会学、0115道德哲学-伦理学。)
§7 PM 决策启示
- 面试怎么用:被问”怎么设计 AI 的错误处理”,不要答 retry/fallback 那套——答”我把它分成两层:功能层用 error handling,社交层用 Goffman face-work,并按错误类型(事实/偏见/幻觉)选道歉形态(解释性/共情性/不道歉只标注),还要考虑署名效应和法务认责边界”。一句话把技术博客答案升级成产品决策框架。
- 选型怎么用:评估对话产品的错误恢复成熟度,别只看”会不会道歉”,看四件事:是否主动 Challenge、Offering 是否含纠正后结果+行动计划、道歉形态是否随错误类型变化、是否对幻觉做了”可提前识别”而非”事后编解释”。
- 复现怎么用:做错误恢复模块时,先建一张”错误类型 × 道歉形态 × 商业场景”的决策表(本节 §2、§3 可直接转成 prompt 的 system 规则),再用 Ashktorab 的三类错误做 A/B,而不是上来就写一个万能道歉模板。
§8 与已有节点的关系
- 对照 p305 - 信任架构与可解释性设计:p305 讲信任的校准(calibrated trust,事前防过度信任/过度怀疑),本节讲信任的修复(破裂之后怎么补)——是 p305 在”错误已发生”时间点上的下游补缺。p305 的不确定性标注、可解释面板是本节”幻觉错误让其可提前识别”的实现底座,二者互为前后件,不复述 p305 的事实基础。
- 对照本专题 A04 Performativity·AI Persona 的表演性建构(Butler 分支):A04 解决”AI 人格是被反复表演建构的、没有先在本质”,本节是其推论之一——既然人格是每次互动表演出来的,那么一次失态的修复就是人格一致性的关键表演时刻,搞砸修复 = 人格当场崩人设。
- 对照本专题 A02 前台 后台与 AI 推理可见性 / A05 印象管理与 AI 人设设计:A02/A05 讲常态下的印象管理(前台维持),本节讲前台破裂时的应急管理,是同一拟剧框架的”异常分支”。
- 链入 幻觉:本节把幻觉错误单列为”无明确道歉偏好”的特殊类,是对幻觉节点在”用户接受面”的补充——幻觉不只是技术不可消除性问题,也是一个无成熟修复仪式的社交难题。
§9 关联节点
核心(必读)
- p305 - 信任架构与可解释性设计
- A04 Performativity·AI Persona 的表演性建构
- A02 前台 后台与 AI 推理可见性
- A05 印象管理与 AI 人设设计
- 幻觉
- 0117社会学
延伸(可选)
- Anthropic
- Claude
- Constitutional AI
- 0115道德哲学-伦理学
- Agent
- AI PM 知识图谱·总索引
修订日志
- R1(2026-06-07)首稿:建立 Goffman face-work → AI 错误恢复的主框架;判断主轴 4 错位(功能/社交错读、道歉廉价化、署名效应、幻觉特殊类);对手框架接入 Norman 极简派 + 3 条 failure scenario + bias 砍除;跨域呼应落到”互动秩序破裂 vs 单方故障”与 AI face-work 不对称性。接地:Goffman 1955/1967、ELIZA/Hofstadter、Kadambi arXiv:2604.15316、Ashktorab arXiv:2507.02745、Telematics 2024、arXiv:2603.16643——arXiv ID 已核实(2026-06-12 台账对齐:2604.15316 经本专题 R02/S01 节点 WebFetch 复核标题/作者/年份/核心发现吻合;2603.16643 经 A02 节点 WebFetch 复核《Good Arguments Against the People Pleasers》Feng et al. 2026 确证;本节原”待 WebFetch 复核”标记与同专题已核实记录矛盾,统一为已核实);跨文化外推仍标〔待核实〕。
- 2026-06-12 内审修复:台账对齐——arXiv:2604.15316、arXiv:2603.16643 在本专题他处已有 WebFetch 确证,本节 R1 日志原标”待 WebFetch 复核”属台账自相矛盾,统一改为”已核实(2026-06-12)“并注明确证出处节点。
- 2026-06-12 内审·arXiv 联网核实:清了 2 个/存疑 0 个。本节直接 WebFetch 复核——2604.15316 确证为 Kadambi《Anthropomorphism and Trust in Human-Large Language Model interactions》(2026-03-01 提交,warmth+认知共情预测全部结果、competence 除拟人化外预测全部,与本节引述吻合);2603.16643 确证为 Feng et al.《Good Arguments Against the People Pleasers…》(2026)。§跨文化外推〔待核实〕属非 arXiv 项(理论外推性),维持不动。