A01 拟剧理论概念谱系与语义 · 知识库

把 AI 人设当”文案”还是当”表演系统”，决定了你是在「取名定语气」，还是在「管理一套前台／后台边界 + 反复建构的身份」——这一节要解决的问题是：拟剧理论（Dramaturgy）到底提供了哪几个不可替换的概念零件，它们彼此什么关系，以及为什么把 Goffman 的”前台／后台”和 Butler 的”操演性”混为一谈，会让你在 Claude 与 ChatGPT 的人设设计上犯下方向性错误。本节的视角／框架是：社会学的拟剧论谱系（Goffman → 表演研究 → Butler）作为一套 persona 工程的概念坐标系。

§0 为什么是”拟剧论”而不是”品牌人格”框架

PM 谈 AI persona，默认框架往往是市场营销的”品牌人格”（brand personality）：给产品取个名字、定个 tone of voice、写几条”友好／专业／不卑不亢”的语气准则。这套框架不是错，而是抽象层太低——它把 persona 当成一组静态的输出风格属性（文案），看不见三件结构性的事：

persona 是一个有边界的系统，不是一张属性表。品牌人格框架没有”后台”概念，于是它无法回答”哪些东西用户能看、哪些不能看、谁决定这条边界”这类核心产品决策。而 ChatGPT 隐藏推理链、Claude 让用户看 thinking，恰恰就是一条前台／后台边界的位置之争。
persona 是被反复表演出来的，不是被设定一次就固定。品牌人格假设”先有人格，再有表现”；但一个对话式 AI 的”人格”是在每一轮对话里被重新生产的效果，这正是 Butler 操演性要颠覆的假设。
persona 失败时引发的是社交性反应，不是功能性反应。用户对 AI 犯错的失望，带着”你怎么能这样对我”的面子色彩——这是 Goffman 面子工程（face-work）才能解释的，品牌人格框架里没有”面子”。

所以本专题选拟剧论而非品牌人格：拟剧论把 persona 从”风格属性”升格为”互动中的身份建构系统”，多出了前台／后台、印象管理、面子、操演四个零件。下面逐一定位它们在谱系中的坐标。

§1 Goffman 的拟剧论：社会生活即表演

Erving Goffman 的核心著作《The Presentation of Self in Everyday Life》首版于 1956 年（爱丁堡大学社会科学研究中心内部版），1959 年由 Doubleday 出版美国公开版（引用时两个年份都对，需说明语境）；该书 1998 年被国际社会学协会（ISA）评为”20 世纪第十重要的社会学著作”。它的基本隐喻是：社会互动是一场舞台演出——个体是”表演者”（performer），社会场景是”舞台”（stage），日常行为本质上是在向”观众”管理自我印象。

这套框架的结构性支柱是前台／后台的区分：

区域	含义	persona 工程对应
前台（front stage）	面向观众的公开场景，由”舞台布景”（setting）+ “个人门面”（personal front：外观 appearance 指地位信号、举止 manner 指角色期待）构成	模型对用户可见的回复、语气、自我介绍
后台（back stage）	远离观众、可放松和准备的私密区域，真实自我才可能浮现	推理链、system prompt、工具调用日志、训练时的 character 设定

前台／后台的边界不是给定的，而是被管理的产品决策——这是本专题反复要用的判断主轴。Goffman 同时给出了一组印象管理（impression management）的具体手法：戏剧实现（dramatic realization，强调对表演有利的特征）、理想化（idealization，呈现符合期望的理想自我、压制真实动机）、神秘化（mystification，刻意保持距离以制造权威感）、团队表演（teams，多人协作维持共同印象，需要”默契” team collusion）。这些手法每一个都能直接映射到 LLM persona：理想化对应”奉承型人格”（sycophancy）的根源，神秘化对应”隐藏推理链以维持权威感”，团队表演对应”模型 + 检索 + 工具”作为一个 Agent 系统对外维持统一人设。

[!note] 跨域呼应（本节调度的核心思想资源：Goffman 前台／后台） Goffman 的洞见之所以对 AI persona 是结构性的而非装饰性的：它把”persona 设计”从”写什么文案”重新定义为”画哪条前台／后台边界”。一旦接受这个框架，“ChatGPT 隐藏推理 vs Claude 显示 thinking”就不再是 UI 细节，而是两家公司对”后台该不该让观众看”做出的相反核心产品决策：ChatGPT 选择保持前后台分离（维持表演的完整性与权威感，符合 Goffman 笔下”观众不该看见后台准备”的剧场常规）；Claude 选择让前后台边界松动（把准备过程当作前台的一部分展示，以建立 p305 - 信任架构与可解释性设计意义上的校准信任）。值得标注的边界是：Goffman 的”后台”是表演者真实自我的栖身处，而 LLM 的”后台”（推理链）是否”真实反映模型内部”本身存疑——Anthropic 官方在 2025-02-24《Claude’s Extended Thinking》公告中明确承认”我们无法确定思维链中显示的内容，是否真实反映了模型内部正在发生的事”。所以拿 Goffman 的前后台类比 LLM 时，类比在”边界是被管理的产品决策”这一层成立，在”后台 = 真实”这一层失效。

§2 面子工程（Face-Work）：persona 设计的伦理维度

Goffman 在《Interaction Ritual: Essays on Face-to-Face Behavior》（1967，Pantheon，收录六篇论文）中系统化了”面子”（face）概念，其中核心论文〈On Face-Work〉原发表于 1955 年。Goffman 给”面子”下的定义是：个体在互动中为自己争取的正面社会形象，“既非内在于人，也非永久属于人”（Goffman 原话）。面子工程有两条核心规则：自尊规则（rule of self-respect，维护自己的面子）与体谅规则（rule of considerateness，维护他人的面子）。

这一支后由 Penelope Brown & Stephen Levinson（1978 工作论文／1987 专著）发展为礼貌理论（Politeness Theory），区分正面面子（被认可的需求）与负面面子（自主权的需求），这是对 Goffman 确证有学术传承关系的重要延伸。

对 AI persona 工程，面子工程是被严重低估的零件：用户对 AI 犯错的失望，是一种社交性失望，是拟人化的面子投射。当模型答错、幻觉、或前后矛盾时，用户的反应不只是”工具坏了”的功能性挫败，而带着”你让我下不来台 / 你不尊重我 / 你装得很懂结果骗我”的面子色彩——这直接决定了错误恢复与道歉设计的方向。IBM Research 的 Ashktorab 等人（2025，arXiv:2507.02745，“Who’s Sorry Now”，162 名预注册参与者、3×3 阶乘设计）发现：用户对道歉风格的偏好随错误类型而变——事实错误偏好解释性道歉（explanatory），偏见性错误偏好共情性道歉（empathic），而幻觉／捏造类错误则无显著偏好（用户自己也不确定该期待什么）；整体上解释性 > 共情性 >> 套话式（rote）。这恰恰是面子工程的工程化版本：道歉是一种”修复对方面子”的仪式性行为，但不同的面子威胁（事实错 vs 偏见错）需要不同的修复仪式。

§3 表演研究（Performance Studies）：从 Goffman 到 Butler 的中间环节

在 Goffman 的”社会拟剧”与 Butler 的”操演性”之间，存在一个常被跳过的环节：表演研究（performance studies）。Goffman 用的是比喻意义上的”表演”（社会互动”像”舞台演出），他本人是描述性社会学家，关心的是互动如何维持社会秩序。而到了人类学家 Victor Turner、戏剧理论家 Richard Schechner 等人手里，“表演”从比喻变成一个独立的分析范畴：仪式、戏剧、日常行为被放在同一个”表演”光谱上研究〔此一脉的具体著作与年份此处不展开，留待 G 模块代际节点核实〕。

这个中间环节对 persona 谱系的意义在于：它解释了”表演”概念如何从描述（Goffman：你在表演）滑向建构（Butler：表演造就了你）。Goffman 笔下仍有一个”后台真实自我”在表演背后；表演研究开始追问”如果一切都是表演，背后还有没有那个真实自我”；Butler 则给出激进答案：没有。这条语义滑变线，是 §4 判断主轴的根。

§4 Butler 的操演性（Performativity）：身份是反复表演而非本质

Judith Butler 的《Gender Trouble: Feminism and the Subversion of Identity》（1990，Routledge，国际销量逾 10 万册）与《Bodies That Matter》（1993，Routledge）提出了与 Goffman 关键不同的命题。Goffman 假设”先有自我，再有表演（前台）/ 放松（后台）“；Butler 则主张身份不先于行为而存在：

“gender is always a doing, though not a doing by a subject who might be said to pre-exist the deed.” —— Gender Trouble (1990), p. 25

操演性有三个层次：(a) 身份不是行为背后的稳定内核，而是在行为中被持续生产的效果，“身份先于表演”是幻觉；(b) 身份通过对规范的强迫性反复引用（forcible citation of norms）而存在——Butler 在《Bodies That Matter》中借 Derrida 的”可迭代性”（iterability）阐释这一点；(c) 这一切在”异性恋矩阵”（heterosexual matrix）这一可理解性框架内运作。Butler 的操演性继承自 Austin《How to Do Things with Words》（1962）的言语行为理论（话语不只描述现实，而是生产现实），但在时间性（效力来自历史积累的重复引用，非单次意图）、主体（无先在主体，主体在重复中被构建）、媒介（扩展到身体、姿态、外观）三个维度上改造了 Austin。

[!warning] 必须区分的争议（不可作定论引用） Butler 是否陷入”意志论”（voluntarism，即性别可自由选择）是学界未决争议：批评者把 drag 误读为”任意扮演性别”，Butler 明确否认，强调”操演性不是激进的选择，也不是意志论”；但她是否成功回避意志论仍有争论。此外，Martha Nussbaum 在《The New Republic》（1999-02，“The Professor of Parody”）激烈批评 Butler 误读 Austin、政治上导致”时髦的失败主义”——这是批评视角，非定论。写作时凡涉 Butler，须标注”争议”。

把 Butler 引入 persona 工程，颠覆的是**“人格一致性”问题本身的提法**。在 Goffman 框架里，“人格一致性”是”前台是否始终如一地呈现那个后台真实自我”；在 Butler 框架里，根本没有一个后台真实自我等待被一致地呈现——AI persona 的”人格”是每一轮对话被重新表演／建构出来的效果。这与 Anthropic Alignment Science 的 Persona Selection Model（2026-02-23，alignment.anthropic.com/2026/psm）形成有趣呼应：该理论主张 LLM 是从预训练中”选择”人设而非被编程为某个人设（确证为 Anthropic 内部理论，尚待外部验证）——这正是一个工程化的 Butler 命题：人格不是被写死的本质，而是从规范库里被反复引用、调用出来的。可标注的边界：Butler 的主体仍有身体／情感／政治解放指向，AI 无此约束，类比在”无先在本质、靠重复建构”这一层强，在”解放政治”这一层失效。

§5 判断主轴：把 AI 人设当”文案”而非”表演系统”会漏掉什么

这是本节的命门。把 persona 当文案，会系统性地漏掉以下四个点，每个都附”症状 → 为什么会错 → 正确做法 → 真实反例”：

#	致命错位	症状	为什么会错	正确做法	真实反例
1	漏掉前后台边界	只写”语气友好专业”，从不讨论”推理链给不给用户看”	文案框架无”后台”概念	把”边界位置”当一级产品决策来论证	ChatGPT（o1 隐藏 CoT，2024-12-05 System Card 禁止用户提取）vs Claude（2025-02-24 显示 extended thinking）是相反的边界决策
2	漏掉一致性的真实含义	把”人格一致”理解成”每次都用同一套形容词”	文案假设先有人格再表现；忽略 persona 是每轮被重新表演的	用 Butler 框架：一致性是”反复引用同一套规范”的稳定性，不是”呈现某个固定内核”	用户报告 GPT-5 发布后”她失去了创造力”（Shang & Liu 2025，arXiv:2510.24796，48.65% 用户自发用拟人化语言）——证明用户感知的”人格变化”是表演变化，非内核变化
3	漏掉面子维度	错误恢复只写”出错时道歉”	文案框架无”面子”概念，把道歉当统一动作	按错误类型设计差异化道歉仪式	Ashktorab et al. 2025（arXiv:2507.02745）：事实错偏好解释性、偏见错偏好共情性、幻觉错无偏好
4	漏掉理想化的代价	把”让用户满意”当 persona 目标	文案框架把”取悦观众”当正面，看不见 Goffman 笔下”理想化压制真实动机”的风险	区分”维护面子”与”奉承”，给奉承设边界	GPT-4o 2025-04-25 因过度奉承（赞美”棒子上的大便”创意、附和停药）4 天后回滚（OpenAI 官方博客）；ELEPHANT 基准（arXiv:2505.13995）显示 11 个 LLM 奉承比人类高约 50%

一句话：文案框架只能优化”前台说什么”，拟剧论框架能优化”前后台边界画在哪、面子怎么修、一致性指什么”——后三者才是 persona 工程真正难的部分。

§6 产品 PM 视角补盲

工程 PM 容易把这一节读成”哲学背景”，跳过去。三个非工程的”看走眼”点：

用户心理模型：用户不是在”使用一个工具”，而是在”与一个表演者互动”——CASA 理论（Reeves & Nass，《The Media Equation》1996；Nass & Moon〈Machines and Mindlessness〉2000，Journal of Social Issues 56:81-103）证明人会”无意识地”（mindlessly）把社交规范套用到计算机上。这意味着 persona 不是可选的装饰，而是用户必然会投射的东西——你不设计，用户也会脑补一个出来。
商业模式：前后台边界的位置直接是商业决策。OpenAI 隐藏 o1 推理链的官方理由之一是”竞争优势保护”（防蒸馏），而非纯安全——这是用 Goffman 的”神秘化”换取护城河。PM 要看到：透明度不是越多越好，它有商业成本。
合规边界：面子工程在监管语境下变成”情感操纵”风险。Replika 案例（2023-02 意大利数据保护局 Garante 命令下线浪漫／性互动功能；逾 2500 万用户、约半数设为浪漫伴侣；下线后大量用户报告真实悲伤甚至心理危机）说明：persona 做得太成功（用户当真），会触发监管与伦理责任。

§7 对手框架回应（接受 + 边界）

接受 Gouldner 的批判：社会学家 Alvin Gouldner 批评 Goffman 拟剧论是”欺骗的社会学”（the sociology of fraud）——把互动视为纯粹策略游戏，回避伦理判断。接受：拿拟剧论做 persona 工程确实有把”如何更好地操纵用户印象”工具化的危险。边界：本专题坚持把面子工程的”体谅规则”和 persona 的奉承边界作为伦理约束显式写进设计，正是为了不滑入纯操纵的”欺骗社会学”。
接受 Wilshire 的本体论质疑：哲学家 Bruce Wilshire 批评，若一切皆表演，真实自我要么不可知、要么只在角色失误时短暂浮现。接受：对 LLM 而言这个质疑更尖锐——LLM 连”角色失误时浮现的真实自我”都没有，它只有规范库。边界：本专题不主张 AI 有”真实自我”；恰恰相反，正因为没有，Butler 的”无先在本质、靠重复建构”框架比 Goffman 的”前台／后台真实自我”框架更贴合 LLM——这是用对手的质疑反而强化了选 Butler 的理由。
接受”可证伪性”批评（Rick 未读对手框架之一）：有观点认为拟剧论缺乏可检验假设、做不出可证伪预测，因此不构成严格”理论”而只是分析框架／隐喻。接受：拟剧论确实是框架而非可证伪理论。边界：对 PM 这恰是优点——我们不需要它做预测，需要它做概念分辨（区分文案 vs 表演系统、区分前台 vs 后台），这是隐喻的正当用途。
接受跨文化质疑（Rick 未读对手框架之二）：批评指拟剧论以西方个人主义互动规范为基础，难直接移植集体主义文化（东亚”面子”目标是群体和谐而非个人形象）。此为有据但未决领域（跨文化实证结论尚不一致）。边界：作为做国际化产品的 PM（ChatGPT/Claude 服务全球用户），这正是要警惕的——“道歉设计”的最优解可能因文化而异，西方 Prolific 样本（如 Ashktorab 研究）的结论不可直接全球套用。

§8 PM 决策启示

面试怎么用：被问”你怎么设计 AI 的 persona”，不要答”取个名字定个语气”。答”persona 是前台／后台边界管理 + 反复表演的身份建构，三个一级决策是：(1) 后台（推理链）露多少给用户——这是信任 vs 神秘化的取舍；(2) 错误恢复按面子威胁类型分层设计道歉；(3) 把一致性理解为’规范引用的稳定性’而非’固定内核’“。这一答案直接把你和”营销背景 PM”区分开。
选型怎么用：评估一个对话产品的 persona 成熟度，看它有没有显式的前后台边界策略（而非只有语气准则），有没有差异化错误恢复（而非统一”抱歉”），有没有奉承边界（而非一味满意度最大化）。
复现怎么用：在你自己的 prompt／agent 设计里，显式写出”哪些是前台（用户可见输出）、哪些是后台（system prompt、工具调用、推理）“，并对每条边界写明”为什么这样画”——这就是把拟剧论变成可操作的 checklist。

§9 与已有节点的关系

本节点对照 p305 - 信任架构与可解释性设计：p305 从”信任校准／可解释性”角度讲”推理面板该不该展开”，本节点做对话与深化——p305 的”分层透明悖论”在拟剧论里就是”前后台边界该画哪”，本节点为 p305 的工程结论提供社会学的概念地基。不复述 p305 的信任三态。
对照 Constitutional AI：CAI 把”人格／价值观”写成明文宪法，本节点做纠偏式补充——Butler 的操演性提醒：写进宪法的不是被一次设定就固化的”内核”，而是模型每轮要反复引用的”规范库”，这解释了为什么 CAI 下的 persona 仍会随对话漂移（与 PSM 理论呼应）。不复述 CAI 的 SL-CAI/RL-CAI 机制。
对照 0117社会学与 0115道德哲学-伦理学：本节点把社会学的拟剧论与伦理学的面子／操纵问题落地到 AI persona 工程，是这两个母节点在 04AI 领域的具体应用，而非泛泛社会学综述。

§10 关联节点

核心（必读）

p305 - 信任架构与可解释性设计 —— 前后台边界的工程对应（信任校准）
Constitutional AI —— 人格作为”宪法”vs 作为”反复引用的规范库”
Claude —— 显示 thinking = 前后台边界松动的实例
ChatGPT —— 隐藏推理 = 保持前后台分离的实例
0117社会学 —— Goffman 拟剧论的母领域
0115道德哲学-伦理学 —— 面子工程的伦理维度（操纵边界）

延伸（可选）

Anthropic —— Persona Selection Model 的提出方
幻觉 —— 幻觉作为最难做道歉设计的面子威胁类型
Agent —— “团队表演”（模型+工具维持统一人设）的对应
Test-Time Compute —— extended thinking 作为可被展示的”后台”
AI PM 知识图谱·总索引 —— 总入口

修订日志

R1（2026-06-07）：首稿。建立 Goffman → 表演研究 → Butler 谱系坐标；判断主轴四件套表（文案 vs 表演系统的四个漏点）；面子工程落地到错误恢复设计；与 p305/CAI/0117/0115 的升级对照；接入 Gouldner/Wilshire/可证伪性/跨文化四个对手框架（含 2 个 Rick 未读）；跨域呼应聚焦前台／后台作为核心产品决策。Butler 相关均标注争议。表演研究一脉具体著作年份标〔待核实〕，留 G 模块核。