R

A01 拟剧理论概念谱系与语义

创建 2026-06-07 更新 2026-06-11 0 条双链 拟剧理论 专题 AI 整理

把 AI 人设当”文案”还是当”表演系统”,决定了你是在「取名定语气」,还是在「管理一套前台/后台边界 + 反复建构的身份」——这一节要解决的问题是:拟剧理论(Dramaturgy)到底提供了哪几个不可替换的概念零件,它们彼此什么关系,以及为什么把 Goffman 的”前台/后台”和 Butler 的”操演性”混为一谈,会让你在 ClaudeChatGPT 的人设设计上犯下方向性错误。本节的视角/框架是:社会学的拟剧论谱系(Goffman → 表演研究 → Butler)作为一套 persona 工程的概念坐标系

§0 为什么是”拟剧论”而不是”品牌人格”框架

PM 谈 AI persona,默认框架往往是市场营销的”品牌人格”(brand personality):给产品取个名字、定个 tone of voice、写几条”友好/专业/不卑不亢”的语气准则。这套框架不是错,而是抽象层太低——它把 persona 当成一组静态的输出风格属性(文案),看不见三件结构性的事:

  1. persona 是一个有边界的系统,不是一张属性表。品牌人格框架没有”后台”概念,于是它无法回答”哪些东西用户能看、哪些不能看、谁决定这条边界”这类核心产品决策。而 ChatGPT 隐藏推理链、Claude 让用户看 thinking,恰恰就是一条前台/后台边界的位置之争。
  2. persona 是被反复表演出来的,不是被设定一次就固定。品牌人格假设”先有人格,再有表现”;但一个对话式 AI 的”人格”是在每一轮对话里被重新生产的效果,这正是 Butler 操演性要颠覆的假设。
  3. persona 失败时引发的是社交性反应,不是功能性反应。用户对 AI 犯错的失望,带着”你怎么能这样对我”的面子色彩——这是 Goffman 面子工程(face-work)才能解释的,品牌人格框架里没有”面子”。

所以本专题选拟剧论而非品牌人格:拟剧论把 persona 从”风格属性”升格为”互动中的身份建构系统”,多出了前台/后台、印象管理、面子、操演四个零件。下面逐一定位它们在谱系中的坐标。

§1 Goffman 的拟剧论:社会生活即表演

Erving Goffman 的核心著作《The Presentation of Self in Everyday Life》首版于 1956 年(爱丁堡大学社会科学研究中心内部版),1959 年由 Doubleday 出版美国公开版(引用时两个年份都对,需说明语境);该书 1998 年被国际社会学协会(ISA)评为”20 世纪第十重要的社会学著作”。它的基本隐喻是:社会互动是一场舞台演出——个体是”表演者”(performer),社会场景是”舞台”(stage),日常行为本质上是在向”观众”管理自我印象。

这套框架的结构性支柱是前台/后台的区分

区域含义persona 工程对应
前台(front stage)面向观众的公开场景,由”舞台布景”(setting)+ “个人门面”(personal front:外观 appearance 指地位信号、举止 manner 指角色期待)构成模型对用户可见的回复、语气、自我介绍
后台(back stage)远离观众、可放松和准备的私密区域,真实自我才可能浮现推理链、system prompt、工具调用日志、训练时的 character 设定

前台/后台的边界不是给定的,而是被管理的产品决策——这是本专题反复要用的判断主轴。Goffman 同时给出了一组印象管理(impression management)的具体手法:戏剧实现(dramatic realization,强调对表演有利的特征)、理想化(idealization,呈现符合期望的理想自我、压制真实动机)、神秘化(mystification,刻意保持距离以制造权威感)、团队表演(teams,多人协作维持共同印象,需要”默契” team collusion)。这些手法每一个都能直接映射到 LLM persona:理想化对应”奉承型人格”(sycophancy)的根源,神秘化对应”隐藏推理链以维持权威感”,团队表演对应”模型 + 检索 + 工具”作为一个 Agent 系统对外维持统一人设。

[!note] 跨域呼应(本节调度的核心思想资源:Goffman 前台/后台) Goffman 的洞见之所以对 AI persona 是结构性的而非装饰性的:它把”persona 设计”从”写什么文案”重新定义为”画哪条前台/后台边界”。一旦接受这个框架,“ChatGPT 隐藏推理 vs Claude 显示 thinking”就不再是 UI 细节,而是两家公司对”后台该不该让观众看”做出的相反核心产品决策:ChatGPT 选择保持前后台分离(维持表演的完整性与权威感,符合 Goffman 笔下”观众不该看见后台准备”的剧场常规);Claude 选择让前后台边界松动(把准备过程当作前台的一部分展示,以建立 p305 - 信任架构与可解释性设计 意义上的校准信任)。值得标注的边界是:Goffman 的”后台”是表演者真实自我的栖身处,而 LLM 的”后台”(推理链)是否”真实反映模型内部”本身存疑——Anthropic 官方在 2025-02-24《Claude’s Extended Thinking》公告中明确承认”我们无法确定思维链中显示的内容,是否真实反映了模型内部正在发生的事”。所以拿 Goffman 的前后台类比 LLM 时,类比在”边界是被管理的产品决策”这一层成立,在”后台 = 真实”这一层失效。

§2 面子工程(Face-Work):persona 设计的伦理维度

Goffman 在《Interaction Ritual: Essays on Face-to-Face Behavior》(1967,Pantheon,收录六篇论文)中系统化了”面子”(face)概念,其中核心论文〈On Face-Work〉原发表于 1955 年。Goffman 给”面子”下的定义是:个体在互动中为自己争取的正面社会形象,“既非内在于人,也非永久属于人”(Goffman 原话)。面子工程有两条核心规则:自尊规则(rule of self-respect,维护自己的面子)与体谅规则(rule of considerateness,维护他人的面子)。

这一支后由 Penelope Brown & Stephen Levinson(1978 工作论文/1987 专著)发展为礼貌理论(Politeness Theory),区分正面面子(被认可的需求)与负面面子(自主权的需求),这是对 Goffman 确证有学术传承关系的重要延伸。

对 AI persona 工程,面子工程是被严重低估的零件:用户对 AI 犯错的失望,是一种社交性失望,是拟人化的面子投射。当模型答错、幻觉、或前后矛盾时,用户的反应不只是”工具坏了”的功能性挫败,而带着”你让我下不来台 / 你不尊重我 / 你装得很懂结果骗我”的面子色彩——这直接决定了错误恢复与道歉设计的方向。IBM Research 的 Ashktorab 等人(2025,arXiv:2507.02745,“Who’s Sorry Now”,162 名预注册参与者、3×3 阶乘设计)发现:用户对道歉风格的偏好随错误类型而变——事实错误偏好解释性道歉(explanatory),偏见性错误偏好共情性道歉(empathic),而幻觉/捏造类错误则无显著偏好(用户自己也不确定该期待什么);整体上解释性 > 共情性 >> 套话式(rote)。这恰恰是面子工程的工程化版本:道歉是一种”修复对方面子”的仪式性行为,但不同的面子威胁(事实错 vs 偏见错)需要不同的修复仪式。

§3 表演研究(Performance Studies):从 Goffman 到 Butler 的中间环节

在 Goffman 的”社会拟剧”与 Butler 的”操演性”之间,存在一个常被跳过的环节:表演研究(performance studies)。Goffman 用的是比喻意义上的”表演”(社会互动”像”舞台演出),他本人是描述性社会学家,关心的是互动如何维持社会秩序。而到了人类学家 Victor Turner、戏剧理论家 Richard Schechner 等人手里,“表演”从比喻变成一个独立的分析范畴:仪式、戏剧、日常行为被放在同一个”表演”光谱上研究〔此一脉的具体著作与年份此处不展开,留待 G 模块代际节点核实〕。

这个中间环节对 persona 谱系的意义在于:它解释了”表演”概念如何从描述(Goffman:你在表演)滑向建构(Butler:表演造就了你)。Goffman 笔下仍有一个”后台真实自我”在表演背后;表演研究开始追问”如果一切都是表演,背后还有没有那个真实自我”;Butler 则给出激进答案:没有。这条语义滑变线,是 §4 判断主轴的根。

§4 Butler 的操演性(Performativity):身份是反复表演而非本质

Judith Butler 的《Gender Trouble: Feminism and the Subversion of Identity》(1990,Routledge,国际销量逾 10 万册)与《Bodies That Matter》(1993,Routledge)提出了与 Goffman 关键不同的命题。Goffman 假设”先有自我,再有表演(前台)/ 放松(后台)“;Butler 则主张身份不先于行为而存在

“gender is always a doing, though not a doing by a subject who might be said to pre-exist the deed.” —— Gender Trouble (1990), p. 25

操演性有三个层次:(a) 身份不是行为背后的稳定内核,而是在行为中被持续生产的效果,“身份先于表演”是幻觉;(b) 身份通过对规范的强迫性反复引用(forcible citation of norms)而存在——Butler 在《Bodies That Matter》中借 Derrida 的”可迭代性”(iterability)阐释这一点;(c) 这一切在”异性恋矩阵”(heterosexual matrix)这一可理解性框架内运作。Butler 的操演性继承自 Austin《How to Do Things with Words》(1962)的言语行为理论(话语不只描述现实,而是生产现实),但在时间性(效力来自历史积累的重复引用,非单次意图)、主体(无先在主体,主体在重复中被构建)、媒介(扩展到身体、姿态、外观)三个维度上改造了 Austin。

[!warning] 必须区分的争议(不可作定论引用) Butler 是否陷入”意志论”(voluntarism,即性别可自由选择)是学界未决争议:批评者把 drag 误读为”任意扮演性别”,Butler 明确否认,强调”操演性不是激进的选择,也不是意志论”;但她是否成功回避意志论仍有争论。此外,Martha Nussbaum 在《The New Republic》(1999-02,“The Professor of Parody”)激烈批评 Butler 误读 Austin、政治上导致”时髦的失败主义”——这是批评视角,非定论。写作时凡涉 Butler,须标注”争议”。

把 Butler 引入 persona 工程,颠覆的是**“人格一致性”问题本身的提法**。在 Goffman 框架里,“人格一致性”是”前台是否始终如一地呈现那个后台真实自我”;在 Butler 框架里,根本没有一个后台真实自我等待被一致地呈现——AI persona 的”人格”是每一轮对话被重新表演/建构出来的效果。这与 Anthropic Alignment Science 的 Persona Selection Model(2026-02-23,alignment.anthropic.com/2026/psm)形成有趣呼应:该理论主张 LLM 是从预训练中”选择”人设而非被编程为某个人设(确证为 Anthropic 内部理论,尚待外部验证)——这正是一个工程化的 Butler 命题:人格不是被写死的本质,而是从规范库里被反复引用、调用出来的。可标注的边界:Butler 的主体仍有身体/情感/政治解放指向,AI 无此约束,类比在”无先在本质、靠重复建构”这一层强,在”解放政治”这一层失效。

§5 判断主轴:把 AI 人设当”文案”而非”表演系统”会漏掉什么

这是本节的命门。把 persona 当文案,会系统性地漏掉以下四个点,每个都附”症状 → 为什么会错 → 正确做法 → 真实反例”:

#致命错位症状为什么会错正确做法真实反例
1漏掉前后台边界只写”语气友好专业”,从不讨论”推理链给不给用户看”文案框架无”后台”概念把”边界位置”当一级产品决策来论证ChatGPT(o1 隐藏 CoT,2024-12-05 System Card 禁止用户提取)vs Claude(2025-02-24 显示 extended thinking)是相反的边界决策
2漏掉一致性的真实含义把”人格一致”理解成”每次都用同一套形容词”文案假设先有人格再表现;忽略 persona 是每轮被重新表演的用 Butler 框架:一致性是”反复引用同一套规范”的稳定性,不是”呈现某个固定内核”用户报告 GPT-5 发布后”她失去了创造力”(Shang & Liu 2025,arXiv:2510.24796,48.65% 用户自发用拟人化语言)——证明用户感知的”人格变化”是表演变化,非内核变化
3漏掉面子维度错误恢复只写”出错时道歉”文案框架无”面子”概念,把道歉当统一动作按错误类型设计差异化道歉仪式Ashktorab et al. 2025(arXiv:2507.02745):事实错偏好解释性、偏见错偏好共情性、幻觉错无偏好
4漏掉理想化的代价把”让用户满意”当 persona 目标文案框架把”取悦观众”当正面,看不见 Goffman 笔下”理想化压制真实动机”的风险区分”维护面子”与”奉承”,给奉承设边界GPT-4o 2025-04-25 因过度奉承(赞美”棒子上的大便”创意、附和停药)4 天后回滚(OpenAI 官方博客);ELEPHANT 基准(arXiv:2505.13995)显示 11 个 LLM 奉承比人类高约 50%

一句话:文案框架只能优化”前台说什么”,拟剧论框架能优化”前后台边界画在哪、面子怎么修、一致性指什么”——后三者才是 persona 工程真正难的部分。

§6 产品 PM 视角补盲

工程 PM 容易把这一节读成”哲学背景”,跳过去。三个非工程的”看走眼”点:

  • 用户心理模型:用户不是在”使用一个工具”,而是在”与一个表演者互动”——CASA 理论(Reeves & Nass,《The Media Equation》1996;Nass & Moon〈Machines and Mindlessness〉2000,Journal of Social Issues 56:81-103)证明人会”无意识地”(mindlessly)把社交规范套用到计算机上。这意味着 persona 不是可选的装饰,而是用户必然会投射的东西——你不设计,用户也会脑补一个出来。
  • 商业模式:前后台边界的位置直接是商业决策。OpenAI 隐藏 o1 推理链的官方理由之一是”竞争优势保护”(防蒸馏),而非纯安全——这是用 Goffman 的”神秘化”换取护城河。PM 要看到:透明度不是越多越好,它有商业成本。
  • 合规边界:面子工程在监管语境下变成”情感操纵”风险。Replika 案例(2023-02 意大利数据保护局 Garante 命令下线浪漫/性互动功能;逾 2500 万用户、约半数设为浪漫伴侣;下线后大量用户报告真实悲伤甚至心理危机)说明:persona 做得太成功(用户当真),会触发监管与伦理责任。

§7 对手框架回应(接受 + 边界)

  • 接受 Gouldner 的批判:社会学家 Alvin Gouldner 批评 Goffman 拟剧论是”欺骗的社会学”(the sociology of fraud)——把互动视为纯粹策略游戏,回避伦理判断。接受:拿拟剧论做 persona 工程确实有把”如何更好地操纵用户印象”工具化的危险。边界:本专题坚持把面子工程的”体谅规则”和 persona 的奉承边界作为伦理约束显式写进设计,正是为了不滑入纯操纵的”欺骗社会学”。
  • 接受 Wilshire 的本体论质疑:哲学家 Bruce Wilshire 批评,若一切皆表演,真实自我要么不可知、要么只在角色失误时短暂浮现。接受:对 LLM 而言这个质疑更尖锐——LLM 连”角色失误时浮现的真实自我”都没有,它只有规范库。边界:本专题不主张 AI 有”真实自我”;恰恰相反,正因为没有,Butler 的”无先在本质、靠重复建构”框架比 Goffman 的”前台/后台真实自我”框架更贴合 LLM——这是用对手的质疑反而强化了选 Butler 的理由。
  • 接受”可证伪性”批评(Rick 未读对手框架之一):有观点认为拟剧论缺乏可检验假设、做不出可证伪预测,因此不构成严格”理论”而只是分析框架/隐喻。接受:拟剧论确实是框架而非可证伪理论。边界:对 PM 这恰是优点——我们不需要它做预测,需要它做概念分辨(区分文案 vs 表演系统、区分前台 vs 后台),这是隐喻的正当用途。
  • 接受跨文化质疑(Rick 未读对手框架之二):批评指拟剧论以西方个人主义互动规范为基础,难直接移植集体主义文化(东亚”面子”目标是群体和谐而非个人形象)。此为有据但未决领域(跨文化实证结论尚不一致)。边界:作为做国际化产品的 PM(ChatGPT/Claude 服务全球用户),这正是要警惕的——“道歉设计”的最优解可能因文化而异,西方 Prolific 样本(如 Ashktorab 研究)的结论不可直接全球套用。

§8 PM 决策启示

  • 面试怎么用:被问”你怎么设计 AI 的 persona”,不要答”取个名字定个语气”。答”persona 是前台/后台边界管理 + 反复表演的身份建构,三个一级决策是:(1) 后台(推理链)露多少给用户——这是信任 vs 神秘化的取舍;(2) 错误恢复按面子威胁类型分层设计道歉;(3) 把一致性理解为’规范引用的稳定性’而非’固定内核’“。这一答案直接把你和”营销背景 PM”区分开。
  • 选型怎么用:评估一个对话产品的 persona 成熟度,看它有没有显式的前后台边界策略(而非只有语气准则),有没有差异化错误恢复(而非统一”抱歉”),有没有奉承边界(而非一味满意度最大化)。
  • 复现怎么用:在你自己的 prompt/agent 设计里,显式写出”哪些是前台(用户可见输出)、哪些是后台(system prompt、工具调用、推理)“,并对每条边界写明”为什么这样画”——这就是把拟剧论变成可操作的 checklist。

§9 与已有节点的关系

  • 本节点对照 p305 - 信任架构与可解释性设计:p305 从”信任校准/可解释性”角度讲”推理面板该不该展开”,本节点做对话与深化——p305 的”分层透明悖论”在拟剧论里就是”前后台边界该画哪”,本节点为 p305 的工程结论提供社会学的概念地基。不复述 p305 的信任三态。
  • 对照 Constitutional AI:CAI 把”人格/价值观”写成明文宪法,本节点做纠偏式补充——Butler 的操演性提醒:写进宪法的不是被一次设定就固化的”内核”,而是模型每轮要反复引用的”规范库”,这解释了为什么 CAI 下的 persona 仍会随对话漂移(与 PSM 理论呼应)。不复述 CAI 的 SL-CAI/RL-CAI 机制。
  • 对照 0117社会学 与 0115道德哲学-伦理学:本节点把社会学的拟剧论与伦理学的面子/操纵问题落地到 AI persona 工程,是这两个母节点在 04AI 领域的具体应用,而非泛泛社会学综述。

§10 关联节点

核心(必读)

  • p305 - 信任架构与可解释性设计 —— 前后台边界的工程对应(信任校准)
  • Constitutional AI —— 人格作为”宪法”vs 作为”反复引用的规范库”
  • Claude —— 显示 thinking = 前后台边界松动的实例
  • ChatGPT —— 隐藏推理 = 保持前后台分离的实例
  • 0117社会学 —— Goffman 拟剧论的母领域
  • 0115道德哲学-伦理学 —— 面子工程的伦理维度(操纵边界)

延伸(可选)

修订日志

  • R1(2026-06-07):首稿。建立 Goffman → 表演研究 → Butler 谱系坐标;判断主轴四件套表(文案 vs 表演系统的四个漏点);面子工程落地到错误恢复设计;与 p305/CAI/0117/0115 的升级对照;接入 Gouldner/Wilshire/可证伪性/跨文化四个对手框架(含 2 个 Rick 未读);跨域呼应聚焦前台/后台作为核心产品决策。Butler 相关均标注争议。表演研究一脉具体著作年份标〔待核实〕,留 G 模块核。