_拟剧理论系统化专题·总览
拟剧理论系统化专题 · 总览(MOC)
这是一套关于「AI persona 不是文案、是表演系统」的知识立方。读完你能在面试桌、选型会、复现台上,30 秒说清:为什么”给 AI 加个人设”不是取名定语气,而是在管理一条前台/后台边界 + 一个每轮被重新表演的身份。
§0 序:那堵墙
被问”你怎么设计 AI 的 persona”,我答过一版让自己脸红的话:取个名字、定个语气、写三条”友好专业不卑不亢”的准则。对面的面试官追了一句:“那 Claude 把 thinking 摊给用户看、ChatGPT 把推理链焊死在后台,这是 persona 的一部分吗,还是两回事?“——我卡住了。我的框架里根本没有”后台”这个词,于是我把一道前后台边界的核心产品决策,听成了一道”要不要多花 token 展示推理”的技术取舍题。那堵墙是:用市场营销的”品牌人格”框架去想 persona,会系统性地看不见三件结构性的事——边界画在哪、面子怎么修、一致性到底指什么。 这个专题就是把这堵墙拆掉:把 persona 从”风格属性表”升格为社会学拟剧论意义上的「互动中的身份建构系统」。反共识立场一句话:persona 设计的实质从来不是”取名定语气”,而是”前台/后台边界管理 + 反复表演的身份建构”——Claude 显 thinking 与 ChatGPT 隐推理,是两家公司对”后台该不该让观众看”做出的相反核心决策(旗舰对照见 E01 Claude Character 与 ChatGPT Persona 剖解,概念地基见 A02 前台 后台与 AI 推理可见性/G01 AI 人格设计代际谱系总图:Anthropic 2025-02-24《Claude’s Extended Thinking》以”原始形式”展示推理;OpenAI o1 System Card, arXiv:2412.16720 默认隐藏 CoT 并禁止提取)。
§1 专题定位:为什么单独建 0424
用 SHARED_CONTEXT §2 的四条选题判据逐条论证(满足前 3 条中 ≥2 且第 4 条为真):
| 判据 | 是否满足 | 论证 |
|---|---|---|
| ① 中心性(影响 ≥3 个 PM 决策链节点) | ✅ | 直接卡住信任架构(p305 - 信任架构与可解释性设计)、错误恢复设计、合规边界(情感操纵风险)、差异化定位四条决策链——远超 3 个 |
| ② 误解深度(业界定义互相矛盾) | ✅ | 招聘 JD/产品白皮书把 persona 一律讲成”tone of voice + 人设卡”,与”前后台边界管理”是两个不可通约的抽象层;标准差极大 |
| ③ 速变性(24 个月内 ≥1 次格式塔切换) | ✅ | 2024-09 → 2025-02,推理链可见性从不存在的非问题,变成 Anthropic/OpenAI 公开对立的一级产品决策——一次 Kuhn 意义上的范式拐点 |
| ④ 学了就能用 | ✅ | 读完即可在面试中把”persona 题”从营销答案升级为三决策答案(边界/面子/一致性),在选型中检验产品 persona 成熟度,在复现中写出前后台 checklist |
升高了哪个抽象层:相对 0415 系列那一层”具体 persona 实现技巧”,本专题升高一层,抵达「人格的表演性本质」——它不问”怎么写一个更好的 system prompt”,而问”persona 这个东西在本体论上到底是什么、它由哪几个不可替换的零件组成”。它也相对 p305 - 信任架构与可解释性设计(工程设计手法)、Constitutional AI(训练机制)补上了社会学的概念地基:p305 回答”怎么做可解释性”,本专题回答”为什么可见性边界必须分区、为什么可见≠可审计”。
§2 模块全景
graph TD
subgraph 概念["01 概念辨析(横向·是什么)"]
A["A01–A06<br/>拟剧论谱系 / 前后台 / face work<br/>/ 表演性 / 印象管理 / 拟人化"]
end
subgraph 架构["03 架构剖面(解剖·由什么组成)"]
S["S01 六层剖面(旗舰)<br/>S02 流派对照矩阵·S03 表演性身份系统"]
end
subgraph 实例["04 实例剖解(病理·怎么走样)"]
E["E01 Claude vs ChatGPT·E02 Character.ai<br/>E03 道歉与错误恢复"]
end
subgraph 复现["05 复现指南(操作·自己怎么动手)"]
R["R01 前后台边界 / R02 道歉话术 / R03 一致性测试"]
end
G["02 代际演化(纵向·从哪来)<br/>G01 谱系总图 · G02 逐代详解"]
A --> S --> E --> R
G -. 横切·提供时间维度 .-> A
G -. 横切 .-> S
G -. 横切 .-> E
R -. 反向验证概念 .-> A
style A fill:#e8f0ff
style S fill:#ffe8e8
style E fill:#fff0e0
style R fill:#e8ffe8
style G fill:#f0e8ff
矩阵含义:依赖主链是 概念(A)→ 架构(S)→ 实例(E)→ 复现(R)——先用拟剧论把 persona 拆出零件,再把零件装成可调度的分层堆栈,再拿真实产品看堆栈怎么走样,最后自己上手复现。代际演化(G)横切全部三层,给每个概念/架构/实例补上”它从哪一代来、解决了上一代什么瓶颈”的时间维度。复现(R)反向编织回概念层:R03 的一致性测试,正是把 A04 的表演性命题(一致性 = 反复引用同一套规范的稳定性)变成可量化实验,用操作验证概念。
§3 六模块逐一介绍
- 01 概念辨析(A01–A06)|收录什么:拟剧论的六个不可替换零件。A01 立谱系坐标(Goffman → 表演研究 → Butler),A02 把前后台映射到推理可见性,A03 把 face work 落到错误恢复,A04 用 Butler 表演性重述”一致性”,A05 把印象管理落到人设设计(谄媚 = 失控的印象管理),A06 把拟人化定义为”做得越好风险越大”的校准旋钮。|解决:挡掉”品牌人格”默认框架,给 persona 一套概念坐标系。|何时读:第一次想清楚”persona 到底是什么”时,从这里进。
- 02 代际演化(G01–G02)|收录什么:AI 人格设计四代谱系(规则人设 → prompt persona → character training → 可见推理人格)。G01 是地图,G02 是逐站实地考察(每代赢在哪、在哪失效、谁来打它)。|解决:把”persona 越来越像人”的线性进步史,纠正为”前后台边界从隐性意外变成核心决策”的拟剧史。|何时读:想要时间纵深、想反驳”一代更比一代真”时读。
- 03 架构剖面(S01–S03)|收录什么:S01 AI Persona 设计分层剖面 六层剖面(表层语气/价值立场/边界拒答/前后台可见性/跨会话一致性/错误修复 + 三个致命耦合)是旗舰最厚节点(解剖学·由什么组成);S02 AI 人设设计流派对照矩阵 是四大流派对照矩阵(极简工具型/专业助手型/拟人陪伴型/角色扮演型 × 拟人度/前后台/情感边界/一致性/风险)+ “该做哪种人设”决策树(分类学·能拧成哪几种整机);S03 AI 表演性身份系统全景 把 persona 当一个五要素涌现的身份系统(剧本=system prompt/演员=模型/舞台=产品/观众=用户/修复=错误恢复,与 S01 六层正交,系统论·合起来涌现什么)。|解决:给 PM 一组可独立调度的设计杠杆(S01)、一张选型决策图(S02)、一套调试涌现系统的纪律(S03),而非一张静态人格画像。|何时读:真要动手设计 persona、需要”几个旋钮可拧/该往哪个流派押注/人格 bug 去哪一层修”时。
- 04 实例剖解(E01–E03)|收录什么:E01 Claude Character 与 ChatGPT Persona 剖解 是本专题旗舰对照——剖 Claude character 路线(显 thinking、核心价值不可覆盖、主动塑造性格)vs ChatGPT persona 路线(隐推理、Model Spec 分层可覆盖、克制机器感)的前后台、人格锚定控制权与门面三层差异,揭示这是两套不可调和的边界赌注而非口味之争;E02 Character.ai 情感型 Persona 剖解 剖 Character.ai 情感型 persona(取消后台、脆弱用户、情感依赖风险);E03 AI 道歉与错误恢复剖解 剖真实 AI 道歉/错误恢复案例的社交修复设计或缺失。|解决:把抽象框架按到真实产品的伤口上,看它怎么走样。|何时读:做竞品分析、想看”概念在现实里如何崩坏”时。
- 05 复现指南(R01–R03)|收录什么:R01 用 system prompt 设计一个有明确前后台边界与价值立场的 persona 并测一致性;R02 为 AI 设计分级错误恢复/道歉话术(按 face work)并 A/B 测社交反应;R03 设计 persona 一致性测试集(跨话题/跨会话/对抗诱导),量化人设漂移。|解决:把框架变成能在自己产品里跑的实验。|何时读:要把判断力转成可执行 checklist 时。
- 06 阅读指南(本总览 + README)|收录什么:多路径入口、自测题、反方训练。|何时读:现在。
[!success] 本专题已全数落盘(17 节点 + 总览 + README,2026-06-07 整合完成) S02(流派对照矩阵)、S03(表演性身份系统全景)、E01(Claude Character vs ChatGPT Persona 剖解)三节已于本轮补全落盘,全部纳入正文双链、§2 矩阵与 §8 关联表。E01 是承载”Claude 显 thinking vs ChatGPT 隐推理”对照的旗舰实例节点,A02/G01/G02/E02 提供其概念地基与互补视角。
§4 与现有节点关系(升级对照表)
| 旧节点(真实存在) | 本专题哪些节点 | 升级类型 | 升了什么 |
|---|---|---|---|
| p305 - 信任架构与可解释性设计 | A01 / A02 / E03 / S01 | 对话深化 + 理论地基补缺 | p305 给”折叠推理面板/工具调用日志”等设计手法与”分层透明悖论”;本专题补社会学地基——后台永远不能全开否则前台崩塌,可见≠可审计。p305 回答”怎么设计”,本专题回答”为什么边界必须分区” |
| Constitutional AI | A01 / A02 / G01 / G02 / S01 | 纠偏 + 对话 | CAI 把人格写成明文宪法;本专题用 Butler 纠偏——写进宪法的不是被一次设定就固化的”内核”,而是模型每轮反复引用的”规范库”,这解释了为什么 CAI 下 persona 仍会随对话漂移 |
| 幻觉 / c13 - 幻觉的不可消除性 | A02 / A03 / E03 | 纠偏对照 | 常见错位是把”展示推理”当治幻觉的药;本专题纠偏——可见推理本身是理想化表演,会让幻觉看起来更可信,是更隐蔽的风险。幻觉是最难做道歉设计的面子威胁类型 |
| Test-Time Compute / c11 - System 2 思维与 Test-Time Compute | A02 / G01 | 视角补缺 | 技术节点讲”后台推理”如何实现;本专题指出它让”后台要不要给用户看”第一次成为必须由产品回答的问题 |
| 0411 Agent 系统化专题(A01 Agent 概念史与语义流变 §8.2 / AI概念滥用反思) | A05 / A06 | 升级 + 互补 | 0411 警告”用户会把理解投射给 AI”(ELIZA 方向,用户端拟人化);本专题 A05 追问”AI 这一侧做什么印象操作让投射成立”(生产端印象管理),A06 把它做成可校准旋钮 |
| 0117社会学 / 0115道德哲学-伦理学 | A01 / A03 / A04 / A05 | 领域落地 | 把社会学拟剧论与伦理学的面子/操纵问题,从泛泛综述落地到 AI persona 工程 |
§5 三条阅读起点(详表见 README)
- 求职速通路径:§0 序 → A02 前台 后台与 AI 推理可见性 → S01 AI Persona 设计分层剖面 → E02 Character.ai 情感型 Persona 剖解。目标:30 分钟拿到面试可用的”三决策答案”(边界/面子/一致性)。
- 决策链路径(在岗 PM):S01 AI Persona 设计分层剖面 → A03 Face Work 与 AI 错误恢复 → E03 AI 道歉与错误恢复剖解 → R02 错误恢复与道歉话术设计实验。目标:把一条具体决策(错误恢复)从概念走到可 A/B 测的实验。
- 紧迫度路径(碎片时间):A06 拟人化的双刃 → A05 印象管理与 AI 人设设计 → A04 Performativity·AI Persona 的表演性建构。目标:抓住三个最反直觉的判断(拟人化是代价不是目标 / 谄媚是失控的印象管理 / 一致性是反复表演的稳定性而非固定内核)。
§6 跨域思想资源调度(承诺不留空 invocation)
[!note] 调度纪律 下表每一项都在对应节点的”跨域呼应/对手框架”段落具体展开了它如何改变一个技术判断,不是装饰性点名。⚠️ 注意:Goffman、Butler、Weizenbaum 在本 vault 中尚无独立人物节点,故下表对其只作纯文本引用、不建
双链(避免死链);已存在的 福柯 等才建链。
| 思想资源 | 调度位置 | 在该节点改变了什么判断 | vault 链接 |
|---|---|---|---|
| Goffman 前台/后台 | A01·A02·G01·S01·E02 | 把”推理可见性”从工程题升格为”边界画在哪、向谁开放”的拓扑题;可见推理是”前台化的后台”,故可见≠忠实 | 纯文本(无节点) |
| Goffman 面子工程(face work) | A01·A03·E03 | 把 AI 道歉从”信息纠错”重述为”双向社交修复仪式”——解释了”AI 署名让道歉真诚度下降”这种反直觉现象 | 纯文本(无节点) |
| Butler 表演性(performativity) | A01·A04·G01·G02·S01 | 把”人格一致性”从”保持固定内核”重述为”反复引用同一套规范的稳定性”——改变错误诊断/版本管理/评测口径 | 纯文本(无节点) |
| 印象管理 idealization/mystification | A02·A05 | 解释谄媚(理想化压制真实动机)与隐藏推理(神秘化换取权威与护城河)的拟剧学根源 | 纯文本(无节点) |
| Weizenbaum 拟人化反思(ELIZA effect) | A06·G01 | ”Ineradicable”——拟人化投射是人类社会认知默认值,关不掉只能校准;“要不要让它像人”是伪命题 | 纯文本(无节点) |
| 福柯(权力/可见性的规训维度) | A05·A06 跨域呼应 | 把”印象管理”接到权力-可见性脉络:persona 的”透明”本身是一种规训式的可见性安排,非中性 | 福柯 |
| CASA 理论(Reeves & Nass) | A03·E03·A01 | 证明用户会”无意识”把社交脚本套到 AI 上——persona 不是可选装饰,是用户必然投射的东西 | 纯文本(来源已注) |
破 echo chamber 的 Rick 未读对手框架(≥2,逼问本专题盲点):① Alvin Gouldner「欺骗的社会学」(拟剧论回避伦理判断,用它分析 AI 有滑向犬儒的风险);② 拟剧论的「可证伪性」批评(它是框架而非可证伪理论)+ 跨文化质疑(以西方个人主义互动规范为基础,东亚”面子”目标是群体和谐,西方样本结论不可全球套用);③ Bruce Wilshire 的本体论质疑(若一切皆表演,真实自我何在)。
§7 验收档案
评议流程:本专题走 SHARED_CONTEXT §10 工厂流水线——ground → draft(六模块并行起草)→ critique(六维 + 事实接地,找茬式对抗评议)→ revise(逐节追加修订日志)→ 独立 grounding 校验 pass → synthesize(本总览 + README + 跨节点双链编织)。各节点修订日志可见其页脚(如 A02 R0.1 已 WebFetch 复核 arXiv:2507.11473 与 2603.16643 的标题/作者/年份)。
SABCD 六维自评(沿用 Rick 写作 SABCD 评级体系 + R4 第 6 维):
| 维度 | 含义 | 出版线 | 本专题自评 | 依据 |
|---|---|---|---|---|
| S 结构 | 六模块互补、依赖清晰、入口可导航 | ≥8 | 8.5 | 依赖主链 A→S→E→R 清晰、G 横切、R 反向编织;三条阅读起点。S02/S03/E01 已落盘,架构层补齐”解剖(S01)+分类(S02)+系统(S03)“三视图、实例层补齐旗舰对照(E01),结构完整性回升 |
| A 判断密度 | 每节有反共识、可证伪、带数字的判断 | ≥8 | 8.2 | 反共识立场密集(可见≠忠实、谄媚=失控印象管理、拟人化是代价非目标),带数字(奉承高人类约 50%、o1 0.38% 言行相悖、GPT-4o 4 天回滚、Replika 2500 万用户) |
| B 边界含量 | 显式标注判断在哪失效、赌的是什么 | ≥7.5 | 8.0 | 每个跨域类比都标”在哪一层成立、在哪一层失效”(Goffman 后台=真实对 LLM 失效;Butler 解放政治对 AI 失效);failure scenario 见下 |
| C 认识论自觉 | 区分事实/推测/赌注、引用可追溯 | ≥8 | 8.3 | PSM 明标”内部理论待外部验证”;Butler 凡涉必标”争议”;〔待核实〕显式留痕;所有 arXiv/官方公告带号带日期 |
| D 可演进性 | 双链密度、修订日志、改稿档案 | ≥8.5 | 8.0 | 双链密度达标、修订日志齐全、改稿档案在 _topic_factory。3 节已落盘并全数回填双链;历史链接缺陷(A02 §3 曾误写 A03 拟人化与社交性面子工程、S02 两处 0416Character.ai 死链)均已于 2026-06-07 QC pass 修复。仍略低于 8.5 线:0416/0419/奠基人物三类待建概念节点未补、跨专题 0411 错写法尚有 vault 级遗留 |
| E 对手拷问能力 | 对业界反方给出带证据的回应 | ≥7 | 8.0 | Gouldner/Wilshire/可证伪性/跨文化四个对手框架接入,CoT monitorability 阵营回应带 arXiv 证据;接受+边界范式贯穿 |
综合诚实分 = (8.5+8.2+8.0+8.3+8.0+8.0)/6 ≈ 8.2/10(≥7.8 出版线达标)。说明:综合分按六维等权平均。S02/S03/E01 落盘后 S 维回升至 8.5、D 维回升至 8.0,综合由原 ~8.0 升至 ~8.2;未对任何维度做掩饰性上调,D 维因待建概念节点未补仍保守压在 8.5 线下。
对手立场接入清单(≥8 处,点名真实立场,均可追溯):① OpenAI 隐藏 o1 CoT 的三理由(安全+竞争+避免暴露危险推理,o1 System Card);② CoT monitorability 阵营(Korbak et al. arXiv:2507.11473,含 Bengio)主张可见 CoT 是不可替代的安全窗口;③ Anthropic 自承”无法确定 CoT 是否真实反映内部”(2025-02-24 公告);④ Gouldner「欺骗的社会学」;⑤ Wilshire 本体论质疑;⑥ Nussbaum 1999《The Professor of Parody》批 Butler 误读 Austin;⑦ 拟剧论可证伪性批评;⑧ 拟剧论跨文化质疑;⑨ Anthropic PSM「模型选择而非被编程人设」(alignment.anthropic.com 2026-02-23,标注待外部验证)。
failure scenario 清单(≥5 处):① Goffman”后台=真实”在 LLM 上失效(LLM 后台是否真实反映内部存疑);② Butler”解放政治”维度对 AI 失效(AI 无身体/情感/政治解放指向);③ “可见推理=可审计”在合规场景失效(展示一段不能担保真实的推理,合规上比不展示更危险);④ 西方 Prolific 样本(Ashktorab 道歉研究)的道歉偏好结论在东亚集体主义文化可能失效;⑤ “前后台边界全局开关”在不同观众场景失效(开发者档全展示 vs 消费者档只给结论);⑥ 拟人化校准的”全局最优点”不存在——同一产品不同 turn 最优刻度不同。
confirmation-bias 砍除清单(≥5 处):① 早期倾向把”Claude 展示推理”叙述为道德高地,砍除——补入”连最激进的展示派也保留焊死的后台(儿童安全/网攻/危险武器段加密)“,证明纯透明不存在;② 早期把”拟人化”默认当正面亲和力,砍除——补入 ELIZA effect/Replika 危机作为反例,重述为”代价”;③ 早期把代际史写成线性进步,砍除——G02 显式承诺反辉格史,补入”最先进一代不是更像人,而是更诚实地不像人”(Claude 自认非人类);④ 早期把”展示推理”当治幻觉的药,砍除——补入”可见推理让幻觉看起来更可信”的反向风险;⑤ 早期把 character training 当”设定一个稳定人格”,砍除——补入 performativity(每轮重新表演)+ 谄媚在潜空间三方向独立编码(Vennemeyer et al. arXiv:2509.21305,待复现);⑥ 早期把 Goffman/Butler 当确证权威,砍除——凡涉 Butler 必标”争议”,引入 Nussbaum/Gouldner/Wilshire 三个批评者。
§8 关联节点(双链密度 ≥20,均经词典/索引核实真实存在)
本专题内节点(17 个,全数落盘)
- A01 拟剧理论概念谱系与语义 — 谱系坐标系(入口)
- A02 前台 后台与 AI 推理可见性 — 前后台映射推理可见性(求职速通首站)
- A03 Face Work 与 AI 错误恢复 — face work 落到错误恢复
- A04 Performativity·AI Persona 的表演性建构 — Butler 重述一致性
- A05 印象管理与 AI 人设设计 — 谄媚=失控的印象管理
- A06 拟人化的双刃 — 拟人化作为校准旋钮
- G01 AI 人格设计代际谱系总图 — 四代谱系地图
- G02 AI 人格设计代际演化详解 — 逐代实地考察(反辉格史)
- S01 AI Persona 设计分层剖面 — 六层剖面(旗舰·解剖学)
- S02 AI 人设设计流派对照矩阵 — 四流派×五维矩阵 + 决策树(分类学)
- S03 AI 表演性身份系统全景 — 五要素涌现身份系统(系统论,与 S01 正交)
- E01 Claude Character 与 ChatGPT Persona 剖解 — 两套前后台决策的旗舰对照(露后台+锚死核心 vs 藏后台+分层钥匙)
- E02 Character.ai 情感型 Persona 剖解 — 取消后台的情感安全风险
- E03 AI 道歉与错误恢复剖解 — 道歉作为社交修复仪式
- R01 设计一个 AI Persona·前后台边界 — 复现:边界设计
- R02 错误恢复与道歉话术设计实验 — 复现:分级道歉 A/B 测
- R03 Persona 一致性测试 — 复现:人设漂移量化
链入既有节点(升级对照,不复述)
- p305 - 信任架构与可解释性设计 — 前后台边界的工程对应(理论地基补缺)
- Constitutional AI — 人格作为”宪法”vs”反复引用的规范库”(纠偏)
- 幻觉 / c13 - 幻觉的不可消除性 — 最难做道歉设计的面子威胁类型(纠偏对照)
- Test-Time Compute / c11 - System 2 思维与 Test-Time Compute — 让”后台”成为显式产品形态
- Claude / ChatGPT / Anthropic — 前后台边界决策的对象
- Agent — “团队表演”(模型+工具维持统一人设)的对应
- 0117社会学 — Goffman 拟剧论母领域
- 0115道德哲学-伦理学 — 面子工程/操纵边界的规范判断归处
- 福柯 — 权力-可见性的规训维度(A05/A06 跨域呼应)
跨专题互链
- 0411 Agent 系统化专题 — 整体对照(用户端拟人化 vs 生产端印象管理)
- A01 Agent 概念史与语义流变 — 其 §8.2 的 Weizenbaum/ELIZA 反思与本专题 A06 同源
- AI概念滥用反思 — AI 生成内容须经批判性同行评议(方法论呼应)
- Polanyi 默会知识与提示工程的认识论张力 — 认识论张力的姊妹篇
- 范式 — Kuhn 范式不可通约性(代际拐点的判据)
总入口
- AI PM 知识图谱·总索引 — 登记新专题入口