A03 Citation 与 Attribution 产品设计

当一个 AI 知识产品在答案旁边挂上一个角标 [1]，它到底在向用户承诺什么？这一节要解决的问题不是”怎么把引用做得好看”，而是引用作为一种产品契约的真伪问题：用户看到引用，会下意识把”可被验证”误读为”已被验证”，于是引用从一个透明度工具变成了一个信任放大器——而当这个角标背后是一条捏造的或错位的来源时，它放大的就是错误本身。本节的视角框架叫**「引用是信任产品（trust product），不是装饰元素（decoration）」**：把 citation/attribution 当成一个有失败模式、有责任边界、有可证伪指标的产品组件来设计，而不是当成生成结果末尾的一行 URL 列表。判断主轴只有一句：错误引用比无引用更危险。

§0 为什么是「信任产品」框架，而不是「透明度功能」框架

大多数产品团队脑中的默认框架是：引用 = 透明度功能。逻辑是”我把来源亮出来，用户就能自己判断，平台就尽到了责任”。这个框架有一个致命的认知漏洞——它假设用户会去点、去读、去核对。现实是 zero-click 行为占主导：用户把”答案旁边有来源”本身当成了答案可信的证据，而不会真的去验证（来源：aiopsschool.com，2026，提出”引用是信任信号 trust signal 而非仅透明度”）。

一旦接受”用户多数不会核对”这个经验事实，“透明度功能”框架就崩了：你亮出来源，不是把核验责任转移给了用户，而是用一个权威符号替用户做了”这条信息可信”的判断。这正是斯坦福 HAI 对第一代生成式搜索引擎的批评——它们制造的是一种”虚假可信度的表象”（facade of trustworthiness，来源：Stanford HAI，对 Liu et al. 研究的评述）。所以正确的框架是信任产品：引用是一个会主动塑造用户信念的组件，它的失败不是”信息没给全”，而是”用错误的确定性污染了用户的判断”。这一框架转换直接推出本节判断主轴——一条捏造引用造成的伤害，大于干脆不给引用。

[!note] 与 c13 的升级对照 c13 - 幻觉的不可消除性把”引用幻觉”列为五类幻觉之一，并给出”可溯源设计”作为产品应对策略之一。本节不复述 c13 的架构性结论（幻觉源于概率采样，不可降至零），而是把它推进一层：c13 说”做可溯源设计”，本节追问”可溯源设计本身会不会变成新的幻觉载体”——答案是会，而且因为它穿上了”已验证”的外衣，它比裸奔的幻觉更难被用户识破。这是从”风险存在论”到”风险产品化”的升级。

§1 三种 Citation 模式：前置、事后、无引用

把市面上的知识产品按”引用与生成的耦合方式”切，得到三种模式，对应三种根本不同的产品哲学与信任契约。

模式	代表产品	引用与生成的关系	信任契约
引用前置（citation-first）	Perplexity	每次查询强制实时检索，引用内嵌于生成流程（entity linking + contextual reranking），句子级 inline 角标	”我的每句话都来自我刚抓到的源”
事后引用（retrieval-as-add-on）	ChatGPT（含 Search）	以参数记忆为主，搜索按需触发，引用是叠加层，多置于响应末尾	”需要时我会去查，并附上来源”
无引用（parametric-only）	早期 ChatGPT、多数对话助手	纯参数记忆直出，不提供来源	”凭我学过的东西回答你”

数据上的分野是显著的：Perplexity 平均每条响应约 21.87 条引用，95% 的响应含可见来源；ChatGPT 平均 7.92 条引用，约 60% 响应含可见来源（来源：Whitehat SEO 研究，2025，实测数据）。这不是”谁更勤快”的问题，而是产品哲学的差异——Perplexity 是搜索原生（answer-first, search-native），引用是它存在的理由；ChatGPT 是对话原生，引用是补丁。

§2 三种模式的权衡：引用前置不等于引用可信

引用前置看起来天然更值得信任，但这里藏着本节最反直觉的判断：引用的数量与引用的质量没有正相关，甚至可能负相关。

Perplexity 引用最多，但它的来源结构暴露了”前置”的代价：46.7% 的引用来自 Reddit（接近 Wikipedia 引用率的 2 倍），30 天内的新内容引用率高达 82%（来源：DiscoveredLabs，2026）。强新鲜度偏置 + 强 UGC 偏置，意味着”引用密度高”换来的是”来源权威性方差大”。反观 ChatGPT，76–81% 的引用指向 top-tier 权威源（来源：Whitehat SEO，2025）。两家共享的引用域名仅 11%，证明这是两套根本不同的检索架构，而非同一架构的不同调参。

这就构成第一个产品权衡：前置模式买到的是”每句有源”的体感，卖掉的是”源的质量可控性”。 对一个严肃知识产品而言，21.87 条 Reddit/博客来源带来的”可信体感”，可能比 7.92 条权威来源带来的真实可信度更危险——因为体感的可信度高于实际的可信度，正是误导用户的最佳配方。

Gemini（Google AI Overviews）代表第三条路：把 AI 引用与传统搜索排名 + 知识图谱融合，段落级（而非句子级）引用，54% 的 Overview 引用与 top-20 有机搜索结果重叠（来源：DiscoveredLabs，2026）。它的赌注是”用既有搜索权威性背书 AI 答案”，但这又引入了 zero-click 对出版商的争议——AI 引用了你，用户却不再点进你的站。

§3 引用幻觉：当信任产品本身在说谎

引用幻觉（citation hallucination）是本节框架的实证核心。它有三种形态，严重性递增：

支撑性幻觉：引用真实存在，但并不支撑它所标注的那句话。Liu et al.（EMNLP 2023，arXiv:2304.09848）的基础研究测得：第一代生成式搜索引擎中，仅 51.5% 的生成句子被其引用完全支撑，74.5% 的引用确实支撑了对应声明。换句话说，每两句”有来源”的话里就有一句的来源是错位的。
URL 幻觉：引用指向一个不存在或捏造的链接。Detecting and Correcting Reference Hallucinations in Commercial LLMs and Deep Research Agents（arXiv:2604.03173，2026，〔预印本，未见同行评审，谨慎引用〕）系统检测发现：Deep Research 类 Agent 因每次生成引用更多，URL 幻觉率反而高于搜索增强型 LLM——整体 3–13% 的引用 URL 为捏造、5–18% 为不可解析（Gemini Deep Research 处于高端、Claude/OpenAI 处于低端）。配套开源工具 urlhealth 用 Wayback Machine 做”失效 vs 捏造”分类校验。
学术污染（系统性外溢）：引用幻觉已渗入正式出版物。Lancet 2026 年 5 月的审计（来源：StatNews，2026-05-07；The Decoder，2026）对 250 万篇 PubMed 论文分析发现：2026 年初每 277 篇就有 1 篇含幻觉引用，对比 2023 年的 1/2828，12 倍增长，2025 年估算约 14.69 万条 AI 生成伪引用，时间线与 ChatGPT 普及高度吻合。

[!warning] 判断主轴落地：为什么”错误引用比无引用更危险” 无引用时，用户的默认怀疑机制是开启的——“这是 AI 说的，我得自己核实”。一旦挂上角标 [1]，用户的怀疑机制被关闭了——“它都给来源了，应该没错”。所以引用幻觉的伤害是双重的：(a) 它给了错误信息一个权威外壳；(b) 它同时拆掉了用户原本会启动的核验动作。51.5% 这个数字之所以触目，不是因为”一半句子错了”，而是因为”一半句子带着用户不会去验证的错误来源”。这就是 c13 所说”校准失配”在产品层的实证——LLM 最不确定时输出听起来最自信，而引用恰恰把这种虚假自信制度化了。

§4 Grounding UX：流畅性与强制反思的设计张力

引用做不做、怎么做，最终落到界面。ShapeofAI 把 Citation UX 归为四类（来源：ShapeofAI.com）：

模式	描述	典型产品
Inline Highlights	在源文本中直接高亮被引段落	Adobe Acrobat AI
Direct Quotations	显示原文片段 + 悬停预览	Granola
Multi-source References	每句旁 inline 数字角标 + favicon	Perplexity
Lightweight Links	末尾列全部 URL，优先透明度	Copy.ai

但真正的产品决策不在”选哪种样式”，而在一个深层张力：让验证变流畅 vs 强制用户反思。 Seeing to Think? How Source Transparency Design Shapes Interactive Information Seeking and Evaluation in Conversational AI（arXiv:2601.14611，2026，〔预印本〕）对比 Collapsible / Hover Card / Footer / Aligned Sidebar 四种界面发现——Hover Card 支持工作流不中断的按需验证（流畅，但用户大概率不会触发）；Aligned Sidebar 在高信息密度下让用户的批判性思维显著更强（强制反思，但打断流畅）；作者明确将此称为”工作流流畅性与强制反思验证之间的设计张力（trade-off）”。

这正是本节框架的设计含义：如果引用是”信任产品”，那么 UX 不该一味追求”无摩擦地相信”，而要在关键场景主动制造适度摩擦，逼用户从”看到来源”走向”读了来源”。一个把引用做得越丝滑、越不打断阅读的产品，反而可能越在系统性地诱导用户跳过验证——丝滑是体验指标，却是信任的反指标。新兴标准也在加码这个方向：从引用到”页面/域名”，进化到引用到”具体段落/句子”（来源：aiopsschool.com，2026），颗粒度越细，错位越无处藏身。

§5 产品 PM 视角补盲：商业模式、合规与用户心理

工程视角只看”引用准不准”，PM 必须看三个被工程视角漏掉的点。

用户心理模型：权威符号的滥用风险。 角标、favicon、来源标题这些视觉元素本质是”权威符号”。用户对它们的信任不是基于内容核验，而是基于符号识别（看到 Reddit favicon vs 看到 .gov favicon 的潜意识权重不同）。PM 的设计责任是不让产品用权威符号去为低质来源背书——Perplexity 的 Reddit 偏置之所以是产品问题而非纯技术问题，正在于此。
商业模式张力：zero-click 与出版商权益。 AI 引用了出版商内容，用户却不点击进站，验证链断裂的同时也断了出版商的流量与收入（行业争议 2025–2026 持续）。这把”引用”从一个 UX 组件升级为一个利益分配机制——你引用谁、怎么引用、是否导流，决定了内容生态愿不愿意继续给你内容。Perplexity 的版权抓取争议（见 Perplexity）就是这条张力的爆点。
合规边界：高风险域的引用即责任。 JMIR 2024（e53164，Chelli et al.）在医学系统综述任务中测得参考文献幻觉率：Bard 高达 91.4%、GPT-3.5 39.6%、GPT-4 28.6%（研究对象为 ChatGPT 与 Bard）——但这是系统综述特殊任务，不可泛化到通用搜索。PM 的合规判断是：引用幻觉的可接受阈值必须按域分级。 闲聊问答 5% URL 幻觉无伤大雅；临床指南、法律、金融问答里，一条错位引用就是一次合规事故。引用在高风险域不是 feature，是 liability。

§6 对手框架回应：业界反方立场的接受与边界

对手一：引用是营销而非可靠性（“citation theater”批评）。 一种业界声音认为，AI 产品堆砌引用主要是为了营造可信表象、做差异化营销，而非真的提升答案质量——Perplexity 21.87 条引用更像”信任剧场”。接受：这个批评对”引用数量 = 引用质量”的错觉是有效的解毒剂，前置模式的 Reddit 偏置确实佐证了”多 ≠ 好”。边界：但据此否定引用本身是过度反应——Liu et al. 的可验证性框架、urlhealth 的事后校验工具表明，引用是少数可被独立证伪的 AI 输出维度。无法验证的纯参数答案，比可被证伪的引用答案更不可问责。我赌的是：引用即便现在 51.5% 错位，它至少给了一个可改进、可监管的抓手，而无引用连抓手都没有。

对手二（Rick 未读框架）：来自传播学/媒介研究的”引用即权力”视角。 信息归属（attribution）从来不是中立的技术问题，而是话语权分配——谁被引用、谁被算法判定为”权威源”，本质是平台在重新分配可见性与合法性。AI 引用把这个分配从人类编辑判断转移给了不透明的检索排序，54% Gemini 引用与 top-20 搜索重叠意味着既有的搜索权力结构被 AI 固化甚至放大。接受：这击中了”引用 UX”框架的盲点——我前面把引用当产品组件谈，却没充分谈它作为权力机制的一面。边界：但媒介批判倾向于把所有归属都解构为权力，对 PM 的可操作性有限；产品层仍需在”承认引用有权力偏向”的前提下，做出”来源多样性可调、偏置可审计”的具体设计，而非停在批判。

对手三（Rick 未读框架）：信息检索学界的”可验证性 vs 有用性”权衡。 时序 IR 综述（“It’s High Time”, arXiv:2505.20243, 2025）等指出，过度强调引用可验证性可能牺牲答案的综合性与时效性——最可验证的来源未必是最有用的来源。接受：这提醒”引用越多越严谨”是一种偏执；强制每句挂源会把答案压成”安全但平庸”的拼贴。边界：但在知识产品语境下，可验证性是信任的前提而非可选项，我宁可牺牲一点综合性也不愿牺牲可问责性——这是知识产品与娱乐型 AI 的分水岭。

§7 跨域呼应：奥斯汀的施事话语——引用是一种”以言行事”

[!note] 跨域思想资源调度调度框架：J.L. Austin 的言语行为理论（speech act / performative utterance，《How to Do Things with Words》）。 Austin 区分”记述话语”（constative，描述事实、有真假）与”施事话语”（performative，做出一个行为、有恰当/不当 felicity conditions）。一个引用角标 [1] 表面上是记述（“这句话出自来源 1”），但在产品语境里它实际是施事——它执行了一个承诺行为：“我担保这条信息可被这个来源验证”。

这个框架如何改变技术判断：把引用看成施事话语，引用幻觉就不再是”陈述了一个假命题”（51.5% 句子不被支撑），而是”做出了一个失败的承诺”（platform 承诺了它无法兑现的可验证性）。这一视角的产品后果是关键的——记述的错误只需更正，施事的失败却侵蚀了承诺机制本身：当用户发现 [1] 不可靠，他失去的不是一条信息的信任，而是对所有 [1] 的信任。这正是”错误引用比无引用更危险”的语言哲学根据：无引用没有发出承诺，错误引用发出了并背叛了承诺，而背叛的承诺会污染整个信任契约。Austin 的”felicity conditions”（话语恰当生效的前提条件）直接给出 PM 的设计清单：引用要”恰当”，必须满足”来源真实存在 + 内容确实支撑 + 颗粒度可定位”三个生效条件，缺一即为 infelicitous（不当施事），而非简单的”错误信息”。

§8 PM 决策启示

面试怎么用：被问”如何评估一个 AI 搜索/问答产品的可信度”，不要答”看引用多不多”。答”看三层——引用支撑率（句子级 faithfulness，Liu et al. 基准约 51.5%）、URL 可解析率（urlhealth 类工具可测）、来源质量分布（top-tier 占比 vs UGC 偏置）；并强调引用是信任产品，错误引用比无引用更危险，所以高风险域要按域设阈值。“一句”引用前置不等于引用可信，Perplexity 46.7% 来自 Reddit”足以显示判断密度。
选型怎么用：为企业知识产品选底座时，把”引用模式”作为一级选型维度——纯参数模型（无引用）直接出局合规场景；前置模式查来源质量可控性；事后模式查触发可靠性。把”引用幻觉率可观测、可审计”写进选型 checklist，而非只看 demo 体感。
复现怎么用：自建 RAG 问答时（参见 m205 - RAG 生产环境：索引运维与评估体系的评估体系），引用质量要解耦进黄金评估集——除了 RAGAS 的 Faithfulness，单独加一条”引用是否可解析 + 是否支撑对应 chunk”的人工标注维度。这是 m205 评估体系在”知识作为产品”视角下的补盲项。

§9 与已有节点的关系

对照 c13 - 幻觉的不可消除性：本节点做的是深化 + 产品化。c13 在风险存在论层面证明幻觉（含引用幻觉）不可消除，本节点接住这一结论，回答”既然不可消除，引用产品该怎么设计才不放大伤害”，并给出”错误引用比无引用更危险”这个 c13 未展开的产品判断。不复述 c13 的 Softmax/校准论证。
对照 Perplexity：本节点做的是对话 + 纠偏。Perplexity 节点把它当作”RAG → C 端产品的教科书级案例”，本节点用引用数据（21.87 条、46.7% Reddit、95% 含源）补上一个批判维度——引用前置是产品哲学的胜利，也是来源质量可控性的代价。
对照 m205 - RAG 生产环境：索引运维与评估体系：本节点做的是补缺。m205 的 RAGAS 评估聚焦检索/生成质量，本节点补入”引用作为信任产品”的独立评估维度（支撑率 / 可解析率 / 来源质量分布）。
对照 c09 - RAG 架构：本节点不复述 RAG 实现，而是把 RAG 的”可溯源性”优势翻译为产品层的”信任契约”问题——技术上能溯源，不等于产品上可信任。

§10 关联节点

核心（必读）

c13 - 幻觉的不可消除性 — 引用幻觉的风险存在论基础
Perplexity — 引用前置模式的标杆案例与争议
m205 - RAG 生产环境：索引运维与评估体系 — 引用质量评估的工程落点
c09 - RAG 架构 — 可溯源性的技术前提
ChatGPT — 事后引用模式代表
Gemini — 知识图谱融合引用模式代表
幻觉 — 引用幻觉所属的概念母题

延伸（可选）

m203 - RAG 生产环境：Embedding 与文档解析 — 引用颗粒度依赖文档解析质量
m204 - RAG 生产环境：Chunking 与范式演进 — chunk 边界决定引用能定位到段落还是整篇
RAG — 引用的检索底座
Embedding — 来源召回的语义基础
p305 - 信任架构与可解释性设计 — 引用作为信任架构的一环
p304 - 防御性 UX：对抗延迟与幻觉 — 引用 UX 的防御性设计
0117社会学 — 引用作为权力/合法性分配机制
AI PM 知识图谱·总索引 — 回到总图

修订日志

R0（2026-06-07）：首稿。确立”引用是信任产品，错误引用比无引用更危险”判断主轴；三模式对照（前置/事后/无引用）；引用幻觉三形态（支撑性 51.5% / URL 3–13% / 学术污染 12 倍）；Grounding UX 流畅性 vs 强制反思张力；三对手框架（citation theater / 媒介权力 / 可验证性权衡）；Austin 言语行为理论跨域呼应（引用 = 施事话语，felicity conditions）。
R0 grounding pass（2026-06-07）：WebFetch 核实 arXiv:2304.09848（Liu et al., 2023，51.5% / 74.5% 经摘要确证）、arXiv:2601.14611（标题与四界面对照、fluency vs reflective verification trade-off 确证，年份订正为 2026）、arXiv:2604.03173（标题确证；将原 per-model 数字降级为摘要可证实的 3–13% 捏造 / 5–18% 不可解析区间，避免超出可核实范围）。两篇预印本均标注未见同行评审。