R

A04 AI 不能伪造的信号

创建 2026-06-07 更新 2026-06-12 3 条双链 信号理论 专题 AI 整理

A04 AI 不能伪造的信号

当生成式 AI 把”写一篇好文章、做一份精致简历、产出一份漂亮作品集”的边际成本压到趋近于零,传统的能力信号集体失去区分力——这一节要回答的问题是:在一个谁都能零成本伪造高质量输出的世界里,什么样的信号还能可信地区分”真有能力”和”装得像有能力”? 本节的判断主轴只有一句话:AI 时代的有效信号,必须”过程不可压缩”或”真实性可被第三方验证”——只有这两类信号的成本对低能力者依然高昂,分离均衡才不会坍缩。 框架沿用 Spence(1973) 的成本性信号(costly signaling),但把”成本”的载体从”教育学费”换成”AI 无法代你支付的时间、风险与即时认知”。

[!warning] 与本专题其它节点的分工 A02 信号坍缩·AI 让信号成本趋零(本专题)讲”为什么坍缩”,A06 信号与验证的关系(本专题)讲”信号失效后转向验证”。本节 A04 只讲一件事的另一面:坍缩之后还活着的那一小撮信号长什么样、为什么活着。这不是乐观主义补丁,而是从同一个 single-crossing 条件推出的、对”幸存者”的结构刻画。

§0 为什么是”成本性信号”框架,而不是”AI 检测”框架

读者脑中的默认框架往往是:AI 伪造了信号,那就用 AI 检测器把伪造的揪出来。这是错误的起点,必须先挡掉。

检测框架(detection framing)假设”真/假”是文本的内在属性,可被分类器读出来。但这条路在经验上已经走死:OpenAI 自家的 AI 文本检测器只能正确识别 26% 的 AI 生成文本,对人类文本的误判率 9%,2023 年 7 月被官方下线(来源:OpenAI 关于 AI Text Classifier 下线的公告)。同行评审期刊 Patterns(2024, Christianson, PMC11573885) 的结论更直接:AI 检测工具”高假阳性、高假阴性,且对非母语英语者有系统性歧视”。检测是一场结构上无法赢的军备竞赛——“折磨短语”黑名单到 2025 年 9 月已收录 7500+ 词条,仍追不上模型迭代。

成本性信号框架(costly-signaling framing)换了一个层次:它不问”这段输出是不是 AI 写的”,而问”产生这个信号本身要付出什么、低能力者付不付得起”。这是 Spence 原始模型的核心——信号可信不是因为它”看起来高级”,而是因为 single-crossing 条件成立:高质量发送方发同一信号的净成本,低于低质量发送方。AI 摧毁的恰恰是”看起来高级”这一层(输出质量),却动不了某些信号底层的成本结构(时间不可逆、即时性、链上时间戳)。

[!note] 框架选择的赌注 我赌”成本结构”比”内容特征”更稳定。如果未来出现既能伪造时间戳、又能实时通过现场追问的 AI(强 agent + deepfake + 记忆注入的组合),本节的整个分类会失效。这是本节最大的失效边界,§5 会显式标注。

§1 三类幸存信号:一张分类表

把”AI 不能伪造”拆开,本质是两个正交维度的组合:过程不可压缩(AI 无法把多年浓缩进一次会话)与真实性可验证(第三方留有 AI 无法篡改的记录)。据此得到三类幸存信号:

信号类型抗伪造机制载体AI 攻得破的部分AI 攻不破的部分
实时分析锐度时间窗口不可压缩 + 即时追问现场面试、live demo、临场答辩事先准备的”标准答案”被追问两层后的即兴权衡推理
公开持续的判断记录时间不可逆 + 连续性公开发表的判断流(博客/笔记/commit 史)单篇内容质量跨年的判断演化轨迹与认错记录
真正 ship 过的产品第三方时间戳 + 真实用户行为App Store / 线上产品 / 合并的 PR一份能跑的 demo 代码上线审核记录、真实评分、迭代证据链

三类的共同结构:AI 能在”截面”上以假乱真,但伪造不了”时间轴上的连续真实”。这正是 Spence 框架的延伸——把信号成本从”一次性教育投入”换成”时间的内生性成本”,而时间是 AI 唯一无法代你支付的资源。

§2 实时分析锐度:把信号生成压进无法预制的时间窗

最直接的抗伪造手段,是把信号产生的时间窗口压缩到”来不及调用 AI 预制输出”。

行业实践已经收敛到一个共识动作:现场追问。HackerEarth 2026 关于线上技术评估作弊的报告把”10 分钟现场追问(让候选人解释自己的解答)“评为最有效的反 AI 作弊手段,描述是”大多数依赖 ChatGPT 的候选人两个问题内即暴露”〔来源:HackerEarth 2026 行业报告,非同行评审〕。机制很清楚:AI 能生成一份完美解答,但无法替候选人在”为什么不用方案 B”的第二层追问下,即兴重构权衡链——后者需要真实的上下文理解和已内化的判断,而非检索。

这对 Rick 求职的直接含义:面试桌就是 Rick 的高成本信号现场。一个能在被追问”你这个安全感知功能为什么不做成强提醒而是徽章”时,立刻拉出”强提醒会触发司机的对抗心理、徽章是把信息透明化而非规训化”这种即兴权衡的人,发出的是 AI 替不了的信号。Rick 工作履历里”优质信息徽章”的 PPP 决策(来自他在出行平台做费用治理与信息透明化的一手实践)正是这类即兴可调度的弹药——预制不了,只能真懂。

[!note] 边界:实时评估的公平性代价 这类信号不是免费的。自动化监考(摄像头/眼动/击键分析)对深色肤色、残障人士有系统性误报(HackerEarth 2026 明确指出);EU AI Act 把招聘用 AI 列为高风险系统,相关义务于 2026 年 8 月 2 日生效,合规压力上升。“现场即时”的反作弊价值,与”监控伦理”的成本必须一起记账。

§3 公开持续的判断记录:时间不可逆作为内生成本

第二类幸存信号,是跨越时间的、公开的判断流——不是某一篇好文章,而是连续数年留下的”我当时怎么想、后来怎么改”的轨迹。

为什么 AI 伪造不了?因为时间不可逆。AI 可以在一次会话里生成一篇 2026 年的精彩博客,但它回溯性地制造不出:一篇 2023 年的、带着当时认知局限的判断,以及 2024、2025 年对它的修正。a16z crypto 的 Ben Wu 在 “Proof of Talent”(2026-02-26) 里把这个特征命名为 “depth and continuity”(深度与连续性):AI 工具提升贡献”量”的同时,反而让训练有素的评估者更容易识别”表面繁荣”——大量孤立、无连贯思路的 PR。连续性本身成了筛选器〔来源:a16z crypto 行业分析,非学术同行评审〕。

这正是 Rick 这个知识库的元价值所在。Rick’s Second Brain 本身就是一个 AI-proof 信号案例AI PM 知识图谱·总索引 不是一次性生成的,而是带修订日志、带 R1→R5 改稿档案、带 Rick 写作 SABCD 评级体系 自评的、连续演化的判断流。一个面试官如果看到的是”判断如何随新证据迭代、哪些早期结论被自己推翻”,他读到的是 AI 无法伪造的信号——不是”内容质量”(那个 AI 能仿),而是”判断的时间演化”(那个 AI 仿不了)。

[!warning] confirmation-bias 砍除 本节早期版本想把”GitHub 绿格子 / 持续发推”直接当正面案例。这是 bias——刷 contribution、买 star、雇人代发,早在 AI 时代之前就存在(Wang 2025, arXiv:2511.00068 也指出”游戏化的 GitHub 贡献”与 AI 无关地侵蚀着信号)。补入反例:“持续公开”只有在”判断有连贯演化”时才是信号,单纯的频率与数量已被污染。区分力来自 depth+continuity,不来自 activity count。

§4 真正 ship 过的产品:复合型高成本信号

第三类,也是最强的一类:真正上线、有真实用户、可被第三方查证的产品

它强在”复合”——同时打包了三层 AI 攻不破的证据:

  1. 结果证明:App Store / Product Hunt / 线上服务的公开上线记录,带第三方审核时间戳;
  2. 过程证明:从 0 到 1 的决策记录、发布博客、用户反馈处理;
  3. 外部验证:真实用户评分、留存、商业指标。

AI 能生成一份”能跑的 demo 代码”,但伪造不了 App Store 的审核时间戳(第三方证明)、伪造不了真实用户的行为数据、更伪造不了产品上线后持续维护迭代的证据链。用 Spence 的语言:这是把信号成本从”教育学费”换成了”创建并维护一个真实运转产品所花的时间、精力与失败风险”——一个纯粹的内生性成本信号。

经验上,这个转向已经发生。Cui, Dias & Ye(2025, arXiv:2509.25054) 用 DiD 研究 AI 求职信工具对某大型招聘平台的影响,发现求职信的信息含量下降约 51%,而雇主的响应是转向依赖求职者的既往工作记录作为替代信号——也就是说,市场已经在”用脚投票”地从”写得好”迁移到”做过什么”。

[!note] 跨域呼应:Zahavi 残障原理(生物学 → 经济学的成本信号汇流) 孔雀的尾巴之所以可信地传递”我基因好”,恰恰因为它代价高昂——劣质个体养不起这么累赘的尾巴(Zahavi 1975,《残障原理》;Grafen 1990 给出博弈论形式化)。“ship 过产品”就是求职市场的孔雀尾巴:它对真有能力者是”顺带产出”,对装样子者是”养不起的累赘”。这把本节锚进更深的理论谱系——costly signaling 不是经济学的发明,而是任何信息不对称系统的收敛解。但必须标注一个比”部分外推”更尖锐的边界:Penn & Számadó(2020, Biological Reviews 95:267–290,《残障原理:一个错误假说如何成为科学原理》) 直接论证残障原理”在逻辑上站不住、非达尔文式、是错误的”,并指出 Grafen 1990 那篇被当作支持证据的模型其实是”生命史权衡模型”而非真正的残障模型——即诚实信号由 trade-off(权衡) 而非 cost(纯成本) 解释。套到求职上这反而强化了本节的赌注:可信信号的关键不是”越痛苦越可信”,而是”产生它的成本/权衡对低能力者更高”——ship 过产品之所以是信号,不因为它”累”,而因为它把成本花在了低能力者付不起的真实产出上。

这一节对 Rick 的落点最硬:博物馆 AI 导览 APP(BUILD_COMPLETE,54 测试全绿,记忆/Agent/主动引导三套机制)就是 Rick 手里的”ship 过的产品”信号。但要诚实地标注它当前的信号强度——它强在”过程证明”(决策档案完整、公开可读),弱在”外部验证”(尚无 App Store 上线时间戳、无真实用户评分)。把它真正 ship 到一个第三方平台、拿到第一批真实用户反馈,是把这个信号从”B 级”提到”A 级”的关键一跳。

判断主轴:90% 的人在”AI 不能伪造的信号”上会搞错的四个点

#症状为什么会错正确做法真实反例
1以为”AI 检测器”能恢复信号把伪造当成文本内在属性,可分类转向成本结构:不问”是不是 AI 写的”,问”低能力者付不付得起”OpenAI 检测器 26% 识别率,2023 年 7 月下线
2把”输出质量”当信号没意识到 AI 攻破的恰恰是质量这一层信号要锚在”时间不可逆 / 即时性 / 第三方时间戳”上Galdin & Silbert 2025:LLM 后定制申请的支付溢价归零
3把”持续高产”等同于”持续判断记录”频率/数量早被刷量污染,与 AI 无关看 depth+continuity(判断的连贯演化与认错),不看 activity count买 star、雇人代发、刷绿格子
4以为”有个能跑的 demo”=ship 过产品demo 缺第三方时间戳和真实用户行为要复合证据链:上线记录 + 过程档案 + 外部验证AI 一次会话即可生成完整 repo,但造不出 App Store 审核记录

每一点的共同根源都是同一个认知错位:把”截面上的可信”误当成”时间轴上的可信”。AI 在前者已经赢了,在后者还没有入场券。

产品 PM 视角补盲:依赖内容质量做信号的产品,正在面临设计坍缩

跳出”求职者怎么发信号”,换到”产品怎么用信号”的视角——这是本专题的产品层价值,也是 90% 技术讨论看走眼的地方。

任何把”UGC 质量”当信号的产品,都在经历地基塌方。 简历筛选平台、学术评审系统、内容推荐平台,过去都默认”高质量内容 = 高能力/高可信”这条 single-crossing 假设。AI 让这条假设失效:

  • 学术评审:Ansari(2026, arXiv:2602.05930) 对 NeurIPS 2025 的审计发现,53 篇被接收论文含 100 条 AI 幻觉引用,每篇经 3–5 名专家审阅竟无一察觉——“质量信号”已被 AI 复合可信性绕过。
  • 内容平台:2025 Edelman Trust Barometer 显示仅约 32% 的美国人信任 AI(全球 49%、中国 72%)(来源:Edelman 2025 Trust Barometer / The Hill 报道)——“内容是否可信”的信任基线本身在塌;而”仅 41% 的美国人相信网上读到的是真人写的准确内容”这一更精确的口径,本次未能在 Edelman 原报告中核到,标〔待核实〕,据称而非确证。
  • 简历筛选:83% 的公司用 AI 筛简历,但 64% 的招聘者察觉到”千篇一律”的 AI 简历激增,筛选量反而上升〔来源:行业报告,非同行评审〕。

PM 的设计含义是反直觉的:当内容质量信号坍缩,产品要么 (a) 把信号从”内容”迁到”过程/身份”(如 LinkedIn × Microsoft 测试的加密签名 VerifiedEmployee 工作经历凭证),要么 (b) 把”质量判断”从”读内容”换成”看可验证记录 + 现场交互”。继续在”内容质量”上加 AI 检测,是在塌掉的地基上加盖楼层。

[!note] 用户心理模型的看走眼点 用户对”信号”的信任是惯性的——他们仍下意识相信”写得好 = 有能力”。这个惯性会持续到一次大的信任崩塌(类似柠檬市场的逆向螺旋,见 Akerlof 1970)。PM 的窗口期是:在用户惯性还没崩之前,悄悄把产品的信号底座从内容换成验证。等用户集体意识到”内容不可信”再动手,市场已经进入 Akerlof 式的崩溃区间。

对手框架回应:Caplan 的”信号 ≈ 浪费”会怎么打这一节

业界最锋利的反方来自 Bryan Caplan(The Case Against Education, Princeton UP, 2018):他估计约 80% 的教育回报来自纯信号(身份认证)而非真实能力,并据此主张信号本质是社会浪费——一场零和军备竞赛。如果信号大多是浪费,那本节费力区分”哪类信号 AI 伪造不了”,岂不是在为一个本就该削减的浪费系统续命?

接受它对的部分:Caplan 抓住了信号的零和性与凭证通胀的真实——当人人读大学,学位就从信号退化为最低门槛(这与 Spence 自己的结论一致:信号均衡未必帕累托最优,纯信号成本是社会浪费)。AI 时代的”人人能产出好内容”,正是这场通胀的加速器。

但标注本节坚持的边界:Caplan 的”浪费”论建立在”信号与生产力无关”的强假设上(Spence 模型确实允许教育不提升生产率)。本节刻画的三类幸存信号恰恰相反——它们与真实能力高度耦合:实时分析锐度就是真懂、ship 过产品就是真做过、持续判断记录就是真在思考。它们不是”为了发信号而支付的纯成本”,而是”做真事的副产品恰好也是信号”。这类信号不浪费,因为它的成本本就花在了有产出的活动上。Caplan 打的是”纯信号”,本节守的是”做真事顺带发的信号”——两者不在一个靶子上。

[!note] 引入 Rick 未读的对手框架:Huntington-Klein 的”识别失败” Huntington-Klein(2021, Empirical Economics, 60(5):2499–2531) 给出一个更难缠的论点:人力资本论与纯信号论在可识别意义上根本无法被经验数据区分——任何”非零人力资本 + 非零信号”的混合都能拟合同样的数据。这逼问本节的盲点:我凭什么断言这三类信号”与真实能力耦合”而非”又一种纯信号”?诚实的回答是——我无法在经验上严格证明这种耦合,这是一个基于机制推理的赌注,不是已证事实。但这不削弱实践结论:即便无法区分,“AI 伪造不了”这一性质本身是可独立成立的——它依赖时间不可逆与第三方验证,而非依赖”信号是否真反映能力”。

PM 决策启示

  • 面试怎么用:把 Rick 的三类信号显式调度到面试桌——用即兴权衡(实时锐度)+ 知识库判断流(持续记录)+ 博物馆 APP(ship 过的产品)组成”AI 伪造不了”的信号组合拳。当面试官问”你和会用 AI 的人有什么不同”,答案不是”我也会用 AI”,而是”我发的这三类信号,AI 替不了我支付成本”。
  • 选型怎么用:评估任何”靠 UGC 质量做信号”的产品(招聘、社区、评审工具)时,第一问是”AI 让这个信号的 single-crossing 条件还成立吗?“——若不成立,看它有没有迁移到”过程/验证”底座。没迁移的,估值要打折。
  • 复现怎么用:做内容/能力类产品时,别在”AI 检测”上投入,把资源投到”可验证记录基础设施”(时间戳、第三方背书、现场交互)——这是塌方后唯一能承重的地基。

与已有节点的关系

  • 对照本专题 A06 信号与验证的关系:本节深化——A06 讲”信号失效后转向验证”的方向,A04 落到”具体哪三类信号还活着、为什么”,是对该转向的结构化补缺,不复述其论证。(相邻专题见 审阅瓶颈专题,信号 vs 验证。)
  • 对照 机制设计专题(信息不对称):本节是它的对话——信息不对称是病因(Akerlof 柠檬市场),本节是”AI 加剧病因后,幸存的解药长什么样”。
  • 对照 自我民族志专题(求职作品集信号坍缩):本节是它的理论升级——讲”作品集是信号”,本节回答”为什么作品集(尤其 ship 过的产品)在 AI 时代是少数没坍缩的信号”,给出 costly-signaling 的底层解释。
  • 对照 p306 - 数据飞轮与反馈回路设计:本节是它的纠偏——p306 默认”内容/数据质量”能驱动飞轮,本节标注:当内容信号被 AI 坍缩,依赖内容质量启动的飞轮会因逆向选择失速(劣质内容驱逐优质,类比 Akerlof);飞轮要么换成”可验证行为数据”做燃料,要么内置验证层。这是对 p306 的显式升级对照,不复述其飞轮机制。

关联节点

核心(必读)

延伸(可选)

  • p306 - 数据飞轮与反馈回路设计 — 飞轮在信号坍缩下的失速纠偏
  • 幻觉 — AI 幻觉引用如何绕过学术质量信号
  • Agent — 强 agent 是本节失效边界的潜在来源
  • ChatGPT — 内容生产成本坍缩的标志性时间节点
  • 0117社会学 — 凭证、信任、逆向选择的社会学锚点
  • 09 离职·Gap·AI 转型与作品集 — Rick 作品集信号的现状与缺口

修订日志

  • R1(2026-06-07):首稿。建立”过程不可压缩 / 真实性可验证”两维分类,三类幸存信号(实时锐度/持续记录/ship 产品);接入 Spence 成本性信号 + Zahavi 残障原理 + Caplan 反方 + Huntington-Klein 识别失败;落 Rick 自身三类信号;产品层补”内容质量信号坍缩”;显式 p306 升级对照。
  • R1.1(2026-06-07) grounding pass:(1) WebSearch 核实 Penn & Számadó(2020) Biological Reviews 95:267–290,修正引用——其立场比”过度外推”更强(论证残障原理”错误、非达尔文式”,诚实信号由 trade-off 而非 cost 解释),据此重写 Zahavi 跨域呼应段,并把本节赌注校准为”成本对低能力者更高”而非”越痛苦越可信”。(2) Edelman 2025 “41% 相信网上是真人内容”未核到原报告口径,降级为〔待核实〕,改用已核实的”32% 美国人信任 AI(全球 49%/中国 72%)“。其余 arXiv ID(2511.08785/2509.25054/2511.00068/2602.05930)、Spence 1973、Caplan 2018、Huntington-Klein 2021、OpenAI 检测器下线、HackerEarth 2026、a16z Proof of Talent 均以接地证据简报为源。
  • 2026-06-11 P3.4 校链:「与已有节点的关系」中 0418/0421/0423”专题外…尚未入库/待建节点”的降级文本恢复为真 可读名 链(三专题已入库)。
  • 2026-06-12 内审修复:修断链——0418 总览/0421 总览/0423 总览 三处数字式链实为死链,改为相邻专题真实 basename([_审阅瓶颈系统化专题·总览](/kb/专题-评测与度量/_审阅瓶颈系统化专题-总览/) 等,别名保留)。