R

这个知识库是怎么来的

2026-06-12 知识工程

先把最容易引起误会的事实摆在前面:这个站的知识库不是慢慢长出来的,是分批浇筑出来的。 主体结构在 2026 年 5 月的一周内成形,6 月又并入了一整个专题库。如果你抽开一篇笔记觉得”这是 AI 写的”——你是对的,而且我希望你在知道这一点之后再来评价它。

管线长什么样

知识库分两层,生产方式不同:

基础层(约 120 篇):AI 基础、工程化、交互范式、公司与产品等九个主题域。生产方式是共创——我口述理解、丢进对话里拷问,Claude 负责结构化和补全,我负责裁决哪些保留。部分笔记带修订日志(R1→R4),记录的是引入反方框架后的对抗性迭代,比如给「Agent 概念史」加上 Karpathy 和 Weizenbaum 的反面视角。

专题层(475 篇):六个切面——评测与度量、能力与训练、工程与成本、安全对齐与失败、商业与组织、人文社科透镜——下挂三十多个「系统化专题」。这一层由一条独立的 PKM 管线生产:每个专题从冷启动研究开始,产出证据简报,再编译成带引用的结构化笔记。每篇笔记的 front-matter 里有它的家族、节点类型和原始文献清单(多数带 arXiv 编号),关键数字会经过 grounding pass 逐条回源核对——没核完的,front-matter 里写着哪些数字”待核实”。

人在哪里、AI 在哪里

AI 做的:检索、结构化、初稿、引用编译、一致性检查。 我做的:选题(哪三十个专题值得建)、切面设计(为什么人文社科是一个一等切面)、对抗(哪些结论要找反方)、裁决(什么进库、什么发布)。

诚实地说,这个分工里 AI 的字数占比远超我。但知识工程的价值从来不在字数——在架构和质量门。这两样在管线的每一层都是人定的。

发布到这个站时,又过了一道闸

Obsidian 库到公开站点之间有一条发布管线,它做的事都写在仓库里:

  • 剥离 AI 协作的内部残桩(衍生对话存档、待补充占位)
  • 抹除指向私人日记的链接、过滤敏感题材
  • 每篇笔记标注来源档位:共创 / AI 整理
  • 求职、未决问题等文件夹整体不发布

即便如此,把几百篇 AI 参与的笔记公开放出来,仍然是一个有争议的决定。我的理由:这个库真实反映了我此刻的工作方式——用 AI 建立对一个领域的系统覆盖,再用自己的判断在上面雕刻。藏起它的生产方式,比它的生产方式本身更损害可信度。

它的局限

  1. 覆盖 ≠ 内化。库里有我还没读透的笔记,它是工作台,不是成绩单。
  2. 引用经过 grounding,但没核完的数字仍然存在,front-matter 里有标记。
  3. 双链结构带有索引型笔记的轮辐痕迹,真正的网状涌现需要时间——这部分确实在生长,只是比首页那张图看上去年轻得多。

如果你想验证以上任何一句话:图谱里每个节点都能点开原文,发布管线的源码在 GitHub 仓库里。