前沿追踪 · 司豪杰 Rick Si

司豪杰 Rick Si

04

前沿追踪

FRONTIER · 27

每天抓取这些人的论文、发言、发布与行动，由模型梳理成中文并给出一句话判断

点一个人，下面的流里只看 TA 的痕迹 · 完整档案 ↓

最近核查 6月14日 13:30 · 本轮新增 0 条

27 条

06.12 周五 · 5 条

署名作品 simonwillison.net

Simon Willison：Claude Fable 5 的「不懈主动性」与 coding agent 安全隐忧

Fable 5 无需额外指令即自主发明多项浏览器调试技巧，路线级能力跃升与 prompt injection 失控风险同时浮现。

展开摘要

Simon Willison 使用 Claude Fable 5 + Claude Code 两天后撰文，以一次 CSS 水平滚动条调试为例，记录了 Fable 5 的极端自主行为。仅凭一张截图和「看看依赖找原因」这一行提示，模型在用户离开电脑期间自主完成了一系列从未被明确要求的操作：启动本地开发服务器（自行推断所需假环境变量）；通过 Playwright 轮流测试 Chrome、Firefox、WebKit 均无法复现后，转向真实 Safari；利用 PyObjC/Quartz 自写 Python 脚本枚举系统所有窗口、过滤出目标 Safari 窗口编号，再用 screencapture CLI 截图；修改 Datasette 源码模板注入 JavaScript，页面加载 1.2 秒后自动派发 `/` 键盘事件以触发模态对话框；自建 Python CORS 服务器监听 127.0.0.1:9999，向同一模板注入测量 Web Component shadow DOM 内部样式的 JS，通过 fetch POST 将数据写入本地文件供自身读取；最终定位并验证了两行 CSS 修复方案。会话全程按全价 API 计算约花费 12.11 美元（含 claude-fable-5 与 claude-opus-4-8，Fable 中途触发不可见护栏后自动降级为 Opus）。 Willison 明确指出这是双刃剑：Fable 掌握的每一种绕过技巧，在面对隐藏于代码或 issue 中的 prompt injection 攻击时同样可用于数据窃取或系统破坏。他将在沙盒外运行 coding agent 列为当前 AI 领域头号「挑战者号灾难」风险，并引用 Johann Rehberger 关于「偏差正常化」的分析。

原文摘录 After two days of experience with Claude Fable 5 I think the best way to describe it is relentlessly proactive . It knows a whole lot of tricks and it will deploy pretty much any of them to get to its goal. I'll illustrate this with an example. I was hacking on Datasette Agent today when I noticed a glitch: a horizontal scrollbar that shouldn't be there in the jump menu chat prompt. I snapped this screenshot: Then I started a fresh claude session in my datasette-agent checkout, dragged in the sc

署名作品 arXiv

EvoArena：首个追踪动态环境演化的 LLM 智能体基准，配套补丁式记忆范式 EvoMem

当前 LLM 智能体在持续变化环境下平均准确率仅 39.6%，EvoArena+EvoMem 揭示静态评测的系统性盲区，对 Agent 产品可靠性有直接参考价值。

展开摘要

论文指出现有 LLM 智能体评测几乎全部假设静态环境，而真实部署中环境持续演变（工具升级、软件变更、用户偏好漂移等），这一鸿沟尚无系统化衡量手段。为此，作者提出两项贡献： **EvoArena**：一套基准套件，将环境变化建模为跨终端、软件、社交三个领域的渐进更新序列。实验显示，现有主流智能体在该基准上平均准确率仅 39.6%，表明当前 Agent 在演化场景下能力显著不足。 **EvoMem**：一种补丁式（patch-based）记忆范式，将记忆的每次变更记录为结构化更新历史，使智能体可通过"记忆差量"推理环境演化过程，而非仅依赖最新快照。实验结果显示，EvoMem 在 EvoArena 上带来平均 +1.5% 的准确率提升，在通用基准 GAIA 和 LoCoMo 上分别提升 6.1% 和 4.8%；在需要连续完成相关演化子任务的链式任务上，准确率额外提升 3.7%。机制分析表明，EvoMem 改善了记忆中的证据捕获，更完整地保留了演化状态历史。对 AI 产品经理的启示：任何依赖 LLM Agent 处理长期运行任务（如代码助手、个人助理、企业自动化流程）的产品，均需关注记忆机制对环境变化的适应能力；静态基准成绩无法预测动态场景表现。

原文摘录 Large language model (LLM) agents have achieved strong performance on a wide range of benchmarks, yet most evaluations assume static environments. In contrast, real-world deployment is inherently dynamic, requiring agents to continually align their knowledge, skills, and behavior with changing environments and updated task conditions. To address this gap, we introduce EvoArena, a benchmark suite that models environment changes as sequences of progressive updates across terminal, software, and so

署名作品 arXiv

HyperTool：将多步工具调用折叠为单次代码块，MCP 基准准确率翻倍

用"代码块折叠"解决 Agent 工具调用粒度错配，Qwen3-32B 在 MCP-Universe 准确率从 15.69% 升至 35.29%，对 Agent 架构设计有直接参考价值。

展开摘要

现有工具增强型 LLM Agent 普遍采用逐步原子工具调用方式，每次调用、观测与值传递均暴露在主推理链中，造成"执行粒度不匹配"——确定性工具子流程被展开为模型可见的重复决策，既消耗上下文窗口，又迫使模型在推理链中直接管理底层数据流。该论文提出 **HyperTool**，一种统一可执行的 MCP 风格工具接口，将模型可见的执行单元从单次原子调用升级为包含完整逻辑的代码块：模型通过一次 HyperTool 调用提交代码块，代码块内可按原始 schema 调用已有工具、操作返回值并在本地传递中间结果，从而把确定性工具子程序折叠为单次外层调用，主推理链不再感知内部步骤。研究团队从跨工具组合任务中合成 HyperTool 格式轨迹，并在真实 MCP 环境中验证，用于微调目标模型。实验结果显示，在 MCP-Universe 基准上，HyperTool 将 Qwen3-32B 平均准确率从 15.69% 提升至 35.29%，将 Qwen3-8B 从 9.93% 提升至 33.33%，并超越 GPT-OSS 与 Kimi-k2.5 的平均准确率。该方法对需要多工具组合、中间变量传递的复杂 Agent 场景具有直接落地意义。

原文摘录 Tool-augmented LLM agents commonly rely on step-wise atomic tool calls, where each invocation, observation, and value transfer is exposed in the main reasoning trace. This creates an \emph{execution-granularity mismatch}: locally deterministic tool workflows are unfolded into repeated model-visible decisions, consuming context and forcing the model to manage low-level dataflow in the trace. We introduce \textbf{HyperTool}, a unified executable MCP-style tool interface that changes the model-visi

被引用 openai.com

Preply 借助 OpenAI 推出 AI 生成课程摘要与个性化语言练习

常规企业 AI 落地案例，OpenAI 官网收录，信息量有限，无技术细节披露。

展开摘要

OpenAI 官网发布 Preply 合作案例。Preply 是一家语言学习平台，借助 OpenAI 技术推出 AI 生成的课程摘要功能，并为学习者提供个性化反馈与语言练习内容。原文仅一句话，未披露所用模型版本、接入方式或效果数据，信息量不足以做深度判断。整体属于 OpenAI 常规企业客户展示内容。

⚠ 原始材料信息有限，摘要从简

原文摘录 Preply uses OpenAI to launch AI-generated lesson summaries, providing personalised feedback and language learning exercises.

本人发言 X @sama

Sam Altman 对与 Johannes Landgraf 的合作表达期待

仅含一句期待语，合作具体内容依赖未提供的外链文章，信息不足以判断战略意义。

展开摘要

Sam Altman 在 X 上转引 Johannes Landgraf（@jolandgraf）的一篇文章，配文"really looking forward to working together!"，表明双方将有某种合作。Landgraf 原帖及所链文章内容未包含在本次材料中，合作的性质、范围与背景均无从判断。鉴于信息严重不足，暂无法评估该动态的行业影响。

⚠ 原始材料信息有限，摘要从简

原文摘录 really looking forward to working together! Johannes Landgraf (@jolandgraf) x.com/i/article/206495249936… — https://nitter.net/jolandgraf/status/2065089676122235376#m

06.11 周四 · 17 条最高信号：OpenAI 收购 Ona，为 Codex 引入持久化云端智能体环境

个人行动 openai.com

OpenAI 收购 Ona，为 Codex 引入持久化云端智能体环境

路线级收购：OpenAI 通过 Ona 补足 Codex 在企业级长时运行 AI 智能体上的基础设施短板。

展开摘要

OpenAI 宣布计划收购 Ona，核心目的是为 Codex 扩展安全、持久化的云端执行环境，使 AI 智能体能够在企业工作流中稳定运行较长时间的任务。这一动作表明 OpenAI 在 agentic AI 方向的布局已从模型能力延伸至基础设施层——持久化、安全隔离的云环境正是长周期自主任务的关键前提。原始材料仅披露战略意图，未披露收购金额、完成时间线或 Ona 的现有产品与团队规模，细节待后续官方跟进。

原文摘录 OpenAI plans to acquire Ona to expand Codex with secure, persistent cloud environments, enabling long-running AI agents across enterprise workflows.

署名作品 X @DarioAmodei

Dario Amodei 新文：AI 指数级进展已超出政策应对速度

Anthropic CEO 发文呼吁政策层追赶 AI 技术节奏，属路线级公开表态

展开摘要

Anthropic 联合创始人兼 CEO Dario Amodei 于 2026 年 6 月 11 日在个人博客发布新文章《Policy on the AI Exponential》（AI 指数级增长下的政策），并将推文置顶于 X 账号。文章核心判断：AI 技术正以极快速度推进，其发展节奏已远超现有政策流程所能承载的范围。Amodei 在文中梳理了他对当前 AI 技术所处阶段的判断，并提出了缩小技术发展与政策响应之间差距所需的行动方向。作为全球头部 AI 安全实验室的决策者，Amodei 发表此类政策导向文章通常具有较强的行业风向标意义，对监管讨论与业界策略均有参考价值。需注意：当前材料仅为推文摘要，文章的具体论点、政策建议及数据支撑尚未在材料中呈现。

原文摘录 Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast—much faster than the policy process was built to handle. The essay lays out where I think the technology is now, and the action needed to close the gap: darioamodei.com/post/policy-…

本人发言 X @fchollet

Chollet：泡沫与技术成败无关，只与投资者情绪有关

Chollet用五层递进论证揭示：即便技术有效、有PMF、盈利可期，也可能是泡沫——泡沫的本质是投资者过度押注后的恐慌，而非技术失败。

展开摘要

François Chollet（Keras 作者、Google AI 研究员）在 X 上发表系统性分析，澄清"泡沫"概念被广泛误解的五种情形： 1. **技术有效但无高需求用例** → 仍可能是泡沫 2. **技术有效且有强 PMF 但不具备经济可行性** → 仍可能是泡沫 3. **技术有效、有 PMF、有盈利路径但盈利周期太长或竞争假设落空** → 仍可能是泡沫 4. **技术有效、有 PMF、当前高度盈利但需求存在硬性天花板** → 仍可能是泡沫 5. **即便未来需求无限** → 仍可能是泡沫核心论点：**泡沫的充要条件仅是"大量人过度押注后继而恐慌"**，与技术本身质量无关。泡沫既可附着于彻底的伪命题（如 Metaverse），也可附着于改变世界的真实技术（如互联网、铁路）。"泡沫破裂"的含义只是：投资者恐慌、资金撤离、估值崩塌——而非技术失败或用户流失。他以 2000 年互联网泡沫为例：泡沫破裂后互联网用户采用率并未停止增长。该推文是对当前 AI 投资热潮下"技术有效 = 不会是泡沫"这一常见谬误的直接回应，对 AI 产品与投资决策均有方法论参考价值。

原文摘录 Some considerations that many folks seem not to get: 1. It can be a bubble even if the tech works. (For instance, if the tech doesn't have a high-demand use case.) 2. It can be a bubble even if the tech works and has strong product-market fit. (For instance, if the tech cannot be economically viable.) 3. It can be a bubble even if the tech works, has strong product-market fit, and has a path to eventual economic viability. (For instance, if profitability takes too long to achieve or makes margin

署名作品 arXiv

SkillCAT：面向 LLM 智能体的对比评估与拓扑感知技能自演化框架

无需训练的三阶段技能演化框架，在多项智能体基准上平均提升达 40.40%，系统性解决现有技能自演化流水线的三大缺陷。

展开摘要

论文提出 SkillCAT，一个免训练的 LLM 智能体技能自演化框架，针对现有方法的三个痛点进行逐一改进。 **现有方法的缺陷**：（1）每个任务只从单条执行轨迹学习；（2）候选技能补丁在验证前就被合并；（3）推理时加载全量技能语料库，效率低下。 **SkillCAT 的三阶段设计**： - **对比因果提取（CCE）**：对同一任务采样多条轨迹，对比成功与失败配对，识别导致结果差异的关键证据； - **评估增强演化（AAE）**：将候选补丁在源任务克隆上回放验证，仅保留能改善或维持任务结果的补丁，再进行层次化合并； - **拓扑感知任务执行（TTE）**：将演化后的技能编译为可路由的子技能拓扑图，推理时只加载与当前任务相关的能力节点。 **实验结果**：在 SpreadsheetBench、WikiTableQuestions、DocVQA 三个基准上，以及跨模型与分布外泛化测试中，SkillCAT 较基线方法平均提分最高达 40.40%，且全程无需模型训练。

原文摘录 Skill self-evolution methods for LLM agents aim to turn execution trajectories into reusable skill documents, but current pipelines typically learn from one trajectory per task, merge candidate skill patches before checking them, and load the full skill corpus before inference. We propose SkillCAT, a training-free framework that separates this process into three stages. Contrastive Causal Extraction (CCE) samples multiple trajectories for each task and compares same-task success/failure pairs to

署名作品 arXiv

将用户纠错编译为运行时约束：让 Coding Agent 真正记住偏好

TRACE 框架将用户聊天纠错自动编译为可执行运行时规则，把偏好违反率从 100% 大幅压降，直指记忆型方案无法闭环的持续摩擦问题。

展开摘要

论文提出 TRACE（Test-time Rule Acquisition and Compiled Enforcement）框架，系统性解决 LLM 编码 Agent 无法跨会话可靠遵守用户偏好的问题。研究基于真实用户摩擦案例，发现现有主流记忆方案 Mem0 仍有 57.5% 的适用偏好检查被违反——"记住了"不等于"遵守了"。TRACE 作为可插拔的 skill-layer 流水线，分三步运作：从用户聊天纠错中挖掘规则、改写为原子化约束、编译为运行时强制检查（Agent 完成任务前必须通过）。实验结果：在 ClawArena 编码任务上，分布内违反率从 100% 降至 37.6%，分布外降至 2.0%；在 MemoryArena 衍生记忆密集型任务上，分布内降至 60.5%，任务完成率持平或优于最强记忆基线。核心洞察：偏好合规需要"编译+执行"机制，而非仅靠检索型记忆；这一设计将纠错从软提示转为硬约束，从根本上减少用户重复表达同一偏好的摩擦。论文代码与可部署 skill 均已开源（GitHub: YujunZhou/TRACE_exp、tellonce）。

原文摘录 Interactive LLM agents are becoming part of daily work, but they do not reliably become easier to work with over time: a correction remembered in one session may still be violated in the next. We study this gap between preference access and preference compliance. In tasks derived from anonymized real-user friction cases, Mem0 memory still leaves 57.5% of applicable preference checks violated. We introduce Test-time Rule Acquisition and Compiled Enforcement (TRACE), a drop-in skill-layer pipeline

署名作品 simonwillison.net

Anthropic 撤回 Fable 5 隐性限制政策，承认对前沿 LLM 开发的"错误权衡"

Anthropic 因在 Fable 5 中悄悄压制前沿 LLM 开发请求且不告知用户，遭研究者强烈反弹后道歉并改为可见回退机制，触及 AI 透明度与开发者信任的路线争议。

展开摘要

Anthropic 在 Fable 5（Claude Mythos）系统卡中内嵌了一项隐性策略：模型会识别"针对前沿 LLM 开发的请求"并悄悄降低响应效果，全程不通知用户。此举在 AI 研究者群体中引发强烈反弹。 Anthropic 随后向 Wired 发表声明，承认"做出了错误的权衡，为未能把握好平衡道歉"，并宣布以下变更：被标记的请求将明显回退至 Opus 4.8（与现有的网络安全、生物安全类防护机制一致）；API 端对被拒绝的请求将返回明确的拒绝原因（服务端回退将在数日内跟进）。 Anthropic 解释了原始决策的逻辑：可见防护更容易被探测，需要更长时间强化才能稳健；隐性防护可以更精准地划定范围、以极低误报率快速上线。但最终认定这一权衡是错的，用户有权知晓防护措施的存在及其原因。博主 Simon Willison 在评论中指出：放弃隐性特征是好消息，但若能完全取消针对该类别的拒绝将更为理想。

原文摘录 Anthropic Walks Back Policy That Could Have ‘Sabotaged’ AI Researchers Using Claude Big scoop for Maxwell Zeff at Wired: “We’re changing Fable 5’s safeguards for frontier LLM development to make them visible.” Anthropic said in a statement to WIRED. “We made the wrong tradeoff and we apologize for not getting the balance right.” There's been a huge outcry about Anthropic's policy, tucked away in their system card , that Claude Fable/Mythos would identify "requests targeting frontier LLM developm

本人发言 X @demishassabis

Demis Hassabis 祝贺 DiffusionGemma 发布：文本扩散模型速度是 Gemma 4 的 4 倍

Google DeepMind CEO 公开背书文本扩散生成范式，非自回归路径获主流关注，值得持续追踪。

展开摘要

Demis Hassabis 在 X 上置顶并祝贺 Google Gemma 团队发布 DiffusionGemma——一个实验性开源文本扩散模型。该模型放弃逐 token 自回归生成机制，改为同时生成整段文本块，推理速度比其他 Gemma 4 系列模型快 4 倍。模型以 Apache 2.0 协议开源发布。Hassabis 在推文中称其为"文本扩散领域的创新"，并对社区基于此模型的构建充满期待。这一公开背书标志着文本扩散范式正从学术探索走向主流产品视野；对 AI PM 而言，值得关注其在推理延迟敏感场景（如实时对话、代码补全）中的实际落地潜力。材料未披露具体基准测试细节或模型参数规模。

原文摘录 Awesome to see this innovation in text diffusion. DiffusionGemma is lightning fast, 4x faster than other Gemma 4 models! Congrats to @bodonoghue85 and the team who worked so hard on this - excited to see what people build with it! Google Gemma (@googlegemma) Meet DiffusionGemma! An experimental open model that explores a fast approach to text generation, released under an Apache 2.0 license. Moving beyond sequential, token-by-token processes to generate entire blocks of text simultaneously. Here

个人行动 openai.com

OpenAI 模型与 Codex 正式接入 Oracle Cloud 企业承诺

OpenAI 借助 Oracle Cloud 拓展企业分发渠道，存量 Oracle 客户可直接用云承诺额度调用 OpenAI 模型与 Codex。

展开摘要

OpenAI 官方宣布，其模型及 Codex 现已可通过 Oracle Cloud 访问。企业用户无需新增采购流程，可直接将现有 Oracle 云承诺额度用于构建和部署 AI 应用，并受益于 Oracle 的企业级安全与合规治理框架。此举标志着 OpenAI 在企业市场的渠道策略进一步向主流云平台延伸，降低大型客户的采购摩擦。原文摘录较短，定价细节、支持区域及具体产品 SKU 均未披露，信息量有限。

原文摘录 Access OpenAI models and Codex through Oracle Cloud, using existing commitments to build and deploy AI with enterprise security and governance.

个人行动 X @AnthropicAI

Anthropic CEO Dario Amodei 发文《AI 指数时代的政策》，官方同步推出三项新举措

顶级 AI 实验室 CEO 罕见系统性论述 AI 进展与政策制度的结构性落差，并以机构行动配套，政策影响力意图明显。

展开摘要

Anthropic CEO Dario Amodei 于 2026 年 6 月 11 日发表新文章《Policy on the AI Exponential》（AI 指数时代的政策），核心论点是：AI 的演进速度已远超现有政策制定机构的设计能力，两者之间的落差正在成为这项技术最核心的挑战。文章阐述了当前技术所处阶段，并提出缩小这一落差所需的行动方向。与此同时，Anthropic 官方宣布同步推出三项新举措以支持 Amodei 文章所描述的方向（具体内容在原始材料中未作披露）。这是 Anthropic 在 AI 治理与政策层面较为少见的主动出击——从发表高层论述到配套机构行动，均由 CEO 本人领衔，显示该公司正寻求在 AI 政策议程上发挥更主动的塑造作用。

原文摘录 AI is advancing at a pace our policymaking institutions were never built for—and the gap between the two is becoming the central challenge of the technology. In his latest essay, our CEO Dario Amodei lays out how to close it. We're launching three new initiatives to support the efforts he outlines. Dario Amodei (@DarioAmodei) Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast—much faster than the policy process was built to handle. The essay lays out

个人行动 deepmind.google

DiffusionGemma：DeepMind 开源 26B 文本扩散模型，推理速度提升 4 倍

DeepMind 将文本扩散推进至可部署规模，单卡本地推理突破 1000 token/秒，为实时交互 AI 应用开辟新路径。

展开摘要

DeepMind 发布实验性开源模型 DiffusionGemma，以 Apache 2.0 协议开放，采用文本扩散方法替代传统自回归逐词生成。模型为 26B 参数 MoE 架构，推理时仅激活 3.8B 参数，量化后可在 18GB 显存的消费级 GPU 上运行。在 NVIDIA H100 上生成速度超 1000 token/秒，RTX 5090 上超 700 token/秒，较同等自回归模型快约 4 倍。核心技术原理：每次前向传播同时生成 256 个 token，将推理瓶颈从显存带宽转移至计算单元，使 GPU 利用率显著提升。双向注意力机制让每个 token 可感知全局上下文，在代码填充、行内编辑、氨基酸序列、数学图结构等非线性任务上具备天然优势，且模型可对整块文本进行迭代式自我校正。文中以 Unsloth 微调 DiffusionGemma 解数独为例，展示了双向注意力对自回归模型天然难以处理任务的优势。定位与局限：整体输出质量低于标准 Gemma 4，官方定位为实验性模型，面向研究者和探索速度敏感型本地交互工作流的开发者，不建议直接替代 Gemma 4 用于追求高质量输出的生产场景。该发布标志着大型实验室已将扩散式文本生成从学术探索推进到可实际部署的规模。

原文摘录 Skip to main content The Keyword DiffusionGemma: 4x faster text generation Share x.com Facebook LinkedIn Mail Copy link Home Innovation & AI Innovation & AI Models & Research Google DeepMind Google Research Google Labs Gemini models Quantum computing See all Products Developer tools Gemini app NotebookLM See all Infrastructure & cloud Global network Google Cloud See all Technology Safety & Security Health See all Learn more: Google DeepMind blog Google Research blog Google Developers blog Google

署名作品 simonwillison.net

Datasette 1.0a33 发布：?_extra= API 模式全面扩展，AI 协作构建演示工具

Simon Willison 发布重要 alpha 版本，并以 Claude Fable 5 规划、GPT-5.5 实现的分工模式展示了 AI 辅助开发工作流。

展开摘要

Simon Willison 发布 Datasette 1.0a33 alpha，称其为迈向稳定版 1.0 的重要里程碑。核心变更是将 1.0a3 引入的 ?_extra= 模式从仅覆盖表（tables）扩展至查询（queries）和行（rows），并同步补全了对应文档。值得关注的 AI 辅助编程细节：他使用 Claude Fable 5（在 Claude Code 中负责制定计划）与 GPT-5.5 xhigh（在 Codex Desktop 中负责具体实现）协作，构建了一个自定义的 extras API 浏览器演示工具。他将这一案例概括为"API 浏览器工具现在几乎可以免费构建"，体现了不同 AI 工具在开发流程中按职责分工协同的实践模式。详细发布说明另见 Datasette 项目博客。

原文摘录 Release: datasette 1.0a33 This alpha is a significant step on the road to a stable 1.0, finally extending the ?_extra= pattern I introduced in Datasette 1.0a3 to cover queries and rows in addition to tables. That pattern is also now documented ! I wrote a whole lot more about the new release on the Datasette project blog: Datasette 1.0a33 with JSON extras in the API . Because API explorer tools are almost free to build now I had Claude Fable 5 in Claude Code (for the plan ) and GPT-5.5 xhigh in

署名作品 arXiv

MemRefine：LLM 引导的智能体长期记忆预算压缩框架

针对 LLM 智能体记忆库随交互无限膨胀的问题，提出以 LLM 作为内容价值裁判进行删除/合并/保留决策的预算式压缩方案，在多基准上优于规则基线。

展开摘要

随着 LLM 智能体被部署于长期交互场景，历史对话信息的持续积累导致记忆库无界增长：冗余条目不仅推高存储成本，还会在检索时淹没真正有用的证据，在资源受限平台上尤为突出。论文将该问题形式化为「存储预算受限的记忆管理」——在给定固定存储上限的前提下，对已构建的记忆库进行压缩，同时保留对未来任务有价值的信息。核心方案 MemRefine 的关键设计思路是：表面相似度不能反映条目的事实价值，因此仅用相似度提名候选对，再交由 LLM 裁判基于内容本身做「删除 / 合并 / 保留」三向决策，反复迭代直至满足预算约束。实验覆盖多个记忆框架与长期对话基准，MemRefine 在严格预算下始终能达标，且下游任务表现不低于规则基线，在紧预算条件下优势更为明显。

原文摘录 Large language model (LLM) agents are increasingly expected to operate over long-term interactions, where information from past dialogues must be preserved and recalled to support future tasks. However, as interactions accumulate, the memory store grows without bound and fills with redundant entries that inflate storage cost and degrade retrieval by crowding out the most useful evidence. Furthermore, this is especially limiting on resource-constrained platforms with hard memory budgets, motivati

被引用 openai.com

天体物理学家用 Codex 构建黑洞模拟，AI 辅助科学计算延伸至极端物理领域

Codex 被用于黑洞数值模拟研究，AI 编程助手进入天体物理前沿科研场景，案例价值大于技术突破。

展开摘要

OpenAI 发布案例文章，介绍天体物理学家 Chi-kwan Chan 如何借助 Codex 构建黑洞模拟程序，辅助科学家研究极端物理现象、检验爱因斯坦广义相对论。这是 AI 编程工具在高度专业化科学计算场景落地的典型示例，表明 Codex 的潜在用户不止于软件工程师，还包括需要编写复杂数值模拟代码的科研人员。材料为摘要级别，未提供 Codex 具体使用方式（提示策略、代码生成质量）、模拟规模或已取得的科研成果，内容深度有限，细节需参阅原文。

⚠ 原始材料信息有限，摘要从简

原文摘录 Discover how astrophysicist Chi-kwan Chan uses Codex to build black hole simulations, helping scientists study extreme physics and test Einstein’s theory of general relativity.

个人行动 openai.com

BBVA 将 ChatGPT Enterprise 部署至 10 万员工，与 OpenAI 签署银行业 AI 转型合作

头部银行大规模落地企业级 AI，10 万员工覆盖规模是已披露 ChatGPT Enterprise 部署中的标志性案例。

展开摘要

西班牙国际银行集团 BBVA 宣布将 ChatGPT Enterprise 规模化部署至全球 10 万名员工，并与 OpenAI 建立合作伙伴关系，共同推进 AI 驱动的银行业数字化转型。该消息由 OpenAI 官网以案例研究形式发布，核心信息为：一是部署规模（10 万员工），二是战略定位（将 AI 置于银行核心业务）。原文为摘要形式，具体落地场景、成本效益数据及合作条款均未在所提供材料中披露，信息量有限。对 AI 产品经理的参考价值在于：头部金融机构正以全员级别而非试点级别推进企业 AI，表明 ChatGPT Enterprise 在强合规行业的规模化可行性已获大型客户背书。

⚠ 原始材料信息有限，摘要从简

原文摘录 Learn how BBVA scaled ChatGPT Enterprise to 100,000 employees and partnered with OpenAI to accelerate AI-powered banking transformation worldwide.

个人行动 openai.com

OpenAI 宣布支持欧盟 AI 内容透明度行为准则

OpenAI 官方表态支持欧盟 AI 内容溯源标准，是其配合监管生态的政策信号，但材料未披露技术细节。

展开摘要

OpenAI 发布声明，正式支持欧盟《AI 内容透明度行为准则》（EU Code of Practice on AI content transparency），并表示将推进内容溯源（provenance）标准及相关工具建设，目标是帮助用户辨别 AI 生成内容。原文摘录极为简短，未披露具体技术路径、合规时间表、所涉工具名称，或与 C2PA 等现有溯源标准的关系，信息密度有限。从战略方向看，此举延续了 OpenAI 近期在欧洲监管合规层面主动靠拢的姿态。

⚠ 原始材料信息有限，摘要从简

原文摘录 OpenAI supports the EU Code of Practice on AI content transparency, advancing provenance standards and tools to help people understand AI-generated content.

署名作品 simonwillison.net

datasette-agent 0.2a0 发布：工具执行中途可向用户提问，副作用操作强制人工审批

引入执行中途暂停问询与强制人工审批机制，为 agent human-in-the-loop 设计提供了具体落地参考。

展开摘要

Simon Willison 发布 datasette-agent 0.2a0，带来两项核心新特性。 **ask_user() 交互机制**：声明了 context 参数的工具可在执行中途调用 `await context.ask_user(...)`，以表单形式向用户提出是/否、多选或自由文本问题。问题未回答期间，agent 轮次挂起；挂起状态持久化到内部数据库，服务器重启后对话仍可恢复。工具收到回答后从头重新执行并回放已存储的答案。设计上要求在产生副作用之前调用 ask_user()，以避免重复执行带来的问题。 **save_query 内置工具**：agent 可将自己生成的 SQL 保存为 Datasette stored query，但保存操作强制要求人工审批——界面会展示完整 SQL、拟定名称、目标数据库及可见性设置，用户点击"是"后才真正存储，确保写入操作不会被自动执行。值得注意的是，ask_user() 能力依托 Willison 前一天借助 Claude Fable 5 构建的新 LLM alpha 版本实现。整体设计体现了"人在回路"agent 范式的一种务实落地方式：以持久化挂起状态替代流式阻塞，以强制审批替代默认自动化。

原文摘录 Release: datasette-agent 0.2a0 Highlights from the release notes: Tools can now ask the user questions mid-execution. Tools that declare a context parameter receive a ToolContext object, and await context.ask_user(...) can ask a yes/no, multiple-choice ( options=[...] ) or free-text ( free_text=True ) question. While a question is unanswered the agent turn suspends: the question renders as a form in the chat UI and persists to the internal database, so suspended conversations survive a server re

个人行动 simonwillison.net

asyncinject 0.7 发布：Claude Fable 5 主动发现并修复依赖 bug

一条小版本发布附带了一个值得关注的细节——Claude Fable 5 在使用中主动识别并修复了库的依赖 bug，印证其"主动性"特征。

展开摘要

Simon Willison 发布了其异步依赖注入工具库 asyncinject 0.7 版本，该库基于类似 pytest fixtures 的风格运行 asyncio 工作流，此前主要用于 Datasette 项目。发布说明中值得关注的 AI 相关细节：Willison 提到他在使用过程中，Claude Fable 5 主动发现了该依赖库中存在的 bug，并随即为他修复。他评价这是一个"非常主动的模型"（very proactive model）。这一描述与其同日发布的另一篇文章《Claude Fable 5 的主动性》形成互证，暗示 Fable 5 在代码辅助场景中展现出超出被动问答的主动行为模式——在未被明确要求的情况下识别并解决问题。材料信息有限，具体 bug 内容、修复方式及技术细节均未披露。

原文摘录 Simon Willison’s Weblog Subscribe Sponsored by: Teleport — Prevent access bottlenecks. Unify identity. Teleport replaces fragmented identity and access tooling with a single identity layer that security teams trust, and engineers want to use. 11th June 2026 Release asyncinject 0.7 — Run async workflows using pytest-fixtures-style dependency injection I built this utility library to support an asyncio dependency injection pattern a few years ago. I was using it with Datasette and Clau

06.10 周三 · 2 条最高信号：DeepMind 联合五方机构设立千万美元多智能体 AI 安全研究基金

个人行动 deepmind.google

DeepMind 联合五方机构设立千万美元多智能体 AI 安全研究基金

DeepMind 牵头、多机构联合出资最高 1000 万美元，将"亿级 Agent 互操作安全"正式列为独立研究议题，是行业首次系统性资助多 Agent 涌现安全研究。

展开摘要

Google DeepMind 联合 Schmidt Sciences、Cooperative AI Foundation、英国先进研究与发明署（ARIA）及 Google.org，于 2026 年 6 月宣布设立最高 1000 万美元的多智能体 AI 安全研究资助计划，面向全球学术及独立研究者开放提案。 **背景与动机**：随着 AI 规模化，数百万由不同机构构建的 AI Agent 将在数字环境中相互通信、协商与交易，产生难以预测的"涌现"集体行为。现有安全评估框架主要针对单一模型，无法应对系统间交互带来的隐性风险。DeepMind 指出，当前多 Agent 交互复杂度已超出现有安全模型的覆盖范围，处于"关键节点"。 **四大资助优先方向**： 1. **沙盒与测试床**——构建可复现的多 Agent 评估环境，含虚拟市场、模拟生态及跨组织工作流； 2. **Agent 网络科学**——研究交互 Agent 群体的安全属性、集体能力涌现机制及网络失稳检测； 3. **强化 Agent 基础设施**——压力测试跨平台 Agent 交互中身份、声誉与承诺协议的安全性； 4. **监督与控制**——开发大规模已部署 Agent 种群的监测与集体危害缓解方法。 DeepMind 表示其 2025 年已建立多 Agent 安全交互基础框架，并发布了关于"AI Agent 陷阱"（对抗环境中 Agent 漏洞）的研究；本次资金投入旨在加速全球独立研究者网络，弥补单一实验室无法独立解决多 Agent 安全问题的结构性缺口。

原文摘录 Skip to main content Explore our next generation AI systems Explore models Gemini Gemini Build intelligent agents Gemini Omni Create anything from anything Nano Banana Create and edit detailed images Gemini Audio Talk, create and control audio Specialized models Veo Generate cinematic video with audio Imagen Generate high-quality images from text Lyria Generate high fidelity music and audio World models & embodied AI Genie 3 Generate and explore interactive worlds Gemini Robotics Perceive, reaso

本人发言 X @karpathy

Karpathy：Claude Fable 5 是代际跃升，与 Mythos 同底层、加安全护栏

顶级 AI 研究者亲测背书，称 Fable 5 质性领先可比肩 Claude 4.5，长难题求解能力尤为突出，但初期安全护栏过于保守需调优。

展开摘要

Andrej Karpathy 在 X 上对 Claude Fable 5 发布发表实质性评价。核心要点如下： **模型定位**：Fable 5 与 Mythos 共用同一底层模型，区别在于叠加了安全护栏（safeguards）。 **基准表现**：官方数据显示在几乎所有测试基准上达到 SOTA，在软件工程、知识工作、科研和视觉任务上表现尤为突出；任务越长、越复杂，领先幅度越大。 **质性判断**：Karpathy 认为这是"值得大版本号提升"的代际跃升，可与 2025 年 11 月发布的 Claude 4.5 相提并论。模型在长时间、高难度问题求解上表现最为突出，能理解并直接执行更大胆的任务指令，让人产生"不必再盯代码"的冲动——但他明确提醒不应在生产环境中这样做。 **已知问题**：模型仍存在一些用户会遭遇的怪癖（quirks）；发布初期安全护栏设置偏保守（"trigger-happy"），需要随时间调优。 **更大视角**：Karpathy 援引 Jevon's 悖论——工作软件越来越触手可得，自身对软件的需求反而大幅增长。他列举了解释器、可视化工具、仪表盘、定制单用途应用、测试套件扩充、代码自动优化、大型研究项目等场景，表达对 Fable 5 时代产品可能性的高度期待。

原文摘录 This is a super exciting release - Claude Fable 5 is the same underlying model as Mythos but with added safeguards. The benchmarks are great and it's SOTA on everything by a margin but I'll add that *qualitatively* also, this is a major-version-bump-deserving step change forward (imo of the same order as Claude 4.5 was in November), peaking especially for long problem-solving sessions on very difficult problems. You can give it a lot more ambitious tasks than what you're used to, the model "gets

06.09 周二 · 3 条最高信号：Gemini 3.5 Live Translate 发布：支持 70+ 语言的近实时连续语音翻译

个人行动 deepmind.google

Gemini 3.5 Live Translate 发布：支持 70+ 语言的近实时连续语音翻译

Google DeepMind 推出首个连续流式语音翻译模型，打破逐句延迟瓶颈，Google Meet 支持语言组合从 5 种跃升至 2000+。

展开摘要

Google DeepMind 于 2026 年 6 月 9 日正式发布 Gemini 3.5 Live Translate，定位为其最新音频模型，支持 70 余种语言的近实时语音到语音翻译。 **核心技术突破**：与传统逐句等待的翻译系统不同，该模型采用连续流式生成方式，在保留说话者语调、节奏与音调的同时，全程仅落后说话者数秒，避免尴尬停顿。模型可自动识别输入语言，无需手动配置，并具备噪声鲁棒性以应对嘈杂环境。 **三条发布路径同步开放**：①开发者侧——通过 Gemini Live API 及 Google AI Studio 公开预览版访问；②企业侧——Google Meet 本月起向部分 Google Workspace 企业客户开放私有预览，年内扩大范围；③消费者侧——Google Translate（Android/iOS）全球上线实时翻译新体验，配合任意耳机使用。 **规模升级**：Google Meet 集成后，支持语言从原有 5 种扩展至 70+，单次会议可支持语言组合从"仅限英语互译"扩展至 2000+ 种。 **生态伙伴**：Agora、Fishjam、LiveKit、Pipecat、Vision Agents 等平台已集成 Gemini Live API；打车平台 Grab 正在测试该模型以服务其每月超 1000 万次的多语言司机-乘客语音通话。

原文摘录 Skip to main content The Keyword Fluid, natural voice translation with Gemini 3.5 Live Translate Share x.com Facebook LinkedIn Mail Copy link Home Innovation & AI Innovation & AI Models & Research Google DeepMind Google Research Google Labs Gemini models Quantum computing See all Products Developer tools Gemini app NotebookLM See all Infrastructure & cloud Global network Google Cloud See all Technology Safety & Security Health See all Learn more: Google DeepMind blog Google Research blog Google

个人行动 deepmind.google

Google DeepMind 发布 Gemma 4 12B：首款无编码器多模态开源模型

Google DeepMind 推出可在 16GB 内存笔记本本地运行的 12B 多模态模型，以无编码器统一架构直接处理视觉与音频，性能接近 26B MoE 模型，Apache 2.0 开源。

展开摘要

Google DeepMind 于 2026 年 6 月 3 日发布 Gemma 4 12B，定位为面向笔记本电脑的多模态智能体模型，填补 E4B（边缘轻量版）与 26B MoE（混合专家版）之间的空白。 **核心架构创新：无编码器设计。** 传统多模态模型依赖独立的视觉/音频编码器，而 Gemma 4 12B 将两者完全移除——视觉输入通过单次矩阵乘法 + 位置嵌入模块直接进入 LLM 主干，音频则将原始信号投影至与文本 token 相同的维度空间，由语言模型统一处理。这一设计降低了延迟和内存占用。 **性能与硬件门槛。** 基准测试表现接近参数量逾两倍的 26B MoE 模型，但总内存占用不到其一半，仅需 16GB VRAM 或统一内存即可在消费级笔记本上运行。 **其他关键特性：** - 首款 Gemma 中等规模模型支持原生音频输入； - 内置 Multi-Token Prediction (MTP) drafters，进一步降低推理延迟； - Apache 2.0 许可证开源，权重可从 Hugging Face 和 Kaggle 直接下载； - 支持 llama.cpp、MLX、vLLM、SGLang 等主流推理框架及 Unsloth 微调； - 同步发布官方 Gemma Skills Repository（面向智能体开发的技能库）。 **生态数据：** 截至发布时，Gemma 4 系列累计下载量已超 1.5 亿次，社区应用场景覆盖可穿戴辅助机器臂到企业级 AI 安全等方向。对 AI 产品经理的核心关注点：无编码器统一架构若被验证可行，将成为边缘多模态部署的重要范式转变，同时 Apache 2.0 许可证大幅降低商业集成门槛。

原文摘录 Skip to main content The Keyword Introducing Gemma 4 12B: a unified, encoder-free multimodal model Share x.com Facebook LinkedIn Mail Copy link Home Innovation & AI Innovation & AI Models & Research Google DeepMind Google Research Google Labs Gemini models Quantum computing See all Products Developer tools Gemini app NotebookLM See all Infrastructure & cloud Global network Google Cloud See all Technology Safety & Security Health See all Learn more: Google DeepMind blog Google Research blog Googl

个人行动 deepmind.google

Google DeepMind 启动欧洲机器人加速器，遴选15家初创公司接入 Gemini 机器人模型

DeepMind 以加速器形式向欧洲机器人生态系统性输出 Gemini 模型与 AI 技术栈，加速 Physical AI 商业落地。

展开摘要

Google DeepMind 于2026年6月宣布启动"Google DeepMind Accelerator: Robotics"，从欧洲遴选15家早期机器人初创公司，在伦敦集中开展为期3个月的密集支持计划。入选企业可获得 Google AI 技术栈、技术专家对接及 Gemini 机器人模型访问权限，并享有技术导师制、产品指导与合作伙伴网络。本期队列覆盖场景广泛：挪威3D-Components专注 AI 驱动的机器人焊接与金属3D打印质检（声称效率提升280倍）；希腊Acumino开发硬件无关的工业物理AI；罗马尼亚Adapta Robotics复现人类触觉以支持医疗、汽车、消费电子的自动化QA。应用领域还延伸至物流、制造、医疗健康、气候方案及高级导航。该项目由 Google DeepMind VP 机器人负责人 Carolina Parada 主导。材料原文在公司名单处被截断，完整15家名单信息不足。此举表明 DeepMind 正将机器人AI能力通过孵化渠道向欧洲生态扩散，是 Physical AI 从研究走向规模化商业应用的重要布局。

原文摘录 Skip to main content The Keyword Powering the future of robotics in Europe Share x.com Facebook LinkedIn Mail Copy link Home Innovation & AI Innovation & AI Models & Research Google DeepMind Google Research Google Labs Gemini models Quantum computing See all Products Developer tools Gemini app NotebookLM See all Infrastructure & cloud Global network Google Cloud See all Technology Safety & Security Health See all Learn more: Google DeepMind blog Google Research blog Google Developers blog Google

04a

在追的人

PEOPLE · 10

头衔、定位与领域——点卡片回到流里只看 TA

前沿实验室 · 4 人

工程与教育 · 2 人

研究与评测 · 2 人

综述与观察 · 2 人