Compaction 与 Cache 连续性

长时间的 agent session 需要上下文管理。OpenSquilla 通过 compaction、受限历史、工具结果投影以及 cache 感知的 prompt 排布，使长期运行的任务持续推进。

Compaction 与记忆不同。记忆是持久回忆。Compaction 是活动 session 的连续性工具。

Compaction 做什么

当 session 历史接近配置的上下文预算时，OpenSquilla 可以将较旧的对话条目 compact 为一份持久摘要，并保留最近的尾部处于活动状态。

目标是保留：

Compaction 并不保证每个旧词都对模型可见。当精确的历史文本很重要时，请导出 session 或保存文件。

根据表层和触发条件，用户可能会看到：

当不需要 compaction 时，OpenSquilla 会使用这条稳定信息：

Already within context budget; no compact was applied

该消息是无操作，而不是失败。

以下情况下手动 compaction 很有用：

当运行时表明 session 已在预算内时，避免反复 compact。

当 OpenSquilla 在 agent 工作之前或工作过程中检测到上下文压力时，可能发生被动 compaction。具体触发条件取决于模型上下文上限、配置的预算、当前历史以及工具输出大小。

如果被动 compaction 失败，最安全的用户应对方式通常是：

Prompt cache 在稳定的 prompt 片段保持稳定时效果最佳。OpenSquilla 会尝试做到：

Cache 连续性是尽力而为的。路由、工具、附件、provider 变更或大量新上下文都可能降低 cache 复用率。