v0.5.0rc4 · Apache License 2.0 · Python 3.12+

提升单位成本的 Agent 智能

微内核 AI Agent——同样的预算，让 Agent 做更多事、做更好的事。
智能路由、持久记忆、安全沙箱、开箱即用的搜索与本地嵌入。

快速开始 GitHub

60-80%¹

Token 成本节省

N+

Meta-skills

› Fable 5

智能路由领先

10+

渠道即插即用

最新动态查看全部新闻

我们发布了技术报告 Agentic Routing: The Harness-Native Data Flywheel 📄 2026-07-14

Harness-Native 的 agentic routing 在每一步都基于完整的 harness 状态选出最合适的模型（或多个互补模型），并把每次路由决策转化为可训练更强 router 与模型的带标注数据。已在 OpenSquilla 中实现，并在 DRACO 与 PinchBench 上评测。

阅读全文
OpenSquilla 0.5.0 Preview 4 预览版发布 2026-07-13

面向 0.5 线的升级安全预览版——升级时保护你已有的 workspace、身份、记忆、配置与聊天记录，新增可选的 Windows Portable 数据迁移，并让 Model Ensemble 的进度与用量统计更准确。

阅读全文
OpenSquilla 0.5.0 Preview 3 预览版发布 2026-07-10

0.5 运行时、桌面、路由与部署线的一次大范围预览——为旧版数据目录提供事务化迁移、更广的 provider 与 router 选择（TokenRhythm、GLM 5.2、腾讯 TokenHub）、终端 UI 大改，以及预构建的多架构容器镜像。

阅读全文

实战演示

几个小视频，看 OpenSquilla 怎么处理真实工作流

Windows 便携版安装演示

短剧 meta-skill

论文写作 meta-skill

快速开始

四条上手路径，按你的使用方式任选其一

macOS 与 Windows 上最清晰的上手路径——已签名的桌面客户端，内置控制台 UI 与 Gateway 运行时。无需 Python，也不用终端。

⚡ 中国大陆更快下载国内镜像 · 推荐大陆用户

下载 macOS 版 Apple Silicon · 国内镜像下载 Windows 版 Windows 10/11 x64 · 国内镜像

v0.5.0rc4 · 已签名并公证。旧的便携 zip 仍保留在 releases 页面。

也可从 GitHub 官方下载： macOS · Windows

下载并安装

在上方选择你的平台。macOS：打开 .dmg 并把 OpenSquilla 拖入「应用程序」。Windows：运行 .exe 安装包。

打开 OpenSquilla

启动应用。内置 Gateway 会自动启动——无需再安装任何东西。

完成首次设置

首次启动时，onboarding 会引导你选择 provider 并粘贴所需的 key。控制台 UI 随后直接在应用内打开。

Windows 构建已签名、macOS 构建已公证，无需绕过 SmartScreen 或 Gatekeeper。Linux 用户请使用「终端一键安装」。

Windows、macOS、Linux 都推荐这条路径。uv 把 OpenSquilla 装到独立环境并自带 Python——系统不需要装 Python。该路径只安装已发布的 release。

安装 uv

如果 uv --version 已经能用，跳过此步。

$ curl -LsSf https://astral.sh/uv/install.sh | sh
$ . "$HOME/.local/bin/env"

安装 OpenSquilla

所有平台一条命令。

$ uv tool install --python 3.12 "opensquilla[recommended] @ https://github.com/opensquilla/opensquilla/releases/download/v0.5.0rc4/opensquilla-0.5.0rc4-py3-none-any.whl"

从 release URL 安装 OpenSquilla wheel，由 uv 拉取所选 extras 声明的依赖。默认 recommended extras 包含 SquillaRouter 运行所需的 ONNX Runtime、LightGBM、NumPy、tokenizers。

配置并运行

# 交互式 onboarding 向导
$ opensquilla onboard

# 启动 ASGI 服务
$ opensquilla gateway run

如果 uv 安装完成后立即调用 opensquilla 找不到命令，打开新终端，或重新运行 step 1 里的 PATH 设置。

Wheel URL 按设计携带版本号——安装器会校验文件名里的版本。上面命令固定到 v0.5.0rc4。

前置依赖： Git · Git LFS · uv

没有 uv 时，安装器会回退到 Python 3.12+ 配合 pip ≥ 23。

可选：在终端里一键安装前置依赖

Windows PowerShell

winget install --id Git.Git -e
winget install --id GitHub.GitLFS -e
powershell -ExecutionPolicy Bypass -c "irm https://astral.sh/uv/install.ps1 | iex"
git lfs install

macOS（Homebrew）

brew install git git-lfs uv
git lfs install

Debian / Ubuntu

sudo apt update
sudo apt install -y git git-lfs
curl -LsSf https://astral.sh/uv/install.sh | sh
git lfs install

Fedora

sudo dnf install -y git git-lfs
curl -LsSf https://astral.sh/uv/install.sh | sh
git lfs install

Arch

sudo pacman -S --needed git git-lfs
curl -LsSf https://astral.sh/uv/install.sh | sh
git lfs install

克隆仓库（含 LFS）

$ git lfs install
$ git clone https://github.com/opensquilla/opensquilla.git
$ cd opensquilla
$ git lfs pull --include="src/opensquilla/squilla_router/models/**"

Git LFS 用于拉取内置的 ML 路由模型。该步骤幂等——已经拉完的仓库再跑会静默退出。

运行安装脚本

# 通过 uv tool install 安装 .[recommended]（uv 不可用时回退到 pip --user）
$ bash scripts/install_source.sh

主流渠道在基础安装里已经支持。可选 extras：matrix、matrix-e2e、document-extras——通过 OPENSQUILLA_INSTALL_EXTRAS=matrix（bash）或 -Extras matrix（PowerShell）开启。

交互式配置

$ opensquilla onboard

向导带你完成模型供应商、渠道、安全策略等配置。直接用安装好的 opensquilla 命令，不要加 uv run 前缀（除非你走的是源码开发路径）。

启动 Gateway

# 启动 ASGI 服务（默认 127.0.0.1:18791）
$ opensquilla gateway run

启动后访问 http://127.0.0.1:18791/control/ 打开控制面板。

Windows 缺少 Visual C++ Redistributable 时 Gateway 仍可启动，内置路由会回退到安全的直连路由。

仅在你需要修改、测试或调试当前 checkout 时使用此路径。和「源码安装」不同，它必须用 uv：uv sync 会在 checkout 内创建 .venv，uv run 在源码上直接执行。

# 用 recommended + dev extras 在 checkout 内创建 .venv
$ uv sync --extra recommended --extra dev

# 验证安装
$ uv run opensquilla --help

recommended extras 同样为开发提供 SquillaRouter；dev extras 安装测试、lint、类型检查工具。

把额外 extras 装进同一环境：uv sync --extra recommended --extra dev --extra matrix

在该模式下，所有 opensquilla 命令都要加 uv run 前缀。不要用用户级 opensquilla 去调试开发 checkout——那条命令跑在另一个 Python 环境里。

在 GitHub 查看贡献指南

更高阶的用法请访问 GitHub 仓库

一次部署，多端接入 ³

配好一个 Agent，同时在多个渠道使用

Terminal Web Slack Discord Telegram MS Teams Matrix 飞书钉钉企业微信 QQ

每一分钱，都花在刀刃上

OpenSquilla，让你的 Agent 花更少的钱、记更多的事、跑得更安全。

💰

高效省钱

多条链路协同，把每一个 Token 都花在刀刃上

智能路由 ²

就像打车软件——简单问题坐公交（便宜模型），复杂问题才叫专车（强模型），系统自动判断

混合特征分析

同时融合手工特征（长度、语言、代码片段、关键词等）+ 嵌入语义特征，多维度判断问题难度，精准选模型

思维深度分级

简单问题关闭推理计费，复杂问题才开启深度思考，避免为"你好"付推理 Token 的钱

自适应 Prompt

根据任务难度自动调整提示词，告诉模型该用什么深度来回答——简单问题轻装上阵，复杂问题全力以赴

按需加载技能

不是一股脑把所有能力塞给 AI，而是只加载当前用得到的，避免 Token 浪费

🎯

精度提升

多模型集成路由，在最难的问题上提升作答质量——超越任何单一模型

多模型集成路由

把难题分发给多个候选模型并聚合它们的作答，把精度提升到任何单一模型都达不到的水平。

超越 Fable 5

在内部难题评测中，集成路由击败了所有单模型基线——包括 Fable 5。

结果渐进呈现

在集成收敛的过程中就先给出有用的阶段性结果，不用干等最慢的候选模型。

预设与自定义阵容

可选清晰的预设（静态 OpenRouter B5 / TokenRhythm B5），也可自定义模型阵容——配合超时调优，慢速候选不会拖住整轮。

智能回退

当单模型更合适时，自动走直连路径——该提精度的地方提精度，不该浪费的地方不浪费。

🪄

MetaSkills 协议

面对海量 Skills 的元协议——告诉 Agent 如何检索、筛选、组合，乃至自主进化

自组织

多步骤工作变成可复用、可审视的工作流。组合解析、步骤调度、提案门控——可以放心反复运行的剧本

meta-skill-creator

内置 MetaSkill，把反复出现的多 Skill 协作模式凝练成新的 MetaSkill 提案——Agent 用它给自己长出新能力

N+ 社区 Skills

Agent 自主检索、排序并调用社区贡献的 Skills——遇到新任务不需要人工挑选，合适的就被拉起来

10+ 内置 MetaSkills

开箱即用的精选 MetaSkill——研究到报告、论文草拟、求职准备、项目规划、短剧制作等高质量工作流，装好就能跑

回放与梦境模式

每次工作流执行都留下可审计、可回放的痕迹。用户空闲时，OpenSquilla 回看这些痕迹，提炼使用习惯，自动起草新的 MetaSkill 候选——能力在后台悄悄生长

🧠

类人记忆

四层认知架构，用得越久越懂你

四层记忆结构

工作记忆（当前任务）→ 情节记忆（经历与因果链）→ 语义记忆（事实与规则）→ 原始记忆（审计回溯底座），像人脑认知系统一样分层运作

混合检索 + 本地嵌入

向量语义 + 全文关键词双管齐下，既懂"意思相近"也能精确匹配；内置 ONNX 本地推理嵌入，CPU 即可运行，数据不出本机，也可按需切到 OpenAI / Ollama

热门记忆浮顶

经常被召回的记忆会自动"冒泡"到前面，越常用越好找，冷门记忆自然沉底

时间衰减机制

带时间标签的记忆按指数衰减自动淡化，标记为"永久"的核心知识不受影响

Memory Dream 整理

每 24 小时自动让 AI "做梦"——把零散记忆归纳整理，就像睡眠中巩固记忆一样

🛡️

安全沙箱

让 Agent 放手干活，又不怕它搞砸

三档安全策略

标准模式直接执行，严格模式启用沙箱审批，锁定模式强制人工审核——按风险自动升级

真正的沙箱隔离

Linux 用 Bubblewrap、macOS 用 Seatbelt，代码在隔离环境运行，碰不到你的真实文件

否决账本

连续 3 次被拒绝？AI 自动暂停执行，防止"暴力穷举"绕过安全策略

防引用绕过

被拒绝的操作结果会立即清除缓存，AI 没法通过"读取上次结果"偷偷使用

Prompt 注入防护

对所有技能描述和工具结果做 XML 转义处理，堵住注入攻击的入口

微内核：小核心，大生态

借鉴操作系统微内核思想——核心引擎只做最少的事：编排调度和状态管理，其余能力全部以插件形式在"用户态"运行。想换 LLM 供应商？实现一个 Protocol 就行。想加新工具？写 5 行代码即可。插件崩溃不影响核心，核心升级不破坏插件。

OpenSquilla Core Engine

管线编排清晰可读 · 状态机驱动 · 全异步 · 出错自动回滚

⚙️

engine/

状态机引擎

🤖

provider/

多 LLM 供应商

🌐

gateway/

ASGI RPC 网关

🧠

memory/

多层记忆系统

📡

channels/

多渠道适配

🔧

tools/ + mcp/

MCP-first 工具

🛡️

sandbox/

安全沙箱

⏰

scheduler/

任务调度

🧩

skills/

技能插件系统

🎭

identity/

身份 & 提示词

开箱即用

🔍 内置搜索：Brave / DuckDuckGo 🧬 本地嵌入：ONNX 本地推理（离线 · 数据不出本机） 🔌 可选嵌入：OpenAI / Ollama

同样的预算，更高的智能密度

和同类开源 Agent 框架逐项对比，看看每一块钱能买到什么⁴

维度	OpenSquilla	OpenClaw	Hermes Agent
🏗️架构形态	✅ 微内核 5 层分离，核心编排器极简（百行级），所有能力以插件接入，出错自动跳过+回滚	⚠️ 插件生态成熟（近百个扩展），边界清晰但层级偏多	❌ 单体同步主循环（数千行），全部逻辑耦合在一起
💰高效省钱	✅ ML 路由自动选模型 + 思维深度分级 + Prompt 缓存隔离 + 技能按需加载，多链路协同省 60-80%	⚠️ 配置文件写死主模型+备用链，不会看内容自动选	⚠️ 靠关键词+字数粗糙判断，只有路由一条省钱链路
🪄MetaSkills 协议	✅ 可组合工作流 + meta-skill-creator 自助创作 + 10+ 内置 & N+ 社区 Skills 自动检索 + 梦境模式空闲时凝练新候选	⚠️ Prompt 串联的 skill chain，没有 meta-protocol 层，无自我进化；新工作流靠文档存档，不是运行时对象	❌ 没有可复用工作流抽象——多步骤工作每次会话从零重写 Prompt
💾记忆系统	✅ 向量召回+关键词搜索+结果去重+老记忆自动衰减+重要记忆"冒泡"晋升+数据库自动迁移	⚠️ 衰减/冒泡/多样性重排都有，但缺四层认知结构与 Memory Dream 整合	⚠️ 仅关键词搜索，无向量语义，要语义记忆得外挂
🛡️安全沙箱	✅ 不依赖 Docker，系统调用级隔离 CPU/内存/时长+网络三档控制，能塞进 serverless	⚠️ Docker 可选，提供 OpenShell 作为轻量替代，但仍重于系统调用级隔离	✅ 危险命令审批 + 6 种执行环境（本地/Docker/SSH 等）
💰成本追踪	✅ 每次调用自带实付金额，可挂额度钩子用超自动断流	✅ 内置模型价格表，成本写进会话元数据	✅ 输入/输出/缓存读写/推理 token 分五项统计
📊可观测性	✅ 决策日志存 hash 不存原文（天然合规审计），管线每环节强制留痕	✅ 原生 OpenTelemetry（插件形式），开箱即接 Prometheus/Grafana	⚠️ SQLite 会话表+调用计数，较基础
🧩扩展开发	✅ 写 5 行 duck-typed 类即可，不继承基类、不发包、不写 manifest	⚠️ 需在 plugin-sdk 实现接口+写 manifest 清单	⚠️ import 时自动注册全局表（隐式副作用）

🏗️架构形态

OpenSquilla

✅ 微内核 5 层分离，核心编排器极简（百行级），所有能力以插件接入，出错自动跳过+回滚

OpenClaw

⚠️ 插件生态成熟（近百个扩展），边界清晰但层级偏多

Hermes Agent

❌ 单体同步主循环（数千行），全部逻辑耦合在一起

💰高效省钱

OpenSquilla

✅ ML 路由自动选模型 + 思维深度分级 + Prompt 缓存隔离 + 技能按需加载，多链路协同省 60-80%

OpenClaw

⚠️ 配置文件写死主模型+备用链，不会看内容自动选

Hermes Agent

⚠️ 靠关键词+字数粗糙判断，只有路由一条省钱链路

🪄MetaSkills 协议

OpenSquilla

✅ 可组合工作流 + meta-skill-creator 自助创作 + 10+ 内置 & N+ 社区 Skills 自动检索 + 梦境模式空闲时凝练新候选

OpenClaw

⚠️ Prompt 串联的 skill chain，没有 meta-protocol 层，无自我进化；新工作流靠文档存档，不是运行时对象

Hermes Agent

❌ 没有可复用工作流抽象——多步骤工作每次会话从零重写 Prompt

💾记忆系统

OpenSquilla

✅ 向量召回+关键词搜索+结果去重+老记忆自动衰减+重要记忆"冒泡"晋升+数据库自动迁移

OpenClaw

⚠️ 衰减/冒泡/多样性重排都有，但缺四层认知结构与 Memory Dream 整合

Hermes Agent

⚠️ 仅关键词搜索，无向量语义，要语义记忆得外挂

🛡️安全沙箱

OpenSquilla

✅ 不依赖 Docker，系统调用级隔离 CPU/内存/时长+网络三档控制，能塞进 serverless

OpenClaw

⚠️ Docker 可选，提供 OpenShell 作为轻量替代，但仍重于系统调用级隔离

Hermes Agent

✅ 危险命令审批 + 6 种执行环境（本地/Docker/SSH 等）

💰成本追踪

OpenSquilla

✅ 每次调用自带实付金额，可挂额度钩子用超自动断流

OpenClaw

✅ 内置模型价格表，成本写进会话元数据

Hermes Agent

✅ 输入/输出/缓存读写/推理 token 分五项统计

📊可观测性

OpenSquilla

✅ 决策日志存 hash 不存原文（天然合规审计），管线每环节强制留痕

OpenClaw

✅ 原生 OpenTelemetry（插件形式），开箱即接 Prometheus/Grafana

Hermes Agent

⚠️ SQLite 会话表+调用计数，较基础

🧩扩展开发

OpenSquilla

✅ 写 5 行 duck-typed 类即可，不继承基类、不发包、不写 manifest

OpenClaw

⚠️ 需在 plugin-sdk 实现接口+写 manifest 清单

Hermes Agent

⚠️ import 时自动注册全局表（隐式副作用）

谁最需要 OpenSquilla？

这些场景下，OpenSquilla 能带来最大收益

🏢

私有化部署

完全离线运行，数据不出内网，ML 路由本地推理

📋

合规与审计场景

三档安全策略 + 决策日志哈希脱敏 + 人工审批闸门

💸

预算有限但要求不低

同样的钱跑更多任务，智能路由自动选最划算的模型

🧠

需要 Agent 越用越懂你

四层类人记忆自动积累上下文，不再每次对话从零开始

产品体验官计划 · 现已开启

让 Agent 少烧钱，少作妖，真交付。

加入 OpenSquilla 产品体验群：入群即送 70 元 OpenRouter Tokens，30 天每日 ChatGPT Plus 抽奖，并有机会进入创始用户群参与每周 Pro 抽奖和建议采纳奖励。
和我们一起把 OpenSquilla 做成一个活的开源项目。

加入产品体验群

想先看看源码？在 GitHub 上查看项目

70 元 OpenRouter Tokens

每日 ChatGPT Plus 抽奖

最高 ChatGPT Pro 会员

提升单位成本的 Agent 智能

实战演示

快速开始

下载并安装

打开 OpenSquilla

完成首次设置

安装 uv

安装 OpenSquilla

配置并运行

克隆仓库（含 LFS）

运行安装脚本

交互式配置

启动 Gateway

一次部署，多端接入 3

每一分钱，都花在刀刃上

高效省钱

精度提升

MetaSkills 协议

类人记忆

安全沙箱

微内核：小核心，大生态

同样的预算，更高的智能密度

谁最需要 OpenSquilla？

让 Agent 少烧钱，少作妖，真交付。

一次部署，多端接入 ³