v0.3.1 · Apache License 2.0 · Python 3.12+
OpenSquilla

提升单位成本的 Agent 智能

微内核 AI Agent——同样的预算,让 Agent 做更多事、做更好的事
智能路由、持久记忆、安全沙箱、开箱即用的搜索与本地嵌入。

60-80%1
Token 成本节省
N+
Meta-skills
一键
从 OpenClaw / Hermes 迁移
10+
渠道即插即用

快速开始

四条上手路径,按你的使用方式任选其一

Windows、macOS、Linux 都推荐这条路径。uv 把 OpenSquilla 装到独立环境并自带 Python——系统不需要装 Python。该路径只安装已发布的 release。

1

安装 uv

如果 uv --version 已经能用,跳过此步。

$ curl -LsSf https://astral.sh/uv/install.sh | sh
$ . "$HOME/.local/bin/env"
2

安装 OpenSquilla

所有平台一条命令。

$ uv tool install --python 3.12 "opensquilla[recommended] @ https://github.com/opensquilla/opensquilla/releases/download/v0.3.1/opensquilla-0.3.1-py3-none-any.whl"

从 release URL 安装 OpenSquilla wheel,由 uv 拉取所选 extras 声明的依赖。默认 recommended extras 包含 SquillaRouter 运行所需的 ONNX Runtime、LightGBM、NumPy、tokenizers。

3

配置并运行

# 交互式 onboarding 向导
$ opensquilla onboard

# 启动 ASGI 服务
$ opensquilla gateway run

如果 uv 安装完成后立即调用 opensquilla 找不到命令,打开新终端,或重新运行 step 1 里的 PATH 设置。

Wheel URL 按设计携带版本号——安装器会校验文件名里的版本。上面命令固定到 v0.3.1。

更高阶的用法请访问 GitHub 仓库

一次部署,多端接入 3

配好一个 Agent,同时在多个渠道使用

Terminal Web Slack Discord Telegram MS Teams Matrix 飞书 钉钉 企业微信 QQ

每一分钱,都花在刀刃上

OpenSquilla,让你的 Agent 花更少的钱、记更多的事、跑得更安全。

💰

高效省钱

多条链路协同,把每一个 Token 都花在刀刃上

智能路由 ²
就像打车软件——简单问题坐公交(便宜模型),复杂问题才叫专车(强模型),系统自动判断
混合特征分析
同时融合手工特征(长度、语言、代码片段、关键词等)+ 嵌入语义特征,多维度判断问题难度,精准选模型
思维深度分级
简单问题关闭推理计费,复杂问题才开启深度思考,避免为"你好"付推理 Token 的钱
自适应 Prompt
根据任务难度自动调整提示词,告诉模型该用什么深度来回答——简单问题轻装上阵,复杂问题全力以赴
按需加载技能
不是一股脑把所有能力塞给 AI,而是只加载当前用得到的,避免 Token 浪费
🪄

MetaSkills 协议

面对海量 Skills 的元协议——告诉 Agent 如何检索、筛选、组合,乃至自主进化

自组织
多步骤工作变成可复用、可审视的工作流。组合解析、步骤调度、提案门控——可以放心反复运行的剧本
meta-skill-creator
内置 MetaSkill,把反复出现的多 Skill 协作模式凝练成新的 MetaSkill 提案——Agent 用它给自己长出新能力
N+ 社区 Skills
Agent 自主检索、排序并调用社区贡献的 Skills——遇到新任务不需要人工挑选,合适的就被拉起来
10+ 内置 MetaSkills
开箱即用的精选 MetaSkill——研究到报告、论文草拟、求职准备、项目规划、短剧制作等高质量工作流,装好就能跑
回放与梦境模式
每次工作流执行都留下可审计、可回放的痕迹。用户空闲时,OpenSquilla 回看这些痕迹,提炼使用习惯,自动起草新的 MetaSkill 候选——能力在后台悄悄生长
🧠

类人记忆

四层认知架构,用得越久越懂你

四层记忆结构
工作记忆(当前任务)→ 情节记忆(经历与因果链)→ 语义记忆(事实与规则)→ 原始记忆(审计回溯底座),像人脑认知系统一样分层运作
混合检索 + 本地嵌入
向量语义 + 全文关键词双管齐下,既懂"意思相近"也能精确匹配;内置 ONNX 本地推理嵌入,CPU 即可运行,数据不出本机,也可按需切到 OpenAI / Ollama
热门记忆浮顶
经常被召回的记忆会自动"冒泡"到前面,越常用越好找,冷门记忆自然沉底
时间衰减机制
带时间标签的记忆按指数衰减自动淡化,标记为"永久"的核心知识不受影响
Memory Dream 整理
每 24 小时自动让 AI "做梦"——把零散记忆归纳整理,就像睡眠中巩固记忆一样
🛡️

安全沙箱

让 Agent 放手干活,又不怕它搞砸

三档安全策略
标准模式直接执行,严格模式启用沙箱审批,锁定模式强制人工审核——按风险自动升级
真正的沙箱隔离
Linux 用 Bubblewrap、macOS 用 Seatbelt,代码在隔离环境运行,碰不到你的真实文件
否决账本
连续 3 次被拒绝?AI 自动暂停执行,防止"暴力穷举"绕过安全策略
防引用绕过
被拒绝的操作结果会立即清除缓存,AI 没法通过"读取上次结果"偷偷使用
Prompt 注入防护
对所有技能描述和工具结果做 XML 转义处理,堵住注入攻击的入口

微内核:小核心,大生态

借鉴操作系统微内核思想——核心引擎只做最少的事:编排调度和状态管理,其余能力全部以插件形式在"用户态"运行。想换 LLM 供应商?实现一个 Protocol 就行。想加新工具?写 5 行代码即可。插件崩溃不影响核心,核心升级不破坏插件。

OpenSquilla
OpenSquilla Core Engine
管线编排清晰可读 · 状态机驱动 · 全异步 · 出错自动回滚
⚙️
engine/
状态机引擎
🤖
provider/
多 LLM 供应商
🌐
gateway/
ASGI RPC 网关
🧠
memory/
多层记忆系统
📡
channels/
多渠道适配
🔧
tools/ + mcp/
MCP-first 工具
🛡️
sandbox/
安全沙箱
scheduler/
任务调度
🧩
skills/
技能插件系统
🎭
identity/
身份 & 提示词
开箱即用
🔍 内置搜索:Brave / DuckDuckGo 🧬 本地嵌入:ONNX 本地推理(离线 · 数据不出本机) 🔌 可选嵌入:OpenAI / Ollama

同样的预算,更高的智能密度

和同类开源 Agent 框架逐项对比,看看每一块钱能买到什么4

🏗️架构形态
OpenSquilla
✅ 微内核 5 层分离,核心编排器极简(百行级),所有能力以插件接入,出错自动跳过+回滚
OpenClaw
⚠️ 插件生态成熟(近百个扩展),边界清晰但层级偏多
Hermes Agent
❌ 单体同步主循环(数千行),全部逻辑耦合在一起
💰高效省钱
OpenSquilla
✅ ML 路由自动选模型 + 思维深度分级 + Prompt 缓存隔离 + 技能按需加载,多链路协同省 60-80%
OpenClaw
⚠️ 配置文件写死主模型+备用链,不会看内容自动选
Hermes Agent
⚠️ 靠关键词+字数粗糙判断,只有路由一条省钱链路
💾记忆系统
OpenSquilla
✅ 向量召回+关键词搜索+结果去重+老记忆自动衰减+重要记忆"冒泡"晋升+数据库自动迁移
OpenClaw
⚠️ 衰减/冒泡/多样性重排都有,但缺四层认知结构与 Memory Dream 整合
Hermes Agent
⚠️ 仅关键词搜索,无向量语义,要语义记忆得外挂
🛡️安全沙箱
OpenSquilla
✅ 不依赖 Docker,系统调用级隔离 CPU/内存/时长+网络三档控制,能塞进 serverless
OpenClaw
⚠️ Docker 可选,提供 OpenShell 作为轻量替代,但仍重于系统调用级隔离
Hermes Agent
✅ 危险命令审批 + 6 种执行环境(本地/Docker/SSH 等)
💰成本追踪
OpenSquilla
✅ 每次调用自带实付金额,可挂额度钩子用超自动断流
OpenClaw
✅ 内置模型价格表,成本写进会话元数据
Hermes Agent
✅ 输入/输出/缓存读写/推理 token 分五项统计
📊可观测性
OpenSquilla
✅ 决策日志存 hash 不存原文(天然合规审计),管线每环节强制留痕
OpenClaw
✅ 原生 OpenTelemetry(插件形式),开箱即接 Prometheus/Grafana
Hermes Agent
⚠️ SQLite 会话表+调用计数,较基础
🧩扩展开发
OpenSquilla
✅ 写 5 行 duck-typed 类即可,不继承基类、不发包、不写 manifest
OpenClaw
⚠️ 需在 plugin-sdk 实现接口+写 manifest 清单
Hermes Agent
⚠️ import 时自动注册全局表(隐式副作用)

谁最需要 OpenSquilla?

这些场景下,OpenSquilla 能带来最大收益

🏢
私有化部署
完全离线运行,数据不出内网,ML 路由本地推理
📋
合规与审计场景
三档安全策略 + 决策日志哈希脱敏 + 人工审批闸门
💸
预算有限但要求不低
同样的钱跑更多任务,智能路由自动选最划算的模型
🧠
需要 Agent 越用越懂你
四层类人记忆自动积累上下文,不再每次对话从零开始
免费 Token 限量赠送

领取免费 Token,零成本试用

OpenSquilla 完全开源——你随时可以从 GitHub 拉代码自己部署。
但跑 LLM 还是要付 Token 钱。我们送你一笔启动 Token 额度,让你直接验证「OpenSquilla 智能节省 60-80%」。

10 秒填完,无需信用卡。

Apache 2.0 开源
无需信用卡
优先技术支持
数量有限,先到先得