v0.1.0 · MIT 开源协议 · Python 3.12+
OpenSquilla
提升单位成本的 Agent 智能
微内核 AI Agent——同样的预算,让 Agent 做更多事、做更好的事。
智能路由、持久记忆、安全沙箱,三管齐下。
60-80%1
Token 成本节省
3
档安全沙箱
4
档智能路由
5+
渠道即插即用
快速开始
克隆、安装、启动,三步搞定
1
克隆仓库
$ git lfs install $ git clone https://github.com/Token-Rhythm/pycrab.git $ cd pycrab $ git lfs pull --include="src/pycrab/contrib/token_saver/models/**"
需要 Git LFS 来拉取内置的 ML 路由模型文件
2
安装依赖
# 推荐:包含记忆系统 + 内置 ML 路由 $ uv sync --extra recommended # 最小核心运行时 $ uv sync
3
启动 Gateway
# 启动 ASGI 服务(默认 127.0.0.1:18790) $ pycrab gateway run # 自定义端口和绑定地址 $ pycrab gateway run --port 8000 --bind 0.0.0.0
启动后访问 http://127.0.0.1:18790 打开控制面板
一次部署,多端接入 3
配好一个 Agent,同时在 5 个渠道使用
Slack
Discord
飞书
Terminal
WebSocket
每一分钱,都花在刀刃上
OpenSquilla,让你的 Agent 花更少的钱、记更多的事、跑得更安全。
💰
高效省钱
多条链路协同,把每一个 Token 都花在刀刃上
智能路由 ²
就像打车软件——简单问题坐公交(便宜模型),复杂问题才叫专车(强模型),系统自动判断
185 维特征分析
从文字长度、语言、代码片段、关键词等 185 个维度分析你的问题,精准判断该派哪个模型
思维深度分级
简单问题关闭推理计费,复杂问题才开启深度思考,避免为"你好"付推理 Token 的钱
自适应 Prompt
根据任务难度自动调整提示词,告诉模型该用什么深度来回答——简单问题轻装上阵,复杂问题全力以赴
按需加载技能
不是一股脑把所有能力塞给 AI,而是只加载当前用得到的,避免 Token 浪费
🧠
类人记忆
四层认知架构,用得越久越懂你
四层记忆结构
工作记忆(当前任务)→ 情节记忆(经历与因果链)→ 语义记忆(事实与规则)→ 原始记忆(审计回溯底座),像人脑认知系统一样分层运作
混合搜索引擎
向量语义搜索 + 全文关键词搜索双管齐下,既懂"意思相近"也能精确匹配
热门记忆浮顶
经常被召回的记忆会自动"冒泡"到前面,越常用越好找,冷门记忆自然沉底
时间衰减机制
30 天半衰期,旧记忆逐渐淡化,但标记为"永久"的核心知识不受影响
Memory Dream 整理
每 24 小时自动让 AI "做梦"——把零散记忆归纳整理,就像睡眠中巩固记忆一样
🛡️
安全沙箱
让 Agent 放手干活,又不怕它搞砸
三档安全策略
标准模式直接执行,严格模式启用沙箱审批,锁定模式强制人工审核——按风险自动升级
真正的沙箱隔离
Linux 用 Bubblewrap、macOS 用 Seatbelt,代码在隔离环境运行,碰不到你的真实文件
否决账本
连续 3 次被拒绝?AI 自动暂停执行,防止"暴力穷举"绕过安全策略
防引用绕过
被拒绝的操作结果会立即清除缓存,AI 没法通过"读取上次结果"偷偷使用
Prompt 注入防护
对所有技能描述和工具结果做 XML 转义处理,堵住注入攻击的入口
微内核:小核心,大生态
借鉴操作系统微内核思想——核心引擎只做最少的事:编排调度和状态管理,其余能力全部以插件形式在"用户态"运行。想换 LLM 供应商?实现一个 Protocol 就行。想加新工具?写 5 行代码即可。插件崩溃不影响核心,核心升级不破坏插件。
OpenSquilla Core Engine
编排器 110 行 · 状态机驱动 · 全异步 · 出错自动回滚
⚙️
engine/
状态机引擎
🤖
provider/
多 LLM 供应商
🌐
gateway/
ASGI RPC 网关
🧠
memory/
多层记忆系统
📡
channels/
5 渠道适配
🔧
tools/ + mcp/
MCP-first 工具
🛡️
sandbox/
安全沙箱
⏰
scheduler/
任务调度
🧩
skills/
技能插件系统
🎭
identity/
身份 & 提示词
技术栈
Python 3.12+ async/await Pydantic v2 SQLite (WAL + FTS5) Starlette + uvicorn LightGBM ONNX Runtime MCP Protocol
同样的预算,更高的智能密度
和同类开源 Agent 框架逐项对比,看看每一块钱能买到什么4
| 维度 | OpenSquilla | OpenClaw | Hermes Agent |
|---|---|---|---|
| 🏗️架构形态 | ✅ 微内核 5 层分离,核心编排器仅 110 行,所有能力以插件接入,出错自动跳过+回滚 | ⚠️ 有插件市场(102 个扩展),但核心和扩展边界模糊 | ❌ 9400 行单体同步主循环,全部逻辑耦合在一起 |
| 💰高效省钱 | ✅ ML 路由自动选模型 + 思维深度分级 + Prompt 缓存隔离 + 技能按需加载,多链路协同省 60-80% | ⚠️ 配置文件写死主模型+备用链,不会看内容自动选 | ⚠️ 靠关键词+字数粗糙判断,只有路由一条省钱链路 |
| 💾记忆系统 | ✅ 向量召回+关键词搜索+结果去重+老记忆自动衰减+重要记忆"冒泡"晋升+数据库自动迁移 | ⚠️ 向量库+会话流水,无衰减/冒泡/多样性重排 | ⚠️ 仅关键词搜索,无向量语义,要语义记忆得外挂 |
| 🛡️安全沙箱 | ✅ 不依赖 Docker,系统调用级隔离 CPU/内存/时长+网络三档控制,能塞进 serverless | ⚠️ 必须 Docker(含独立浏览器沙箱镜像),偏重 | ✅ 危险命令审批 + 6 种执行环境(本地/Docker/SSH 等) |
| 💰成本追踪 | ✅ 每次调用自带实付金额,可挂额度钩子用超自动断流 | ✅ 内置模型价格表,成本写进会话元数据 | ✅ 输入/输出/缓存读写/推理 token 分五项统计 |
| 📊可观测性 | ✅ 决策日志存 hash 不存原文(天然合规审计),管线每环节强制留痕 | ✅ 原生 OpenTelemetry,开箱即接 Prometheus/Grafana | ⚠️ SQLite 会话表+调用计数,较基础 |
| 🧩扩展开发 | ✅ 写 5 行 duck-typed 类即可,不继承基类、不发包、不写 manifest | ⚠️ 需在 plugin-sdk 实现接口+写 manifest 清单 | ⚠️ import 时自动注册全局表(隐式副作用) |
🏗️架构形态
OpenSquilla
✅ 微内核 5 层分离,核心编排器仅 110 行,所有能力以插件接入,出错自动跳过+回滚
OpenClaw
⚠️ 有插件市场(102 个扩展),但核心和扩展边界模糊
Hermes Agent
❌ 9400 行单体同步主循环,全部逻辑耦合在一起
💰高效省钱
OpenSquilla
✅ ML 路由自动选模型 + 思维深度分级 + Prompt 缓存隔离 + 技能按需加载,多链路协同省 60-80%
OpenClaw
⚠️ 配置文件写死主模型+备用链,不会看内容自动选
Hermes Agent
⚠️ 靠关键词+字数粗糙判断,只有路由一条省钱链路
💾记忆系统
OpenSquilla
✅ 向量召回+关键词搜索+结果去重+老记忆自动衰减+重要记忆"冒泡"晋升+数据库自动迁移
OpenClaw
⚠️ 向量库+会话流水,无衰减/冒泡/多样性重排
Hermes Agent
⚠️ 仅关键词搜索,无向量语义,要语义记忆得外挂
🛡️安全沙箱
OpenSquilla
✅ 不依赖 Docker,系统调用级隔离 CPU/内存/时长+网络三档控制,能塞进 serverless
OpenClaw
⚠️ 必须 Docker(含独立浏览器沙箱镜像),偏重
Hermes Agent
✅ 危险命令审批 + 6 种执行环境(本地/Docker/SSH 等)
💰成本追踪
OpenSquilla
✅ 每次调用自带实付金额,可挂额度钩子用超自动断流
OpenClaw
✅ 内置模型价格表,成本写进会话元数据
Hermes Agent
✅ 输入/输出/缓存读写/推理 token 分五项统计
📊可观测性
OpenSquilla
✅ 决策日志存 hash 不存原文(天然合规审计),管线每环节强制留痕
OpenClaw
✅ 原生 OpenTelemetry,开箱即接 Prometheus/Grafana
Hermes Agent
⚠️ SQLite 会话表+调用计数,较基础
🧩扩展开发
OpenSquilla
✅ 写 5 行 duck-typed 类即可,不继承基类、不发包、不写 manifest
OpenClaw
⚠️ 需在 plugin-sdk 实现接口+写 manifest 清单
Hermes Agent
⚠️ import 时自动注册全局表(隐式副作用)
谁最需要 OpenSquilla?
这些场景下,OpenSquilla 能带来最大收益
🏢
企业私有化部署
完全离线运行,数据不出内网,ML 路由本地推理
📋
合规与审计场景
三档安全策略 + 决策日志哈希脱敏 + 人工审批闸门
💸
预算有限但要求不低
同样的钱跑更多任务,智能路由自动选最划算的模型
🧠
需要 Agent 越用越懂你
四层类人记忆自动积累上下文,不再每次对话从零开始
早期访问名额有限
成为 OpenSquilla 首批用户
告诉我们你的使用场景,我们会优先邀请最匹配的团队加入早期访问。
无需任何承诺,2 分钟填完。
完全免费
数据保密
优先技术支持
产品共建机会