v0.1.0 · MIT 开源协议 · Python 3.12+

OpenSquillaOpenSquilla
提升单位成本的 Agent 智能

微内核 AI Agent——同样的预算,让 Agent 做更多事、做更好的事
智能路由、持久记忆、安全沙箱,三管齐下。

60-80%1
Token 成本节省
3
档安全沙箱
4
档智能路由
5+
渠道即插即用

快速开始

克隆、安装、启动,三步搞定

1

克隆仓库

$ git lfs install
$ git clone https://github.com/Token-Rhythm/pycrab.git
$ cd pycrab
$ git lfs pull --include="src/pycrab/contrib/token_saver/models/**"

需要 Git LFS 来拉取内置的 ML 路由模型文件

2

安装依赖

# 推荐:包含记忆系统 + 内置 ML 路由
$ uv sync --extra recommended

# 最小核心运行时
$ uv sync
3

启动 Gateway

# 启动 ASGI 服务(默认 127.0.0.1:18790)
$ pycrab gateway run

# 自定义端口和绑定地址
$ pycrab gateway run --port 8000 --bind 0.0.0.0

启动后访问 http://127.0.0.1:18790 打开控制面板

一次部署,多端接入 3

配好一个 Agent,同时在 5 个渠道使用

Slack Discord 飞书 Terminal WebSocket

每一分钱,都花在刀刃上

OpenSquilla,让你的 Agent 花更少的钱、记更多的事、跑得更安全。

💰

高效省钱

多条链路协同,把每一个 Token 都花在刀刃上

智能路由 ²
就像打车软件——简单问题坐公交(便宜模型),复杂问题才叫专车(强模型),系统自动判断
185 维特征分析
从文字长度、语言、代码片段、关键词等 185 个维度分析你的问题,精准判断该派哪个模型
思维深度分级
简单问题关闭推理计费,复杂问题才开启深度思考,避免为"你好"付推理 Token 的钱
自适应 Prompt
根据任务难度自动调整提示词,告诉模型该用什么深度来回答——简单问题轻装上阵,复杂问题全力以赴
按需加载技能
不是一股脑把所有能力塞给 AI,而是只加载当前用得到的,避免 Token 浪费
🧠

类人记忆

四层认知架构,用得越久越懂你

四层记忆结构
工作记忆(当前任务)→ 情节记忆(经历与因果链)→ 语义记忆(事实与规则)→ 原始记忆(审计回溯底座),像人脑认知系统一样分层运作
混合搜索引擎
向量语义搜索 + 全文关键词搜索双管齐下,既懂"意思相近"也能精确匹配
热门记忆浮顶
经常被召回的记忆会自动"冒泡"到前面,越常用越好找,冷门记忆自然沉底
时间衰减机制
30 天半衰期,旧记忆逐渐淡化,但标记为"永久"的核心知识不受影响
Memory Dream 整理
每 24 小时自动让 AI "做梦"——把零散记忆归纳整理,就像睡眠中巩固记忆一样
🛡️

安全沙箱

让 Agent 放手干活,又不怕它搞砸

三档安全策略
标准模式直接执行,严格模式启用沙箱审批,锁定模式强制人工审核——按风险自动升级
真正的沙箱隔离
Linux 用 Bubblewrap、macOS 用 Seatbelt,代码在隔离环境运行,碰不到你的真实文件
否决账本
连续 3 次被拒绝?AI 自动暂停执行,防止"暴力穷举"绕过安全策略
防引用绕过
被拒绝的操作结果会立即清除缓存,AI 没法通过"读取上次结果"偷偷使用
Prompt 注入防护
对所有技能描述和工具结果做 XML 转义处理,堵住注入攻击的入口

微内核:小核心,大生态

借鉴操作系统微内核思想——核心引擎只做最少的事:编排调度和状态管理,其余能力全部以插件形式在"用户态"运行。想换 LLM 供应商?实现一个 Protocol 就行。想加新工具?写 5 行代码即可。插件崩溃不影响核心,核心升级不破坏插件。

OpenSquilla
OpenSquilla Core Engine
编排器 110 行 · 状态机驱动 · 全异步 · 出错自动回滚
⚙️
engine/
状态机引擎
🤖
provider/
多 LLM 供应商
🌐
gateway/
ASGI RPC 网关
🧠
memory/
多层记忆系统
📡
channels/
5 渠道适配
🔧
tools/ + mcp/
MCP-first 工具
🛡️
sandbox/
安全沙箱
scheduler/
任务调度
🧩
skills/
技能插件系统
🎭
identity/
身份 & 提示词

技术栈

Python 3.12+ async/await Pydantic v2 SQLite (WAL + FTS5) Starlette + uvicorn LightGBM ONNX Runtime MCP Protocol

同样的预算,更高的智能密度

和同类开源 Agent 框架逐项对比,看看每一块钱能买到什么4

🏗️架构形态
OpenSquilla
✅ 微内核 5 层分离,核心编排器仅 110 行,所有能力以插件接入,出错自动跳过+回滚
OpenClaw
⚠️ 有插件市场(102 个扩展),但核心和扩展边界模糊
Hermes Agent
❌ 9400 行单体同步主循环,全部逻辑耦合在一起
💰高效省钱
OpenSquilla
✅ ML 路由自动选模型 + 思维深度分级 + Prompt 缓存隔离 + 技能按需加载,多链路协同省 60-80%
OpenClaw
⚠️ 配置文件写死主模型+备用链,不会看内容自动选
Hermes Agent
⚠️ 靠关键词+字数粗糙判断,只有路由一条省钱链路
💾记忆系统
OpenSquilla
✅ 向量召回+关键词搜索+结果去重+老记忆自动衰减+重要记忆"冒泡"晋升+数据库自动迁移
OpenClaw
⚠️ 向量库+会话流水,无衰减/冒泡/多样性重排
Hermes Agent
⚠️ 仅关键词搜索,无向量语义,要语义记忆得外挂
🛡️安全沙箱
OpenSquilla
✅ 不依赖 Docker,系统调用级隔离 CPU/内存/时长+网络三档控制,能塞进 serverless
OpenClaw
⚠️ 必须 Docker(含独立浏览器沙箱镜像),偏重
Hermes Agent
✅ 危险命令审批 + 6 种执行环境(本地/Docker/SSH 等)
💰成本追踪
OpenSquilla
✅ 每次调用自带实付金额,可挂额度钩子用超自动断流
OpenClaw
✅ 内置模型价格表,成本写进会话元数据
Hermes Agent
✅ 输入/输出/缓存读写/推理 token 分五项统计
📊可观测性
OpenSquilla
✅ 决策日志存 hash 不存原文(天然合规审计),管线每环节强制留痕
OpenClaw
✅ 原生 OpenTelemetry,开箱即接 Prometheus/Grafana
Hermes Agent
⚠️ SQLite 会话表+调用计数,较基础
🧩扩展开发
OpenSquilla
✅ 写 5 行 duck-typed 类即可,不继承基类、不发包、不写 manifest
OpenClaw
⚠️ 需在 plugin-sdk 实现接口+写 manifest 清单
Hermes Agent
⚠️ import 时自动注册全局表(隐式副作用)

谁最需要 OpenSquilla?

这些场景下,OpenSquilla 能带来最大收益

🏢
企业私有化部署
完全离线运行,数据不出内网,ML 路由本地推理
📋
合规与审计场景
三档安全策略 + 决策日志哈希脱敏 + 人工审批闸门
💸
预算有限但要求不低
同样的钱跑更多任务,智能路由自动选最划算的模型
🧠
需要 Agent 越用越懂你
四层类人记忆自动积累上下文,不再每次对话从零开始
早期访问名额有限

成为 OpenSquilla 首批用户

告诉我们你的使用场景,我们会优先邀请最匹配的团队加入早期访问。
无需任何承诺,2 分钟填完。

完全免费
数据保密
优先技术支持
产品共建机会