v0.3.1 · Apache License 2.0 · Python 3.12+
OpenSquilla

トークン効率を極める AI Agent

マイクロカーネル AI Agent — 同じ予算で Agent にもっと多く、もっと良い仕事を
スマートルーティング、永続記憶、セキュアサンドボックスに加え、検索とローカル埋め込みも標準搭載。

60-80%1
Token コスト削減
N+
Meta-skills
1-click
OpenClaw / Hermes から移行
10+
チャネル即対応

クイックスタート

ユースケースに合わせて 4 つのパスから選択

Windows、macOS、Linux いずれも推奨のパス。uv が OpenSquilla を独立した環境にインストールし、専用の Python も管理します——システムに Python は不要です。このパスではリリース済みパッケージのみインストールできます。

1

uv をインストール

uv --version がすでに動く場合はスキップしてください。

$ curl -LsSf https://astral.sh/uv/install.sh | sh
$ . "$HOME/.local/bin/env"
2

OpenSquilla をインストール

どのプラットフォームでも同じコマンドです。

$ uv tool install --python 3.12 "opensquilla[recommended] @ https://github.com/opensquilla/opensquilla/releases/download/v0.3.1/opensquilla-0.3.1-py3-none-any.whl"

リリース URL から OpenSquilla の wheel をインストールし、選択した extras が宣言する依存関係を uv が取得します。デフォルトの recommended extra には SquillaRouter のランタイム依存(ONNX Runtime、LightGBM、NumPy、tokenizers)が含まれます。

3

設定して起動

# 対話式 onboarding ウィザード
$ opensquilla onboard

# ASGI サーバーを起動
$ opensquilla gateway run

uv をインストール直後に opensquilla が見つからない場合は、新しいターミナルを開くか、ステップ 1 の PATH 行を再実行してください。

wheel の URL は仕様上バージョン付き—— インストーラはファイル名のバージョンを検証します。上のコマンドは v0.3.1 に固定されています。

高度な使い方は GitHub リポジトリ

一度デプロイすればどこでも使える 3

1 つの Agent を設定するだけで、複数チャネルから利用可能

Terminal Web Slack Discord Telegram MS Teams Matrix Lark DingTalk WeCom QQ

一円たりとも無駄にしない

OpenSquilla は Agent をより安く、より賢く、より安全に動かします。

💰

高効率コスト最適化

複数の戦略が連携し、すべての Token を最大限に活用

スマートルーティング ²
タクシー配車のように — 簡単な質問はバス(安価モデル)で、複雑な質問だけハイヤー(高性能モデル)。システムが自動判断します。
ハイブリッド特徴解析
手作り特徴(長さ・言語・コードブロック・キーワード)と埋め込みベースの意味特徴を組み合わせ、複雑度を判定して最適なモデルを選択。
思考深度の階層化
簡単な質問では推論課金を OFF、複雑な質問のみ深い思考を有効化 — 「こんにちは」に推論 Token は払いません。
アダプティブ Prompt
タスクの難易度に応じてプロンプトを自動調整 — 簡単な質問は軽く、複雑な質問は全力で。
スキルのオンデマンド読込
すべての能力を Agent に詰め込まず、現在のタスクに必要な分だけロード — Token の浪費を防ぎます。
🪄

MetaSkills プロトコル

大量の Skills を前に、Agent に検索・選別・組み合わせ、さらに自律進化させる方法を教えるメタプロトコル

自己組織化
多段ワークが再利用可能で検査可能なワークフローに。組み合わせ解析、ステップスケジューリング、提案ゲート —— 安心して繰り返し走らせられるレシピ。
meta-skill-creator
繰り返し現れる複数 Skill の協調パターンを、新しい MetaSkill の提案に変換する同梱 MetaSkill —— Agent はこれで自分のカタログを増やします。
N+ コミュニティ Skills
Agent はコミュニティカタログから自律的に Skill を検索・ランク付け・呼び出します —— 手動選択不要、適切なものが自動でロードされます。
10+ 同梱 MetaSkills
すぐ使えるキュレーション済み MetaSkill —— リサーチからレポート、論文ドラフト、就活準備、プロジェクト計画、ショートドラマ制作など、高品質ワークフローがそのまま走ります。
リプレイと夢モード
各ワークフロー実行は監査可能で再生可能な痕跡を残します。ユーザーがアイドル状態のとき、OpenSquilla はそれらの痕跡を見直し、使い方のパターンを抽出して候補 MetaSkill を起草します —— バックグラウンドで能力が育ちます。
🧠

人間らしい記憶

4 層の認知アーキテクチャ — 使うほど賢くなる

4 層記憶構造
ワーキングメモリ(現タスク)→ エピソード記憶(経験と因果)→ 意味記憶(事実とルール)→ 生記憶(監査・再学習基盤)— 人間の認知システムを模倣。
ハイブリッド検索 + ローカル埋め込み
ベクトル意味検索 + フルテキストキーワードを並列実行。内蔵 ONNX 推論は CPU で動作し、埋め込みデータが端末から外に出ない(OpenAI / Ollama に切り替えも可能)。
ホットメモリの浮上
よく呼び出される記憶は自動的に「浮上」。よく使うほどアクセスしやすく、冷えた記憶は自然に沈みます。
時間減衰メカニズム
日付付き記憶は指数関数的に減衰し、「永続」とマークされた中核知識は影響を受けません。
Memory Dream 統合
24 時間ごとに AI が「夢を見る」 — 散らばった記憶を構造化された知識に整理。睡眠による記憶定着と同じ。
🛡️

セキュリティサンドボックス

Agent に思い切り動いてもらいつつ、暴走の心配はゼロ

3 段階セキュリティポリシー
Standard は直接実行、Strict はサンドボックス + 承認、Locked は人間レビュー必須 — リスクに応じて自動エスカレート。
本物のサンドボックス分離
Linux は Bubblewrap、macOS は Seatbelt — コードは隔離環境で実行され、実ファイルには触れません。
拒否台帳
3 連続で拒否?AI は自動停止 — セキュリティポリシーを「総当たり」で迂回するのを防ぎます。
古い出力の参照防止
拒否された操作の結果は即座にキャッシュから削除 — 「前回の結果を読む」サイドチャネルを封じます。
Prompt Injection 防御
すべてのスキルメタデータとツール結果を XML エスケープ — 一般的なインジェクション攻撃の入口を塞ぎます。

マイクロカーネル:小さなコア、広大なエコシステム

OS のマイクロカーネルから着想 — コアエンジンは最小限の仕事だけ:オーケストレーションと状態管理。それ以外の能力はすべて「ユーザー空間」のプラグインとして動作します。LLM プロバイダを切り替えたい?Protocol を実装するだけ。新しいツールを追加?コード 5 行で完了。プラグインがクラッシュしてもコアは無事、コアをアップグレードしてもプラグインは壊れません。

OpenSquilla
OpenSquilla Core Engine
コンパクトなパイプラインオーケストレーター · 状態機 · 完全非同期 · エラー時自動ロールバック
⚙️
engine/
ステートマシン
🤖
provider/
マルチ LLM プロバイダ
🌐
gateway/
ASGI RPC ゲートウェイ
🧠
memory/
多層記憶システム
📡
channels/
チャネルアダプタ
🔧
tools/ + mcp/
MCP-First ツール
🛡️
sandbox/
サンドボックス
scheduler/
タスクスケジューラ
🧩
skills/
スキルプラグイン
🎭
identity/
アイデンティティ & プロンプト
標準搭載
🔍 検索:Brave / DuckDuckGo 🧬 ローカル埋め込み:ONNX ローカル推論(オフライン · データは端末内) 🔌 オプション埋め込み:OpenAI / Ollama

同じ予算で、より高い知能密度

同類のオープンソース Agent フレームワークと項目別比較4

🏗️アーキテクチャ
OpenSquilla
✅ マイクロカーネル 5 層分離、極コンパクトなコアオーケストレーター(数百行)、すべての能力がプラグイン化、エラー時自動スキップ + ロールバック
OpenClaw
⚠️ 成熟したプラグインエコシステム(数十の拡張)、境界は明確だが層が多い
Hermes Agent
❌ 巨大なモノリシック同期メインループ(数千行)、すべてのロジックが密結合
💰コスト最適化
OpenSquilla
✅ ML ルーティング + 思考深度階層 + Prompt キャッシュ分離 + オンデマンドスキル — 複数戦略で 60-80% 節約
OpenClaw
⚠️ メイン + フォールバックを設定で固定、内容に応じた自動選択なし
Hermes Agent
⚠️ キーワード + 文字数の粗いヒューリスティック、ルーティング戦略のみ
💾記憶システム
OpenSquilla
✅ ベクトル + キーワード + 重複排除 + 時間減衰 + ホットメモリ浮上 + 自動スキーマ移行
OpenClaw
⚠️ 減衰 / 浮上 / 多様性リランクは備えるが、4 層認知構造と Memory Dream 統合がない
Hermes Agent
⚠️ キーワード検索のみ、ベクトル意味検索なし、意味記憶には外部統合が必要
🛡️セキュリティサンドボックス
OpenSquilla
✅ Docker 不要 — システムコールレベルの CPU/メモリ/時間分離 + 3 段階ネットワーク制御。Serverless にも収まる
OpenClaw
⚠️ Docker 任意、OpenShell が軽量代替、ただしシステムコールレベル分離より重い
Hermes Agent
✅ 危険コマンド承認 + 6 種類の実行環境(local/Docker/SSH 等)
💰コスト追跡
OpenSquilla
✅ 呼び出しごとに実支払額を出力、超過時の自動スロットルクォータフック
OpenClaw
✅ 内蔵価格表、コストはセッションメタデータに記録
Hermes Agent
✅ 入力 / 出力 / キャッシュ読書 / 推論トークンを 5 項目で個別計測
📊可観測性
OpenSquilla
✅ 決定ログはハッシュ保存(生テキスト保存しない、コンプラ対応)、パイプライン各段に計装
OpenClaw
✅ ネイティブ OpenTelemetry(プラグイン形式)、Prometheus/Grafana に即接続
Hermes Agent
⚠️ SQLite セッションテーブル + 呼び出しカウンタ、基礎レベル
🧩拡張開発
OpenSquilla
✅ 数行の duck-typed クラスが有効なプラグイン — ベースクラス・SDK パッケージ・manifest 不要
OpenClaw
⚠️ plugin-sdk でインターフェースを実装 + manifest ファイル記述
Hermes Agent
⚠️ ツールが import 時にグローバル登録(暗黙の副作用)

OpenSquilla が最も役立つのは?

これらのシナリオで最大の ROI を発揮します

🏢
オンプレミス展開
完全オフライン、データはネットワーク外に出ない、ML ルーティングはローカル推論
📋
コンプライアンス & 監査
3 段階ポリシー + ハッシュ化された決定ログ + 人間承認ゲート
💸
予算は厳しいが要求は高い
同じコストでより多くのタスク — スマートルーティングが最もコスパの良いモデルを選択
🧠
あなたを理解する Agent
4 層の人間らしい記憶でコンテキストを蓄積 — もう毎回ゼロから始める必要なし
無料 Token 数量限定プレゼント

無料 Token を、ノーリスクでお試し

OpenSquilla は完全オープンソース — いつでも GitHub から取得してセルフホスト可能。
でも LLM の実行には Token が必要。スタート用の Token クレジットを無料進呈 — 「OpenSquilla で 60-80% 削減」をノーリスクで検証してください。

10 秒で記入完了、クレジットカード不要。

Apache 2.0 オープンソース
クレジットカード不要
優先サポート
数量限定 · 早い者勝ち