v0.3.1 · Apache License 2.0 · Python 3.12+
OpenSquilla

Token-effiziente AI-Agent-Intelligenz

Microkernel AI Agent — gleiches Budget, Ihr Agent erledigt mehr und besser.
Smart Routing, persistenter Speicher, sichere Sandbox — plus integrierte Suche und lokale Embeddings.

60-80%1
Token-Kosten-Einsparung
N+
Meta-skills
1-Klick
Migration von OpenClaw / Hermes
10+
Integrierte Kanäle

Schnellstart

Vier Wege zum Einstieg — wählen Sie, was zu Ihnen passt

Der empfohlene Weg unter Windows, macOS und Linux. uv installiert OpenSquilla in eine eigene isolierte Umgebung und verwaltet sein eigenes Python — kein System-Python erforderlich. Dieser Weg installiert nur veröffentlichte Releases.

1

uv installieren

Überspringen, wenn uv --version bereits funktioniert.

$ curl -LsSf https://astral.sh/uv/install.sh | sh
$ . "$HOME/.local/bin/env"
2

OpenSquilla installieren

Auf allen Plattformen derselbe Befehl.

$ uv tool install --python 3.12 "opensquilla[recommended] @ https://github.com/opensquilla/opensquilla/releases/download/v0.3.1/opensquilla-0.3.1-py3-none-any.whl"

Installiert das OpenSquilla-Wheel von der Release-URL; uv lädt anschließend die von den gewählten Extras deklarierten Abhängigkeiten. Das Standard-Extra recommended enthält die SquillaRouter-Laufzeitabhängigkeiten (ONNX Runtime, LightGBM, NumPy, tokenizers).

3

Konfigurieren und starten

# Interaktiver Onboarding-Assistent
$ opensquilla onboard

# ASGI-Server starten
$ opensquilla gateway run

Falls opensquilla direkt nach einer frischen uv-Installation nicht gefunden wird, öffnen Sie ein neues Terminal oder führen Sie die PATH-Zeile aus Schritt 1 erneut aus.

Wheel-URLs sind per Design versioniert — Installer prüfen die Version im Dateinamen. Der Befehl oben pinnt auf v0.3.1.

Für fortgeschrittene Nutzung besuchen Sie das GitHub-Repo

Einmal deployen, überall erreichbar 3

Konfigurieren Sie einen Agent, bedienen Sie Nutzer auf mehreren Kanälen

Terminal Web Slack Discord Telegram MS Teams Matrix Lark DingTalk WeCom QQ

Jeder Cent dort, wo es zählt

OpenSquilla lässt Ihren Agent weniger ausgeben, mehr merken und sicherer laufen.

💰

Kostenoptimierung

Mehrere Strategien koordiniert, um jeden Token zu maximieren

Smart Routing ²
Wie Ride-Sharing — einfache Fragen nehmen den Bus (günstige Modelle), komplexe bekommen die Premium-Fahrt (Top-Modelle). Das System entscheidet.
Hybride Feature-Analyse
Kombiniert handgefertigte Features (Länge, Sprache, Codeblöcke, Stichwörter) mit embedding-basierten semantischen Features, um Komplexität zu bewerten und das richtige Modell zu wählen.
Reasoning-Tiefenstufen
Deaktiviert Reasoning-Abrechnung für einfache Anfragen, aktiviert tiefes Denken nur bei komplexen — kein Bezahlen von Reasoning-Tokens für „Hallo".
Adaptive Prompts
Passt den Prompt automatisch an die Aufgaben-Komplexität an — leicht für Einfaches, volle Power für Komplexes.
Skills nach Bedarf
Kein Vollstopfen aller Fähigkeiten in den Kontext. Lädt nur, was für die aktuelle Aufgabe nötig ist — verhindert Token-Verschwendung.
🪄

MetaSkills-Protokoll

Ein Meta-Protokoll, das dem Agent sagt, wie er Skills im großen Maßstab findet, filtert, kombiniert — und sogar weiterentwickelt

Selbstorganisierend
Mehrstufige Arbeit wird zu wiederverwendbaren, einsehbaren Workflows. Composition-Parsing, Step-Scheduling, Proposal Gates — Rezepte, denen du beim Ausführen vertraust.
meta-skill-creator
Eine gebündelte MetaSkill, die wiederkehrende Mehr-Skill-Kollaborationen in Vorschläge für neue MetaSkills verwandelt — der Agent baut damit seinen eigenen Katalog aus.
N+ Community-Skills
Der Agent findet, bewertet und ruft Skills aus dem Community-Katalog selbständig auf — kein manuelles Auswählen, der passende wird einfach geladen.
10+ gebündelte MetaSkills
Kuratierte MetaSkills out of the box — Research-to-Report, Paper-Entwurf, Bewerbungsvorbereitung, Projektplanung, Kurzfilm-Produktion und mehr hochwertige Workflows, sofort einsatzbereit.
Replay & Traummodus
Jede Workflow-Ausführung hinterlässt eine auditierbare, wiederholbare Spur. Während du untätig bist, sichtet OpenSquilla diese Spuren, destilliert Nutzungsmuster und entwirft Kandidat-MetaSkills — Fähigkeiten wachsen im Hintergrund.
🧠

Menschenähnliches Gedächtnis

Vier-Schichten-Kognitionsarchitektur — wird mit Nutzung schlauer

Vier-Schichten-Speicherstruktur
Arbeitsgedächtnis (aktuelle Aufgabe) → Episodisch (Erfahrung & Kausalität) → Semantisch (Fakten & Regeln) → Roh (Audit & Re-Training-Basis) — spiegelt menschliche Kognition wider.
Hybride Suche + lokale Embeddings
Vektor-semantische Suche + Volltext-Stichwortsuche parallel. Eingebaute ONNX-Inferenz auf CPU — Embeddings bleiben auf Ihrer Maschine, optional Wechsel zu OpenAI / Ollama.
Hot-Memory-Beförderung
Häufig abgerufene Erinnerungen steigen automatisch nach oben. Je nützlicher, desto zugänglicher. Kalte Erinnerungen sinken natürlich.
Zeitlicher Zerfall
Datierte Erinnerungen verblassen exponentiell, während als „evergreen" markierte Elemente unverändert bleiben.
Memory-Dream-Konsolidierung
Alle 24 Stunden „träumt" die KI — konsolidiert verstreute Erinnerungen in strukturiertes Wissen. Wie Schlaf das menschliche Gedächtnis konsolidiert.
🛡️

Sicherheits-Sandbox

Lassen Sie Ihren Agent handeln — ohne Angst vor dem, was er tun könnte

Drei-Stufen-Richtlinie
Standard läuft direkt, Strict erfordert Sandbox-Genehmigung, Locked erzwingt menschliche Prüfung — risikobasierte Eskalation.
Echte Sandbox-Isolation
Bubblewrap unter Linux, Seatbelt unter macOS — Code läuft in isolierter Umgebung, berührt nie Ihre echten Dateien.
Ablehnungsregister
Drei Ablehnungen in Folge? KI pausiert automatisch. Stoppt „Brute-Force"-Versuche, Sicherheitsrichtlinien zu umgehen.
Schutz vor veralteten Outputs
Ergebnisse abgelehnter Operationen werden sofort gelöscht — KI kann „letzte Ausgabe lesen" nicht als Side-Channel nutzen.
Prompt-Injection-Abwehr
XML-Escape aller Skill-Metadaten und Tool-Ergebnisse — schließt gängige Injection-Angriffsvektoren.

Microkernel: winziger Kern, riesiges Ökosystem

Inspiriert von OS-Microkerneln — die Core-Engine erledigt das Minimum: Orchestrierung und Zustandsverwaltung. Alles andere läuft als Plugin im „User Space". LLM-Anbieter wechseln? Ein Protocol implementieren. Neues Tool? 5 Codezeilen. Plugin-Crashes betreffen den Kern nicht; Kern-Updates brechen keine Plugins.

OpenSquilla
OpenSquilla Core Engine
Kompakter Pipeline-Orchestrator · State Machine · Vollständig async · Auto-Rollback bei Fehlern
⚙️
engine/
State Machine
🤖
provider/
Multi-LLM-Provider
🌐
gateway/
ASGI-RPC-Gateway
🧠
memory/
Mehrschichtiger Speicher
📡
channels/
Kanal-Adapter
🔧
tools/ + mcp/
MCP-First-Tools
🛡️
sandbox/
Sicherheits-Sandbox
scheduler/
Task-Scheduler
🧩
skills/
Skill-Plugins
🎭
identity/
Identität & Prompts
Eingebaut
🔍 Suche: Brave / DuckDuckGo 🧬 Lokale Embeddings: ONNX lokale Inferenz (offline · Daten bleiben auf dem Gerät) 🔌 Optionale Embeddings: OpenAI / Ollama

Gleiches Budget, höhere Intelligenzdichte

Punkt-für-Punkt-Vergleich mit vergleichbaren Open-Source-Agent-Frameworks4

🏗️Architektur
OpenSquilla
✅ Microkernel mit 5-schichtiger Trennung, ultrakompakter Core-Orchestrator (~100 Zeilen), alle Fähigkeiten als Plugin, Auto-Skip + Rollback bei Fehlern
OpenClaw
⚠️ Reifes Plugin-Ökosystem (Dutzende Erweiterungen), klare Grenzen aber mehr Schichten
Hermes Agent
❌ Massive monolithische Sync-Hauptschleife (Tausende Zeilen), gesamte Logik eng gekoppelt
💰Kostenoptimierung
OpenSquilla
✅ ML-Routing + Reasoning-Tiefenstufen + Prompt-Cache-Isolation + On-Demand-Skills — Mehr-Strategien-Einsparung von 60-80%
OpenClaw
⚠️ Primär-/Fallback-Modell in Config gepinnt, keine inhaltsabhängige Auswahl
Hermes Agent
⚠️ Grobe Stichwort- + Längen-Heuristiken, einzige Routing-Strategie
💾Speichersystem
OpenSquilla
✅ Vektor + Stichwort + Dedup + zeitlicher Zerfall + Hot-Memory-Beförderung + Auto-Schema-Migration
OpenClaw
⚠️ Hat Zerfall / Beförderung / Vielfalts-Reranking, aber keine 4-Schichten-Kognitionsstruktur & Memory-Dream-Konsolidierung
Hermes Agent
⚠️ Nur Stichwortsuche, keine Vektorsemantik, semantischer Speicher braucht externe Integration
🛡️Sicherheits-Sandbox
OpenSquilla
✅ Keine Docker-Abhängigkeit — Syscall-Level CPU/Speicher/Zeit-Isolation + 3-stufige Netzwerkkontrolle. Serverless-tauglich
OpenClaw
⚠️ Docker optional mit OpenShell als Lightweight-Alternative, schwerer als Syscall-Level-Isolation
Hermes Agent
✅ Genehmigung gefährlicher Befehle + 6 Ausführungsumgebungen (lokal/Docker/SSH usw.)
💰Kostenverfolgung
OpenSquilla
✅ Tatsächliche Kosten pro Aufruf out-of-the-box, Quota-Hooks für Auto-Throttling bei Überschreitung
OpenClaw
✅ Eingebaute Preistabelle, Kosten in Session-Metadaten geschrieben
Hermes Agent
✅ Input/Output/Cache-Read/Cache-Write/Reasoning-Tokens separat erfasst
📊Beobachtbarkeit
OpenSquilla
✅ Entscheidungs-Logs als Hashes (kein Klartext, compliance-freundlich), jede Pipeline-Stufe instrumentiert
OpenClaw
✅ Natives OpenTelemetry (als Plugin), Plug-and-Play mit Prometheus/Grafana
Hermes Agent
⚠️ SQLite-Session-Tabelle + Aufruf-Counter, Basis-Niveau
🧩Erweiterungs-DX
OpenSquilla
✅ Eine Duck-Typed-Klasse mit wenigen Zeilen ist ein gültiges Plugin — keine Basisklasse, kein SDK-Paket, kein Manifest
OpenClaw
⚠️ Interface in plugin-sdk implementieren + Manifest-Datei schreiben
Hermes Agent
⚠️ Tools registrieren sich beim Import automatisch (implizite Seiteneffekte)

Wer profitiert am meisten von OpenSquilla?

Diese Szenarien erzielen den höchsten ROI

🏢
On-Premise-Deployment
Vollständig offline, Daten verlassen nie Ihr Netzwerk, ML-Routing läuft lokal
📋
Compliance & Audit
Drei-Stufen-Richtlinien + gehashte Entscheidungs-Logs + menschliche Genehmigungs-Gates
💸
Knappes Budget, hohe Anforderungen
Mehr Aufgaben für gleiche Kosten — Smart Routing wählt das kosteneffizienteste Modell
🧠
Ein Agent, der Sie versteht
Vier-Schichten-Menschengedächtnis sammelt Kontext — nie wieder bei null anfangen
Begrenztes Gratis-Token-Angebot

Gratis-Tokens, risikofreier Test

OpenSquilla ist vollständig Open Source — jederzeit von GitHub holen und selbst hosten.
Aber das Ausführen von LLMs kostet weiterhin Tokens. Wir geben Ihnen Start-Token-Guthaben, damit Sie „OpenSquilla spart 60-80%" risikofrei verifizieren können.

10 Sekunden zum Ausfüllen, keine Kreditkarte nötig.

Apache 2.0 Open Source
Keine Kreditkarte
Priorisierter Support
Begrenzte Stückzahl · Wer zuerst kommt