v0.3.1 · Apache License 2.0 · Python 3.12+

Token-effiziente AI-Agent-Intelligenz

Microkernel AI Agent — gleiches Budget, Ihr Agent erledigt mehr und besser.
Smart Routing, persistenter Speicher, sichere Sandbox — plus integrierte Suche und lokale Embeddings.

Schnellstart GitHub

60-80%¹

Token-Kosten-Einsparung

N+

Meta-skills

1-Klick

Migration von OpenClaw / Hermes

10+

Integrierte Kanäle

Aktuelles Alle News ansehen

OpenSquilla 0.3.1 Wartungsrelease 2026-06-03

Ein 0.3-Wartungsrelease, das den Alltag robuster macht: Chat-Rendering, Slack-Setup, Medien-Handoffs und Provider-Validierung.

Weiterlesen
OpenSquilla 0.3.0 veröffentlicht 🎉 2026-05-31

MetaSkills verwandeln wiederholbare Mehrstufen-Arbeit in wiederverwendbare Workflows. Dazu Health-Doctor-Diagnostik, strukturierte Tool-Kompression und ein echtes Produkt-Dokumentationsset.

Weiterlesen
Video-Walkthrough zur Windows-Portable-Installation ist online 🎬 2026-05-27

Ein durchgängiger Walkthrough zum Herunterladen, Starten und Konfigurieren von OpenSquilla unter Windows — gebündeltes CPython, keine separate Python-Installation nötig.

Weiterlesen

Schnellstart

Vier Wege zum Einstieg — wählen Sie, was zu Ihnen passt

Der schnellste Weg unter Windows — das ZIP bringt eine gebündelte CPython-Laufzeit mit, eine separate Python-Installation ist nicht nötig.

Video-Tutorial

Komplette Installation und Konfiguration im Walkthrough.

Aufgenommen mit v0.2.1; die Schritte sind versionsübergreifend im Wesentlichen identisch.

Herunterladen und entpacken

Aktuelles Portable-ZIP herunterladen

Aktuelles Preview-Paket:

OpenSquilla-windows-x64-portable.zip

In einen beschreibbaren Ordner wie Downloads oder Dokumente entpacken.

Rechtsklick auf Start OpenSquilla.cmd → Als Administrator ausführen

Start OpenSquilla.cmd Als Admin

Terminalfenster offen lassen — beim Schließen stoppt das Gateway.

Ersteinrichtung abschließen und Web UI öffnen

Der Launcher öffnet das Onboarding, bevor das Gateway startet. Beim ersten Start einen Provider wählen und die abgefragten Keys einfügen; spätere Starts erlauben, die Konfiguration anzusehen oder zu ändern.

Anschließend öffnen Sie http://127.0.0.1:18791/control/ im Browser.

Preview-Builds sind unsigniert; der Administrator-Start ist der unterstützte Weg. Erscheint SmartScreen, wählen Sie Weitere Informationen → Trotzdem ausführen. Wenn Smart App Control oder Unternehmensrichtlinien die unsignierte App blockieren, verwenden Sie stattdessen die schnelle Terminal-Installation.

Erweiterte Portable-Nutzung

Verwenden Sie diese Optionen nur, wenn Sie ein Skript-Setup oder portable CLI-Befehle möchten.

Vor dem ersten Start einen OpenRouter-Key bereitstellen:

# Launcher schreibt eine env-Referenz-Konfiguration und startet das Gateway direkt
> $env:OPENROUTER_API_KEY="sk-..."
> Set-ExecutionPolicy -Scope Process Bypass
> .\start.ps1

Ist OPENROUTER_API_KEY gesetzt und keine lokale Konfiguration vorhanden, schreibt der portable Launcher eine OpenRouter-env-Referenz-Konfiguration und startet das Gateway, ohne nach dem Key zu fragen. Ohne die Variable lässt der Onboarding-Assistent freie Provider-Wahl.

Das portable ZIP installiert keinen globalen opensquilla-Befehl. Für ein Terminal, in dem opensquilla ...-Befehle funktionieren, starten Sie OpenSquilla Shell.cmd, oder rufen Sie den gebündelten Launcher direkt über .\opensquilla.cmd auf:

# Beispiel: OpenRouter aus dem entpackten Ordner konfigurieren
> .\opensquilla.cmd onboard --provider openrouter --api-key-env OPENROUTER_API_KEY

Portable-Fehlerbehebung

Wenn Windows den Launcher blockiert, prüfen Sie, dass das ZIP von der offiziellen GitHub-Releases-Seite stammt, und geben Sie es dann über die Windows-Eingabeaufforderung frei.
Wenn die Web UI nicht öffnet, lassen Sie das Gateway-Terminal offen und rufen Sie http://127.0.0.1:18791/control/ manuell auf.
Wenn opensquilla nicht erkannt wird, nutzen Sie OpenSquilla Shell.cmd oder .\opensquilla.cmd aus dem entpackten Ordner.

Der empfohlene Weg unter Windows, macOS und Linux. uv installiert OpenSquilla in eine eigene isolierte Umgebung und verwaltet sein eigenes Python — kein System-Python erforderlich. Dieser Weg installiert nur veröffentlichte Releases.

uv installieren

Überspringen, wenn uv --version bereits funktioniert.

$ curl -LsSf https://astral.sh/uv/install.sh | sh
$ . "$HOME/.local/bin/env"

OpenSquilla installieren

Auf allen Plattformen derselbe Befehl.

$ uv tool install --python 3.12 "opensquilla[recommended] @ https://github.com/opensquilla/opensquilla/releases/download/v0.3.1/opensquilla-0.3.1-py3-none-any.whl"

Installiert das OpenSquilla-Wheel von der Release-URL; uv lädt anschließend die von den gewählten Extras deklarierten Abhängigkeiten. Das Standard-Extra recommended enthält die SquillaRouter-Laufzeitabhängigkeiten (ONNX Runtime, LightGBM, NumPy, tokenizers).

Konfigurieren und starten

# Interaktiver Onboarding-Assistent
$ opensquilla onboard

# ASGI-Server starten
$ opensquilla gateway run

Falls opensquilla direkt nach einer frischen uv-Installation nicht gefunden wird, öffnen Sie ein neues Terminal oder führen Sie die PATH-Zeile aus Schritt 1 erneut aus.

Wheel-URLs sind per Design versioniert — Installer prüfen die Version im Dateinamen. Der Befehl oben pinnt auf v0.3.1.

Voraussetzungen: Git · Git LFS · uv

Ohne uv greift der Installer auf Python 3.12+ mit pip ≥ 23 zurück.

Optional: Voraussetzungen über das Terminal installieren

Windows PowerShell

winget install --id Git.Git -e
winget install --id GitHub.GitLFS -e
powershell -ExecutionPolicy Bypass -c "irm https://astral.sh/uv/install.ps1 | iex"
git lfs install

macOS (Homebrew)

brew install git git-lfs uv
git lfs install

Debian / Ubuntu

sudo apt update
sudo apt install -y git git-lfs
curl -LsSf https://astral.sh/uv/install.sh | sh
git lfs install

Fedora

sudo dnf install -y git git-lfs
curl -LsSf https://astral.sh/uv/install.sh | sh
git lfs install

Arch

sudo pacman -S --needed git git-lfs
curl -LsSf https://astral.sh/uv/install.sh | sh
git lfs install

Repo mit LFS klonen

$ git lfs install
$ git clone https://github.com/opensquilla/opensquilla.git
$ cd opensquilla
$ git lfs pull --include="src/opensquilla/squilla_router/models/**"

Git LFS lädt die gebündelten ML-Routing-Modelle. Der Pull ist idempotent — bereits vollständige Checkouts werden still beendet.

Installer ausführen

# Installiert .[recommended] via uv tool install (Fallback auf pip --user)
$ bash scripts/install_source.sh

Die meisten Kanäle laufen mit der Basisinstallation. Optionale Extras: matrix, matrix-e2e, document-extras — über OPENSQUILLA_INSTALL_EXTRAS=matrix (bash) oder -Extras matrix (PowerShell) aktivieren.

Konfigurieren (interaktiver Wizard)

$ opensquilla onboard

Führt Sie durch Modellanbieter, Kanäle und Sicherheitsrichtlinien. Verwenden Sie den installierten Befehl opensquilla — kein uv run davor, außer Sie nutzen Quellcode-Entwicklung.

Gateway starten

# ASGI-Server starten (Standard 127.0.0.1:18791)
$ opensquilla gateway run

Dann besuchen Sie http://127.0.0.1:18791/control/ , um das Control Panel zu öffnen.

Ohne Visual C++ Redistributable unter Windows startet das Gateway trotzdem; der gebündelte Router fällt auf eine sichere Direktroute zurück.

Nutzen Sie diesen Weg nur, um den aktuellen Checkout zu ändern, zu testen oder zu debuggen. Anders als „Aus Quellcode installieren" erfordert er uv: uv sync legt eine checkout-lokale .venv an, und uv run führt direkt gegen den lebenden Quellbaum aus.

# Checkout-lokale .venv mit recommended + dev Extras anlegen
$ uv sync --extra recommended --extra dev

# Installation verifizieren
$ uv run opensquilla --help

Das recommended-Extra enthält SquillaRouter auch für die Entwicklung; das dev-Extra installiert Test-, Lint- und Typecheck-Tools.

Weitere Extras in dieselbe Umgebung installieren: uv sync --extra recommended --extra dev --extra matrix

In diesem Modus jedem opensquilla-Befehl uv run voranstellen. Debuggen Sie einen Entwicklungs-Checkout nicht über einen nutzerlokalen opensquilla-Befehl — der läuft in einer anderen Python-Umgebung.

Contributor-Guide auf GitHub öffnen

Für fortgeschrittene Nutzung besuchen Sie das GitHub-Repo

Einmal deployen, überall erreichbar ³

Konfigurieren Sie einen Agent, bedienen Sie Nutzer auf mehreren Kanälen

Terminal Web Slack Discord Telegram MS Teams Matrix Lark DingTalk WeCom QQ

Jeder Cent dort, wo es zählt

OpenSquilla lässt Ihren Agent weniger ausgeben, mehr merken und sicherer laufen.

💰

Kostenoptimierung

Mehrere Strategien koordiniert, um jeden Token zu maximieren

Smart Routing ²

Wie Ride-Sharing — einfache Fragen nehmen den Bus (günstige Modelle), komplexe bekommen die Premium-Fahrt (Top-Modelle). Das System entscheidet.

Hybride Feature-Analyse

Kombiniert handgefertigte Features (Länge, Sprache, Codeblöcke, Stichwörter) mit embedding-basierten semantischen Features, um Komplexität zu bewerten und das richtige Modell zu wählen.

Reasoning-Tiefenstufen

Deaktiviert Reasoning-Abrechnung für einfache Anfragen, aktiviert tiefes Denken nur bei komplexen — kein Bezahlen von Reasoning-Tokens für „Hallo".

Adaptive Prompts

Passt den Prompt automatisch an die Aufgaben-Komplexität an — leicht für Einfaches, volle Power für Komplexes.

Skills nach Bedarf

Kein Vollstopfen aller Fähigkeiten in den Kontext. Lädt nur, was für die aktuelle Aufgabe nötig ist — verhindert Token-Verschwendung.

🪄

MetaSkills-Protokoll

Ein Meta-Protokoll, das dem Agent sagt, wie er Skills im großen Maßstab findet, filtert, kombiniert — und sogar weiterentwickelt

Selbstorganisierend

Mehrstufige Arbeit wird zu wiederverwendbaren, einsehbaren Workflows. Composition-Parsing, Step-Scheduling, Proposal Gates — Rezepte, denen du beim Ausführen vertraust.

meta-skill-creator

Eine gebündelte MetaSkill, die wiederkehrende Mehr-Skill-Kollaborationen in Vorschläge für neue MetaSkills verwandelt — der Agent baut damit seinen eigenen Katalog aus.

N+ Community-Skills

Der Agent findet, bewertet und ruft Skills aus dem Community-Katalog selbständig auf — kein manuelles Auswählen, der passende wird einfach geladen.

10+ gebündelte MetaSkills

Kuratierte MetaSkills out of the box — Research-to-Report, Paper-Entwurf, Bewerbungsvorbereitung, Projektplanung, Kurzfilm-Produktion und mehr hochwertige Workflows, sofort einsatzbereit.

Replay & Traummodus

Jede Workflow-Ausführung hinterlässt eine auditierbare, wiederholbare Spur. Während du untätig bist, sichtet OpenSquilla diese Spuren, destilliert Nutzungsmuster und entwirft Kandidat-MetaSkills — Fähigkeiten wachsen im Hintergrund.

🧠

Menschenähnliches Gedächtnis

Vier-Schichten-Kognitionsarchitektur — wird mit Nutzung schlauer

Vier-Schichten-Speicherstruktur

Arbeitsgedächtnis (aktuelle Aufgabe) → Episodisch (Erfahrung & Kausalität) → Semantisch (Fakten & Regeln) → Roh (Audit & Re-Training-Basis) — spiegelt menschliche Kognition wider.

Hybride Suche + lokale Embeddings

Vektor-semantische Suche + Volltext-Stichwortsuche parallel. Eingebaute ONNX-Inferenz auf CPU — Embeddings bleiben auf Ihrer Maschine, optional Wechsel zu OpenAI / Ollama.

Hot-Memory-Beförderung

Häufig abgerufene Erinnerungen steigen automatisch nach oben. Je nützlicher, desto zugänglicher. Kalte Erinnerungen sinken natürlich.

Zeitlicher Zerfall

Datierte Erinnerungen verblassen exponentiell, während als „evergreen" markierte Elemente unverändert bleiben.

Memory-Dream-Konsolidierung

Alle 24 Stunden „träumt" die KI — konsolidiert verstreute Erinnerungen in strukturiertes Wissen. Wie Schlaf das menschliche Gedächtnis konsolidiert.

🛡️

Sicherheits-Sandbox

Lassen Sie Ihren Agent handeln — ohne Angst vor dem, was er tun könnte

Drei-Stufen-Richtlinie

Standard läuft direkt, Strict erfordert Sandbox-Genehmigung, Locked erzwingt menschliche Prüfung — risikobasierte Eskalation.

Echte Sandbox-Isolation

Bubblewrap unter Linux, Seatbelt unter macOS — Code läuft in isolierter Umgebung, berührt nie Ihre echten Dateien.

Ablehnungsregister

Drei Ablehnungen in Folge? KI pausiert automatisch. Stoppt „Brute-Force"-Versuche, Sicherheitsrichtlinien zu umgehen.

Schutz vor veralteten Outputs

Ergebnisse abgelehnter Operationen werden sofort gelöscht — KI kann „letzte Ausgabe lesen" nicht als Side-Channel nutzen.

Prompt-Injection-Abwehr

XML-Escape aller Skill-Metadaten und Tool-Ergebnisse — schließt gängige Injection-Angriffsvektoren.

Microkernel: winziger Kern, riesiges Ökosystem

Inspiriert von OS-Microkerneln — die Core-Engine erledigt das Minimum: Orchestrierung und Zustandsverwaltung. Alles andere läuft als Plugin im „User Space". LLM-Anbieter wechseln? Ein Protocol implementieren. Neues Tool? 5 Codezeilen. Plugin-Crashes betreffen den Kern nicht; Kern-Updates brechen keine Plugins.

OpenSquilla Core Engine

Kompakter Pipeline-Orchestrator · State Machine · Vollständig async · Auto-Rollback bei Fehlern

⚙️

engine/

State Machine

🤖

provider/

Multi-LLM-Provider

🌐

gateway/

ASGI-RPC-Gateway

🧠

memory/

Mehrschichtiger Speicher

📡

channels/

Kanal-Adapter

🔧

tools/ + mcp/

MCP-First-Tools

🛡️

sandbox/

Sicherheits-Sandbox

⏰

scheduler/

Task-Scheduler

🧩

skills/

Skill-Plugins

🎭

identity/

Identität & Prompts

Eingebaut

🔍 Suche: Brave / DuckDuckGo 🧬 Lokale Embeddings: ONNX lokale Inferenz (offline · Daten bleiben auf dem Gerät) 🔌 Optionale Embeddings: OpenAI / Ollama

Gleiches Budget, höhere Intelligenzdichte

Punkt-für-Punkt-Vergleich mit vergleichbaren Open-Source-Agent-Frameworks⁴

Dimension	OpenSquilla	OpenClaw	Hermes Agent
🏗️Architektur	✅ Microkernel mit 5-schichtiger Trennung, ultrakompakter Core-Orchestrator (~100 Zeilen), alle Fähigkeiten als Plugin, Auto-Skip + Rollback bei Fehlern	⚠️ Reifes Plugin-Ökosystem (Dutzende Erweiterungen), klare Grenzen aber mehr Schichten	❌ Massive monolithische Sync-Hauptschleife (Tausende Zeilen), gesamte Logik eng gekoppelt
💰Kostenoptimierung	✅ ML-Routing + Reasoning-Tiefenstufen + Prompt-Cache-Isolation + On-Demand-Skills — Mehr-Strategien-Einsparung von 60-80%	⚠️ Primär-/Fallback-Modell in Config gepinnt, keine inhaltsabhängige Auswahl	⚠️ Grobe Stichwort- + Längen-Heuristiken, einzige Routing-Strategie
💾Speichersystem	✅ Vektor + Stichwort + Dedup + zeitlicher Zerfall + Hot-Memory-Beförderung + Auto-Schema-Migration	⚠️ Hat Zerfall / Beförderung / Vielfalts-Reranking, aber keine 4-Schichten-Kognitionsstruktur & Memory-Dream-Konsolidierung	⚠️ Nur Stichwortsuche, keine Vektorsemantik, semantischer Speicher braucht externe Integration
🛡️Sicherheits-Sandbox	✅ Keine Docker-Abhängigkeit — Syscall-Level CPU/Speicher/Zeit-Isolation + 3-stufige Netzwerkkontrolle. Serverless-tauglich	⚠️ Docker optional mit OpenShell als Lightweight-Alternative, schwerer als Syscall-Level-Isolation	✅ Genehmigung gefährlicher Befehle + 6 Ausführungsumgebungen (lokal/Docker/SSH usw.)
💰Kostenverfolgung	✅ Tatsächliche Kosten pro Aufruf out-of-the-box, Quota-Hooks für Auto-Throttling bei Überschreitung	✅ Eingebaute Preistabelle, Kosten in Session-Metadaten geschrieben	✅ Input/Output/Cache-Read/Cache-Write/Reasoning-Tokens separat erfasst
📊Beobachtbarkeit	✅ Entscheidungs-Logs als Hashes (kein Klartext, compliance-freundlich), jede Pipeline-Stufe instrumentiert	✅ Natives OpenTelemetry (als Plugin), Plug-and-Play mit Prometheus/Grafana	⚠️ SQLite-Session-Tabelle + Aufruf-Counter, Basis-Niveau
🧩Erweiterungs-DX	✅ Eine Duck-Typed-Klasse mit wenigen Zeilen ist ein gültiges Plugin — keine Basisklasse, kein SDK-Paket, kein Manifest	⚠️ Interface in plugin-sdk implementieren + Manifest-Datei schreiben	⚠️ Tools registrieren sich beim Import automatisch (implizite Seiteneffekte)

🏗️Architektur

OpenSquilla

✅ Microkernel mit 5-schichtiger Trennung, ultrakompakter Core-Orchestrator (~100 Zeilen), alle Fähigkeiten als Plugin, Auto-Skip + Rollback bei Fehlern

OpenClaw

⚠️ Reifes Plugin-Ökosystem (Dutzende Erweiterungen), klare Grenzen aber mehr Schichten

Hermes Agent

❌ Massive monolithische Sync-Hauptschleife (Tausende Zeilen), gesamte Logik eng gekoppelt

💰Kostenoptimierung

OpenSquilla

✅ ML-Routing + Reasoning-Tiefenstufen + Prompt-Cache-Isolation + On-Demand-Skills — Mehr-Strategien-Einsparung von 60-80%

OpenClaw

⚠️ Primär-/Fallback-Modell in Config gepinnt, keine inhaltsabhängige Auswahl

Hermes Agent

⚠️ Grobe Stichwort- + Längen-Heuristiken, einzige Routing-Strategie

💾Speichersystem

OpenSquilla

✅ Vektor + Stichwort + Dedup + zeitlicher Zerfall + Hot-Memory-Beförderung + Auto-Schema-Migration

OpenClaw

⚠️ Hat Zerfall / Beförderung / Vielfalts-Reranking, aber keine 4-Schichten-Kognitionsstruktur & Memory-Dream-Konsolidierung

Hermes Agent

⚠️ Nur Stichwortsuche, keine Vektorsemantik, semantischer Speicher braucht externe Integration

🛡️Sicherheits-Sandbox

OpenSquilla

✅ Keine Docker-Abhängigkeit — Syscall-Level CPU/Speicher/Zeit-Isolation + 3-stufige Netzwerkkontrolle. Serverless-tauglich

OpenClaw

⚠️ Docker optional mit OpenShell als Lightweight-Alternative, schwerer als Syscall-Level-Isolation

Hermes Agent

✅ Genehmigung gefährlicher Befehle + 6 Ausführungsumgebungen (lokal/Docker/SSH usw.)

💰Kostenverfolgung

OpenSquilla

✅ Tatsächliche Kosten pro Aufruf out-of-the-box, Quota-Hooks für Auto-Throttling bei Überschreitung

OpenClaw

✅ Eingebaute Preistabelle, Kosten in Session-Metadaten geschrieben

Hermes Agent

✅ Input/Output/Cache-Read/Cache-Write/Reasoning-Tokens separat erfasst

📊Beobachtbarkeit

OpenSquilla

✅ Entscheidungs-Logs als Hashes (kein Klartext, compliance-freundlich), jede Pipeline-Stufe instrumentiert

OpenClaw

✅ Natives OpenTelemetry (als Plugin), Plug-and-Play mit Prometheus/Grafana

Hermes Agent

⚠️ SQLite-Session-Tabelle + Aufruf-Counter, Basis-Niveau

🧩Erweiterungs-DX

OpenSquilla

✅ Eine Duck-Typed-Klasse mit wenigen Zeilen ist ein gültiges Plugin — keine Basisklasse, kein SDK-Paket, kein Manifest

OpenClaw

⚠️ Interface in plugin-sdk implementieren + Manifest-Datei schreiben

Hermes Agent

⚠️ Tools registrieren sich beim Import automatisch (implizite Seiteneffekte)

Wer profitiert am meisten von OpenSquilla?

Diese Szenarien erzielen den höchsten ROI

🏢

On-Premise-Deployment

Vollständig offline, Daten verlassen nie Ihr Netzwerk, ML-Routing läuft lokal

📋

Compliance & Audit

Drei-Stufen-Richtlinien + gehashte Entscheidungs-Logs + menschliche Genehmigungs-Gates

💸

Knappes Budget, hohe Anforderungen

Mehr Aufgaben für gleiche Kosten — Smart Routing wählt das kosteneffizienteste Modell

🧠

Ein Agent, der Sie versteht

Vier-Schichten-Menschengedächtnis sammelt Kontext — nie wieder bei null anfangen

Begrenztes Gratis-Token-Angebot

Gratis-Tokens, risikofreier Test

OpenSquilla ist vollständig Open Source — jederzeit von GitHub holen und selbst hosten.
Aber das Ausführen von LLMs kostet weiterhin Tokens. Wir geben Ihnen Start-Token-Guthaben, damit Sie „OpenSquilla spart 60-80%" risikofrei verifizieren können.

10 Sekunden zum Ausfüllen, keine Kreditkarte nötig.

Gratis-Tokens beanspruchen

Eigene Tokens? Open-Source-Version auf GitHub nutzen

Apache 2.0 Open Source

Keine Kreditkarte

Priorisierter Support

Begrenzte Stückzahl · Wer zuerst kommt

Token-effiziente AI-Agent-Intelligenz

Schnellstart

Video-Tutorial

Herunterladen und entpacken

Rechtsklick auf Start OpenSquilla.cmd → Als Administrator ausführen

Ersteinrichtung abschließen und Web UI öffnen

uv installieren

OpenSquilla installieren

Konfigurieren und starten

Repo mit LFS klonen

Installer ausführen

Konfigurieren (interaktiver Wizard)

Gateway starten

Einmal deployen, überall erreichbar 3

Jeder Cent dort, wo es zählt

Kostenoptimierung

MetaSkills-Protokoll

Menschenähnliches Gedächtnis

Sicherheits-Sandbox

Microkernel: winziger Kern, riesiges Ökosystem

Gleiches Budget, höhere Intelligenzdichte

Wer profitiert am meisten von OpenSquilla?

Gratis-Tokens, risikofreier Test

Einmal deployen, überall erreichbar ³