v0.3.1 · Apache License 2.0 · Python 3.12+

Intelligence d'Agent IA optimisée en Tokens

AI Agent à microkernel — même budget, laissez votre Agent en faire plus, et mieux.
Routage intelligent, mémoire persistante, sandbox sécurisée, plus recherche et embeddings locaux intégrés.

Démarrage rapide GitHub

60-80%¹

Économie de coûts Tokens

N+

Meta-skills

1-clic

Migration depuis OpenClaw / Hermes

10+

Canaux intégrés

Actualités Voir toutes les actualités

OpenSquilla 0.3.1 version de maintenance 2026-06-03

Une version de maintenance 0.3 qui rend l'usage quotidien moins fragile : rendu du chat, configuration Slack, handoffs média et validation des fournisseurs.

Lire la suite
OpenSquilla 0.3.0 disponible 🎉 2026-05-31

Les MetaSkills transforment le travail répétitif multi-étapes en workflows réutilisables. Plus diagnostics Health Doctor, compression d'outils structurée et un vrai jeu de documentation produit.

Lire la suite
La vidéo de l'installation portable Windows est en ligne 🎬 2026-05-27

Démonstration de bout en bout du téléchargement, lancement et configuration d'OpenSquilla sous Windows — CPython embarqué, aucune installation Python séparée requise.

Lire la suite

Démarrage rapide

Quatre chemins pour démarrer — choisissez celui qui vous convient

La voie la plus rapide sur Windows — le zip embarque un runtime CPython, donc aucune installation Python séparée n'est nécessaire.

Tutoriel vidéo

Parcours complet d'installation et de configuration.

Enregistré sur v0.2.1 ; les étapes sont essentiellement identiques entre versions.

Téléchargez et extrayez

Télécharger la dernière version portable

Paquet preview actuel :

OpenSquilla-windows-x64-portable.zip

Extrayez dans un dossier en écriture comme Téléchargements ou Documents.

Clic droit sur Start OpenSquilla.cmd → Exécuter en tant qu'administrateur

Start OpenSquilla.cmd En admin

Gardez la fenêtre du terminal ouverte — la fermer arrête le gateway.

Terminez la configuration initiale et ouvrez le Web UI

Le launcher ouvre l'onboarding avant le démarrage du gateway. Au premier lancement, choisissez un provider et collez les clés demandées ; les lancements suivants permettent de revoir ou de modifier la configuration.

Puis ouvrez http://127.0.0.1:18791/control/ dans votre navigateur.

Les builds preview ne sont pas signées ; le lancement en administrateur est la voie supportée. Si SmartScreen apparaît, choisissez Informations complémentaires → Exécuter quand même. Si Smart App Control ou une politique d'entreprise bloque l'app non signée, utilisez plutôt l'Installation rapide par terminal.

Utilisation avancée du portable

N'utilisez ces options que si vous souhaitez une configuration scriptée ou des commandes CLI portables.

Fournir une clé OpenRouter avant le premier lancement :

# Le launcher écrit une config en référence env et lance le gateway directement
> $env:OPENROUTER_API_KEY="sk-..."
> Set-ExecutionPolicy -Scope Process Bypass
> .\start.ps1

Si OPENROUTER_API_KEY est défini et qu'aucune config locale n'existe, le launcher portable écrit une config OpenRouter en référence env et lance le gateway sans demander la clé. Sans la variable, l'assistant d'onboarding vous laisse choisir librement un provider.

Le zip portable n'installe pas de commande globale opensquilla. Pour un terminal où les commandes opensquilla ... fonctionnent, lancez OpenSquilla Shell.cmd, ou appelez le launcher embarqué via .\opensquilla.cmd :

# Exemple : configurer OpenRouter depuis le dossier extrait
> .\opensquilla.cmd onboard --provider openrouter --api-key-env OPENROUTER_API_KEY

Dépannage du portable

Si Windows bloque le launcher, vérifiez que le zip provient bien de la page officielle GitHub Releases, puis autorisez-le via l'invite Windows.
Si le Web UI ne s'ouvre pas, laissez le terminal du gateway ouvert et visitez http://127.0.0.1:18791/control/ manuellement.
Si opensquilla n'est pas reconnu, utilisez OpenSquilla Shell.cmd ou .\opensquilla.cmd depuis le dossier extrait.

La voie recommandée sur Windows, macOS et Linux. uv installe OpenSquilla dans son propre environnement isolé et gère son propre Python — pas de Python système requis. Cette voie installe uniquement les releases publiées.

Installez uv

Sautez si uv --version fonctionne déjà.

$ curl -LsSf https://astral.sh/uv/install.sh | sh
$ . "$HOME/.local/bin/env"

Installez OpenSquilla

La même commande sur toutes les plateformes.

$ uv tool install --python 3.12 "opensquilla[recommended] @ https://github.com/opensquilla/opensquilla/releases/download/v0.3.1/opensquilla-0.3.1-py3-none-any.whl"

Installe le wheel OpenSquilla depuis l'URL de release, puis uv télécharge les dépendances déclarées par les extras choisis. L'extra recommended par défaut inclut les dépendances runtime de SquillaRouter (ONNX Runtime, LightGBM, NumPy, tokenizers).

Configurez et exécutez

# Assistant d'onboarding interactif
$ opensquilla onboard

# Démarrer le serveur ASGI
$ opensquilla gateway run

Si opensquilla est introuvable juste après une installation fraîche de uv, ouvrez un nouveau terminal ou ré-exécutez la ligne PATH de l'étape 1.

Les URLs de wheel sont versionnées par conception — les installateurs valident la version dans le nom de fichier. La commande ci-dessus épingle la v0.3.1.

Prérequis : Git · Git LFS · uv

Si uv n'est pas disponible, l'installeur bascule sur Python 3.12+ avec pip ≥ 23.

Optionnel : installez les prérequis depuis un terminal

Windows PowerShell

winget install --id Git.Git -e
winget install --id GitHub.GitLFS -e
powershell -ExecutionPolicy Bypass -c "irm https://astral.sh/uv/install.ps1 | iex"
git lfs install

macOS (Homebrew)

brew install git git-lfs uv
git lfs install

Debian / Ubuntu

sudo apt update
sudo apt install -y git git-lfs
curl -LsSf https://astral.sh/uv/install.sh | sh
git lfs install

Fedora

sudo dnf install -y git git-lfs
curl -LsSf https://astral.sh/uv/install.sh | sh
git lfs install

Arch

sudo pacman -S --needed git git-lfs
curl -LsSf https://astral.sh/uv/install.sh | sh
git lfs install

Cloner avec LFS

$ git lfs install
$ git clone https://github.com/opensquilla/opensquilla.git
$ cd opensquilla
$ git lfs pull --include="src/opensquilla/squilla_router/models/**"

Git LFS récupère les modèles de routage ML embarqués. Le pull est idempotent — il se termine en silence quand le checkout est déjà complet.

Exécuter l'installeur

# Installe .[recommended] via uv tool install (bascule sur pip --user si nécessaire)
$ bash scripts/install_source.sh

La plupart des canaux fonctionnent avec l'installation de base. Extras optionnels : matrix, matrix-e2e, document-extras — via OPENSQUILLA_INSTALL_EXTRAS=matrix (bash) ou -Extras matrix (PowerShell).

Configurer (assistant interactif)

$ opensquilla onboard

Vous guide à travers les fournisseurs de modèles, les canaux et les politiques de sécurité. Utilisez la commande opensquilla installée — pas de uv run en préfixe, sauf si vous suivez Développer depuis les sources.

Lancer le Gateway

# Démarrer le serveur ASGI (par défaut 127.0.0.1:18791)
$ opensquilla gateway run

Puis visitez http://127.0.0.1:18791/control/ pour ouvrir le panneau de contrôle.

Sur Windows sans Visual C++ Redistributable, le gateway démarre quand même ; le routeur intégré bascule sur une route directe sûre.

Utilisez cette voie uniquement pour modifier, tester ou déboguer le checkout actuel. Contrairement à Installer depuis les sources, elle requiert uv : uv sync crée un .venv local au checkout et uv run s'exécute directement sur l'arbre source vivant.

# Crée le .venv local au checkout avec extras recommended + dev
$ uv sync --extra recommended --extra dev

# Vérifier l'installation
$ uv run opensquilla --help

L'extra recommended inclut SquillaRouter pour le développement aussi ; l'extra dev installe les outils de test, lint et typecheck.

Installer des extras supplémentaires dans le même environnement : uv sync --extra recommended --extra dev --extra matrix

Dans ce mode, préfixez chaque commande opensquilla par uv run. Ne déboguez pas un checkout de développement via une commande opensquilla utilisateur — elle s'exécute dans un autre environnement Python.

Ouvrir le guide contributeur sur GitHub

Pour un usage avancé, visitez le dépôt GitHub

Déployez une fois, atteignez partout ³

Configurez un Agent, servez vos utilisateurs sur plusieurs canaux

Terminal Web Slack Discord Telegram MS Teams Matrix Lark DingTalk WeCom QQ

Chaque centime, dépensé là où ça compte

OpenSquilla permet à votre Agent de dépenser moins, de mémoriser plus et de fonctionner en toute sécurité.

💰

Optimisation des coûts

Plusieurs stratégies coordonnées pour maximiser chaque Token

Routage intelligent ²

Comme un VTC — les questions simples prennent le bus (modèles bon marché), les complexes obtiennent la berline premium (modèles haut de gamme). Le système décide.

Analyse hybride de caractéristiques

Combine des caractéristiques manuelles (longueur, langue, blocs de code, mots-clés) avec des caractéristiques sémantiques basées sur les embeddings pour évaluer la complexité et choisir le bon modèle.

Niveaux de profondeur de raisonnement

Désactive la facturation du raisonnement pour les requêtes simples, n'active la pensée profonde que pour les complexes — pas de Tokens de raisonnement pour un simple "bonjour".

Prompts adaptatifs

Ajuste automatiquement le prompt selon la complexité de la tâche — léger pour le simple, pleine puissance pour le complexe.

Compétences à la demande

Pas de surcharge du contexte avec toutes les capacités. Charge uniquement ce qui est nécessaire pour la tâche actuelle.

🪄

Protocole MetaSkills

Un méta-protocole qui dit à l'Agent comment rechercher, filtrer, composer — et même faire évoluer — les skills à grande échelle

Auto-organisation

Le travail multi-étapes devient des workflows réutilisables et inspectables. Parsing de composition, planification des étapes, proposal gates — des recettes fiables à l'exécution.

meta-skill-creator

Une MetaSkill intégrée qui transforme les collaborations multi-skills récurrentes en propositions de nouvelles MetaSkills — l'Agent étend ainsi son propre catalogue.

N+ Skills communautaires

L'Agent découvre, classe et invoque les Skills du catalogue communautaire de façon autonome — pas de sélection manuelle, la bonne est chargée toute seule.

10+ MetaSkills intégrées

MetaSkills curées prêtes à l'emploi — research-to-report, rédaction de papers, préparation à la recherche d'emploi, planification de projets, production de courts métrages et autres workflows de haute qualité, prêts à tourner.

Replay & Mode Rêve

Chaque exécution laisse une trace auditable et rejouable. Quand vous êtes inactif, OpenSquilla revisite ces traces, distille les habitudes d'usage et rédige des MetaSkills candidates — la capacité grandit en arrière-plan.

🧠

Mémoire humaine

Architecture cognitive à quatre niveaux — devient plus intelligente avec l'usage

Mémoire à 4 niveaux

Mémoire de travail (tâche actuelle) → Épisodique (expériences et causalité) → Sémantique (faits et règles) → Brute (audit et base de réentraînement) — calque la cognition humaine.

Recherche hybride + embeddings locaux

Recherche vectorielle sémantique + mots-clés en texte intégral côte à côte. Inférence ONNX intégrée tournant sur CPU — les embeddings restent sur votre machine, basculement optionnel vers OpenAI / Ollama.

Promotion des mémoires actives

Les mémoires fréquemment rappelées remontent automatiquement. Plus elles sont utiles, plus elles sont accessibles. Les mémoires froides retombent naturellement.

Décroissance temporelle

Les mémoires datées s'estompent exponentiellement, tandis que les éléments marqués "permanents" restent intacts.

Consolidation Memory Dream

Toutes les 24 h, l'IA "rêve" — consolidant les mémoires éparses en connaissances structurées. Comme le sommeil pour la mémoire humaine.

🛡️

Sandbox de sécurité

Laissez votre Agent agir — sans craindre ce qu'il pourrait faire

Politique à 3 niveaux

Standard exécute directement, Strict requiert l'approbation sandbox, Locked impose une revue humaine — escalade basée sur le risque.

Vraie isolation sandbox

Bubblewrap sur Linux, Seatbelt sur macOS — le code s'exécute en environnement isolé, sans toucher vos vrais fichiers.

Registre de refus

Trois refus consécutifs ? L'IA se met en pause automatique. Empêche les tentatives de "force brute" pour contourner les politiques.

Protection contre les sorties obsolètes

Les résultats des opérations refusées sont immédiatement purgés — l'IA ne peut pas les utiliser via "lecture précédente".

Défense contre Prompt Injection

Échappe en XML toutes les métadonnées de skills et résultats d'outils — ferme les vecteurs d'attaque par injection.

Microkernel : noyau minuscule, vaste écosystème

Inspiré des microkernels OS — le moteur central fait le minimum : orchestration et gestion d'état. Tout le reste tourne en plugins en "espace utilisateur". Changer de fournisseur LLM ? Implémentez un Protocol. Ajouter un outil ? 5 lignes de code. Les plugins qui plantent n'affectent pas le noyau ; les mises à jour du noyau ne cassent pas les plugins.

OpenSquilla Core Engine

Orchestrateur de pipeline compact · Machine à états · Entièrement async · Auto-rollback en cas d'erreur

⚙️

engine/

Machine à états

🤖

provider/

Multi-fournisseurs LLM

🌐

gateway/

Gateway ASGI RPC

🧠

memory/

Mémoire multi-niveaux

📡

channels/

Adaptateurs de canaux

🔧

tools/ + mcp/

Outils MCP-First

🛡️

sandbox/

Sandbox de sécurité

⏰

scheduler/

Ordonnanceur

🧩

skills/

Plugins de compétences

🎭

identity/

Identité & Prompts

Intégré

🔍 Recherche : Brave / DuckDuckGo 🧬 Embeddings locaux : inférence ONNX (hors-ligne · données restent sur l'appareil) 🔌 Embeddings optionnels : OpenAI / Ollama

Même budget, densité d'intelligence supérieure

Comparatif point par point avec les frameworks Agent open source équivalents⁴

Dimension	OpenSquilla	OpenClaw	Hermes Agent
🏗️Architecture	✅ Microkernel à 5 couches séparées, orchestrateur ultra-compact (~100 lignes), toutes capacités en plugins, auto-skip + rollback en cas d'erreur	⚠️ Écosystème de plugins mature (dizaines d'extensions), frontières claires mais plus de couches	❌ Boucle principale synchrone monolithique massive (milliers de lignes), toute la logique fortement couplée
💰Optimisation des coûts	✅ Routage ML + niveaux de raisonnement + isolation cache prompts + skills à la demande — économies multi-stratégies de 60-80%	⚠️ Modèle principal + chaîne de fallback figés en config, pas de sélection basée sur le contenu	⚠️ Heuristiques mots-clés + longueur grossières, stratégie de routage unique
💾Système de mémoire	✅ Vecteur + mots-clés + déduplication + décroissance temporelle + promotion des mémoires actives + migration de schéma auto	⚠️ A décroissance / promotion / reranking de diversité, mais manque structure cognitive 4 niveaux & consolidation Memory Dream	⚠️ Recherche par mots-clés uniquement, pas de sémantique vectorielle, mémoire sémantique nécessite intégration externe
🛡️Sandbox de sécurité	✅ Pas de dépendance Docker — isolation au niveau syscall CPU/mémoire/temps + contrôle réseau 3 niveaux. Compatible serverless	⚠️ Docker optionnel avec OpenShell comme alternative légère, plus lourd que l'isolation syscall	✅ Approbation des commandes dangereuses + 6 environnements d'exécution (local/Docker/SSH etc)
💰Suivi des coûts	✅ Coût réel par appel prêt à l'emploi, hooks de quota pour auto-throttling en cas de dépassement	✅ Table de prix intégrée, coût écrit dans les métadonnées de session	✅ Tokens entrée/sortie/cache-read/cache-write/raisonnement suivis séparément
📊Observabilité	✅ Logs de décision en hash (pas de texte brut, conforme), chaque étape du pipeline instrumentée	✅ OpenTelemetry natif (en plugin), plug-and-play avec Prometheus/Grafana	⚠️ Table de session SQLite + compteur d'appels, niveau basique
🧩DX d'extension	✅ Une classe duck-typed de quelques lignes est un plugin valide — pas de classe de base, pas de package SDK, pas de manifest	⚠️ Implémenter l'interface dans plugin-sdk + écrire un fichier manifest	⚠️ Outils auto-enregistrés à l'import (effets de bord implicites)

🏗️Architecture

OpenSquilla

✅ Microkernel à 5 couches séparées, orchestrateur ultra-compact (~100 lignes), toutes capacités en plugins, auto-skip + rollback en cas d'erreur

OpenClaw

⚠️ Écosystème de plugins mature (dizaines d'extensions), frontières claires mais plus de couches

Hermes Agent

❌ Boucle principale synchrone monolithique massive (milliers de lignes), toute la logique fortement couplée

💰Optimisation des coûts

OpenSquilla

✅ Routage ML + niveaux de raisonnement + isolation cache prompts + skills à la demande — économies multi-stratégies de 60-80%

OpenClaw

⚠️ Modèle principal + chaîne de fallback figés en config, pas de sélection basée sur le contenu

Hermes Agent

⚠️ Heuristiques mots-clés + longueur grossières, stratégie de routage unique

💾Système de mémoire

OpenSquilla

✅ Vecteur + mots-clés + déduplication + décroissance temporelle + promotion des mémoires actives + migration de schéma auto

OpenClaw

⚠️ A décroissance / promotion / reranking de diversité, mais manque structure cognitive 4 niveaux & consolidation Memory Dream

Hermes Agent

⚠️ Recherche par mots-clés uniquement, pas de sémantique vectorielle, mémoire sémantique nécessite intégration externe

🛡️Sandbox de sécurité

OpenSquilla

✅ Pas de dépendance Docker — isolation au niveau syscall CPU/mémoire/temps + contrôle réseau 3 niveaux. Compatible serverless

OpenClaw

⚠️ Docker optionnel avec OpenShell comme alternative légère, plus lourd que l'isolation syscall

Hermes Agent

✅ Approbation des commandes dangereuses + 6 environnements d'exécution (local/Docker/SSH etc)

💰Suivi des coûts

OpenSquilla

✅ Coût réel par appel prêt à l'emploi, hooks de quota pour auto-throttling en cas de dépassement

OpenClaw

✅ Table de prix intégrée, coût écrit dans les métadonnées de session

Hermes Agent

✅ Tokens entrée/sortie/cache-read/cache-write/raisonnement suivis séparément

📊Observabilité

OpenSquilla

✅ Logs de décision en hash (pas de texte brut, conforme), chaque étape du pipeline instrumentée

OpenClaw

✅ OpenTelemetry natif (en plugin), plug-and-play avec Prometheus/Grafana

Hermes Agent

⚠️ Table de session SQLite + compteur d'appels, niveau basique

🧩DX d'extension

OpenSquilla

✅ Une classe duck-typed de quelques lignes est un plugin valide — pas de classe de base, pas de package SDK, pas de manifest

OpenClaw

⚠️ Implémenter l'interface dans plugin-sdk + écrire un fichier manifest

Hermes Agent

⚠️ Outils auto-enregistrés à l'import (effets de bord implicites)

Qui bénéficie le plus d'OpenSquilla ?

Ces scénarios obtiennent le meilleur ROI

🏢

Déploiement on-premise

Entièrement hors-ligne, données ne quittent jamais votre réseau, routage ML s'exécute localement

📋

Conformité & audit

Politiques 3 niveaux + logs de décision hashés + portes d'approbation humaine

💸

Budget serré, exigences élevées

Plus de tâches pour le même coût — le routage intelligent choisit le modèle le plus rentable

🧠

Un Agent qui vous comprend

Mémoire humaine à 4 niveaux qui accumule du contexte — ne repartez jamais de zéro

Offre Tokens gratuits en quantité limitée

Tokens gratuits, essai sans risque

OpenSquilla est entièrement open source — récupérez sur GitHub et auto-hébergez quand vous voulez.
Mais faire tourner des LLM coûte des Tokens. Nous vous offrons un crédit Token de démarrage pour vérifier "OpenSquilla économise 60-80%" sans risque.

10 secondes pour remplir, sans carte bancaire.

Réclamer mes Tokens gratuits

Vous avez vos propres Tokens ? Utilisez la version open source sur GitHub

Open source Apache 2.0

Sans carte bancaire

Support prioritaire

Quantité limitée · Premier arrivé, premier servi

Intelligence d'Agent IA optimisée en Tokens

Démarrage rapide

Tutoriel vidéo

Téléchargez et extrayez

Clic droit sur Start OpenSquilla.cmd → Exécuter en tant qu'administrateur

Terminez la configuration initiale et ouvrez le Web UI

Installez uv

Installez OpenSquilla

Configurez et exécutez

Cloner avec LFS

Exécuter l'installeur

Configurer (assistant interactif)

Lancer le Gateway

Déployez une fois, atteignez partout 3

Chaque centime, dépensé là où ça compte

Optimisation des coûts

Protocole MetaSkills

Mémoire humaine

Sandbox de sécurité

Microkernel : noyau minuscule, vaste écosystème

Même budget, densité d'intelligence supérieure

Qui bénéficie le plus d'OpenSquilla ?

Tokens gratuits, essai sans risque

Déployez une fois, atteignez partout ³