v0.3.1 · Apache License 2.0 · Python 3.12+
OpenSquilla

Intelligence d'Agent IA optimisée en Tokens

AI Agent à microkernel — même budget, laissez votre Agent en faire plus, et mieux.
Routage intelligent, mémoire persistante, sandbox sécurisée, plus recherche et embeddings locaux intégrés.

60-80%1
Économie de coûts Tokens
N+
Meta-skills
1-clic
Migration depuis OpenClaw / Hermes
10+
Canaux intégrés

Démarrage rapide

Quatre chemins pour démarrer — choisissez celui qui vous convient

La voie recommandée sur Windows, macOS et Linux. uv installe OpenSquilla dans son propre environnement isolé et gère son propre Python — pas de Python système requis. Cette voie installe uniquement les releases publiées.

1

Installez uv

Sautez si uv --version fonctionne déjà.

$ curl -LsSf https://astral.sh/uv/install.sh | sh
$ . "$HOME/.local/bin/env"
2

Installez OpenSquilla

La même commande sur toutes les plateformes.

$ uv tool install --python 3.12 "opensquilla[recommended] @ https://github.com/opensquilla/opensquilla/releases/download/v0.3.1/opensquilla-0.3.1-py3-none-any.whl"

Installe le wheel OpenSquilla depuis l'URL de release, puis uv télécharge les dépendances déclarées par les extras choisis. L'extra recommended par défaut inclut les dépendances runtime de SquillaRouter (ONNX Runtime, LightGBM, NumPy, tokenizers).

3

Configurez et exécutez

# Assistant d'onboarding interactif
$ opensquilla onboard

# Démarrer le serveur ASGI
$ opensquilla gateway run

Si opensquilla est introuvable juste après une installation fraîche de uv, ouvrez un nouveau terminal ou ré-exécutez la ligne PATH de l'étape 1.

Les URLs de wheel sont versionnées par conception — les installateurs valident la version dans le nom de fichier. La commande ci-dessus épingle la v0.3.1.

Pour un usage avancé, visitez le dépôt GitHub

Déployez une fois, atteignez partout 3

Configurez un Agent, servez vos utilisateurs sur plusieurs canaux

Terminal Web Slack Discord Telegram MS Teams Matrix Lark DingTalk WeCom QQ

Chaque centime, dépensé là où ça compte

OpenSquilla permet à votre Agent de dépenser moins, de mémoriser plus et de fonctionner en toute sécurité.

💰

Optimisation des coûts

Plusieurs stratégies coordonnées pour maximiser chaque Token

Routage intelligent ²
Comme un VTC — les questions simples prennent le bus (modèles bon marché), les complexes obtiennent la berline premium (modèles haut de gamme). Le système décide.
Analyse hybride de caractéristiques
Combine des caractéristiques manuelles (longueur, langue, blocs de code, mots-clés) avec des caractéristiques sémantiques basées sur les embeddings pour évaluer la complexité et choisir le bon modèle.
Niveaux de profondeur de raisonnement
Désactive la facturation du raisonnement pour les requêtes simples, n'active la pensée profonde que pour les complexes — pas de Tokens de raisonnement pour un simple "bonjour".
Prompts adaptatifs
Ajuste automatiquement le prompt selon la complexité de la tâche — léger pour le simple, pleine puissance pour le complexe.
Compétences à la demande
Pas de surcharge du contexte avec toutes les capacités. Charge uniquement ce qui est nécessaire pour la tâche actuelle.
🪄

Protocole MetaSkills

Un méta-protocole qui dit à l'Agent comment rechercher, filtrer, composer — et même faire évoluer — les skills à grande échelle

Auto-organisation
Le travail multi-étapes devient des workflows réutilisables et inspectables. Parsing de composition, planification des étapes, proposal gates — des recettes fiables à l'exécution.
meta-skill-creator
Une MetaSkill intégrée qui transforme les collaborations multi-skills récurrentes en propositions de nouvelles MetaSkills — l'Agent étend ainsi son propre catalogue.
N+ Skills communautaires
L'Agent découvre, classe et invoque les Skills du catalogue communautaire de façon autonome — pas de sélection manuelle, la bonne est chargée toute seule.
10+ MetaSkills intégrées
MetaSkills curées prêtes à l'emploi — research-to-report, rédaction de papers, préparation à la recherche d'emploi, planification de projets, production de courts métrages et autres workflows de haute qualité, prêts à tourner.
Replay & Mode Rêve
Chaque exécution laisse une trace auditable et rejouable. Quand vous êtes inactif, OpenSquilla revisite ces traces, distille les habitudes d'usage et rédige des MetaSkills candidates — la capacité grandit en arrière-plan.
🧠

Mémoire humaine

Architecture cognitive à quatre niveaux — devient plus intelligente avec l'usage

Mémoire à 4 niveaux
Mémoire de travail (tâche actuelle) → Épisodique (expériences et causalité) → Sémantique (faits et règles) → Brute (audit et base de réentraînement) — calque la cognition humaine.
Recherche hybride + embeddings locaux
Recherche vectorielle sémantique + mots-clés en texte intégral côte à côte. Inférence ONNX intégrée tournant sur CPU — les embeddings restent sur votre machine, basculement optionnel vers OpenAI / Ollama.
Promotion des mémoires actives
Les mémoires fréquemment rappelées remontent automatiquement. Plus elles sont utiles, plus elles sont accessibles. Les mémoires froides retombent naturellement.
Décroissance temporelle
Les mémoires datées s'estompent exponentiellement, tandis que les éléments marqués "permanents" restent intacts.
Consolidation Memory Dream
Toutes les 24 h, l'IA "rêve" — consolidant les mémoires éparses en connaissances structurées. Comme le sommeil pour la mémoire humaine.
🛡️

Sandbox de sécurité

Laissez votre Agent agir — sans craindre ce qu'il pourrait faire

Politique à 3 niveaux
Standard exécute directement, Strict requiert l'approbation sandbox, Locked impose une revue humaine — escalade basée sur le risque.
Vraie isolation sandbox
Bubblewrap sur Linux, Seatbelt sur macOS — le code s'exécute en environnement isolé, sans toucher vos vrais fichiers.
Registre de refus
Trois refus consécutifs ? L'IA se met en pause automatique. Empêche les tentatives de "force brute" pour contourner les politiques.
Protection contre les sorties obsolètes
Les résultats des opérations refusées sont immédiatement purgés — l'IA ne peut pas les utiliser via "lecture précédente".
Défense contre Prompt Injection
Échappe en XML toutes les métadonnées de skills et résultats d'outils — ferme les vecteurs d'attaque par injection.

Microkernel : noyau minuscule, vaste écosystème

Inspiré des microkernels OS — le moteur central fait le minimum : orchestration et gestion d'état. Tout le reste tourne en plugins en "espace utilisateur". Changer de fournisseur LLM ? Implémentez un Protocol. Ajouter un outil ? 5 lignes de code. Les plugins qui plantent n'affectent pas le noyau ; les mises à jour du noyau ne cassent pas les plugins.

OpenSquilla
OpenSquilla Core Engine
Orchestrateur de pipeline compact · Machine à états · Entièrement async · Auto-rollback en cas d'erreur
⚙️
engine/
Machine à états
🤖
provider/
Multi-fournisseurs LLM
🌐
gateway/
Gateway ASGI RPC
🧠
memory/
Mémoire multi-niveaux
📡
channels/
Adaptateurs de canaux
🔧
tools/ + mcp/
Outils MCP-First
🛡️
sandbox/
Sandbox de sécurité
scheduler/
Ordonnanceur
🧩
skills/
Plugins de compétences
🎭
identity/
Identité & Prompts
Intégré
🔍 Recherche : Brave / DuckDuckGo 🧬 Embeddings locaux : inférence ONNX (hors-ligne · données restent sur l'appareil) 🔌 Embeddings optionnels : OpenAI / Ollama

Même budget, densité d'intelligence supérieure

Comparatif point par point avec les frameworks Agent open source équivalents4

🏗️Architecture
OpenSquilla
✅ Microkernel à 5 couches séparées, orchestrateur ultra-compact (~100 lignes), toutes capacités en plugins, auto-skip + rollback en cas d'erreur
OpenClaw
⚠️ Écosystème de plugins mature (dizaines d'extensions), frontières claires mais plus de couches
Hermes Agent
❌ Boucle principale synchrone monolithique massive (milliers de lignes), toute la logique fortement couplée
💰Optimisation des coûts
OpenSquilla
✅ Routage ML + niveaux de raisonnement + isolation cache prompts + skills à la demande — économies multi-stratégies de 60-80%
OpenClaw
⚠️ Modèle principal + chaîne de fallback figés en config, pas de sélection basée sur le contenu
Hermes Agent
⚠️ Heuristiques mots-clés + longueur grossières, stratégie de routage unique
💾Système de mémoire
OpenSquilla
✅ Vecteur + mots-clés + déduplication + décroissance temporelle + promotion des mémoires actives + migration de schéma auto
OpenClaw
⚠️ A décroissance / promotion / reranking de diversité, mais manque structure cognitive 4 niveaux & consolidation Memory Dream
Hermes Agent
⚠️ Recherche par mots-clés uniquement, pas de sémantique vectorielle, mémoire sémantique nécessite intégration externe
🛡️Sandbox de sécurité
OpenSquilla
✅ Pas de dépendance Docker — isolation au niveau syscall CPU/mémoire/temps + contrôle réseau 3 niveaux. Compatible serverless
OpenClaw
⚠️ Docker optionnel avec OpenShell comme alternative légère, plus lourd que l'isolation syscall
Hermes Agent
✅ Approbation des commandes dangereuses + 6 environnements d'exécution (local/Docker/SSH etc)
💰Suivi des coûts
OpenSquilla
✅ Coût réel par appel prêt à l'emploi, hooks de quota pour auto-throttling en cas de dépassement
OpenClaw
✅ Table de prix intégrée, coût écrit dans les métadonnées de session
Hermes Agent
✅ Tokens entrée/sortie/cache-read/cache-write/raisonnement suivis séparément
📊Observabilité
OpenSquilla
✅ Logs de décision en hash (pas de texte brut, conforme), chaque étape du pipeline instrumentée
OpenClaw
✅ OpenTelemetry natif (en plugin), plug-and-play avec Prometheus/Grafana
Hermes Agent
⚠️ Table de session SQLite + compteur d'appels, niveau basique
🧩DX d'extension
OpenSquilla
✅ Une classe duck-typed de quelques lignes est un plugin valide — pas de classe de base, pas de package SDK, pas de manifest
OpenClaw
⚠️ Implémenter l'interface dans plugin-sdk + écrire un fichier manifest
Hermes Agent
⚠️ Outils auto-enregistrés à l'import (effets de bord implicites)

Qui bénéficie le plus d'OpenSquilla ?

Ces scénarios obtiennent le meilleur ROI

🏢
Déploiement on-premise
Entièrement hors-ligne, données ne quittent jamais votre réseau, routage ML s'exécute localement
📋
Conformité & audit
Politiques 3 niveaux + logs de décision hashés + portes d'approbation humaine
💸
Budget serré, exigences élevées
Plus de tâches pour le même coût — le routage intelligent choisit le modèle le plus rentable
🧠
Un Agent qui vous comprend
Mémoire humaine à 4 niveaux qui accumule du contexte — ne repartez jamais de zéro
Offre Tokens gratuits en quantité limitée

Tokens gratuits, essai sans risque

OpenSquilla est entièrement open source — récupérez sur GitHub et auto-hébergez quand vous voulez.
Mais faire tourner des LLM coûte des Tokens. Nous vous offrons un crédit Token de démarrage pour vérifier "OpenSquilla économise 60-80%" sans risque.

10 secondes pour remplir, sans carte bancaire.

Open source Apache 2.0
Sans carte bancaire
Support prioritaire
Quantité limitée · Premier arrivé, premier servi