v0.3.1 · Apache License 2.0 · Python 3.12+
OpenSquilla

Inteligencia de Agente IA optimizada en Tokens

AI Agent de microkernel — mismo presupuesto, tu Agent hace más y mejor.
Enrutamiento inteligente, memoria persistente, sandbox seguro, además de búsqueda y embeddings locales integrados.

60-80%1
Ahorro de Costos Tokens
N+
Meta-skills
1-clic
Migración desde OpenClaw / Hermes
10+
Canales integrados

Inicio rápido

Cuatro caminos para empezar — elige el que mejor te encaje

La ruta recomendada en Windows, macOS y Linux. uv instala OpenSquilla en su propio entorno aislado y gestiona su propio Python — no hace falta Python del sistema. Esta ruta instala solo releases publicados.

1

Instala uv

Sáltalo si uv --version ya funciona.

$ curl -LsSf https://astral.sh/uv/install.sh | sh
$ . "$HOME/.local/bin/env"
2

Instala OpenSquilla

El mismo comando en cualquier plataforma.

$ uv tool install --python 3.12 "opensquilla[recommended] @ https://github.com/opensquilla/opensquilla/releases/download/v0.3.1/opensquilla-0.3.1-py3-none-any.whl"

Instala el wheel de OpenSquilla desde la URL del release; después uv descarga las dependencias declaradas por los extras elegidos. El extra recommended por defecto incluye las dependencias de runtime de SquillaRouter (ONNX Runtime, LightGBM, NumPy, tokenizers).

3

Configura y ejecuta

# Asistente de onboarding interactivo
$ opensquilla onboard

# Inicia el servidor ASGI
$ opensquilla gateway run

Si opensquilla no aparece justo después de una instalación nueva de uv, abre una terminal nueva o vuelve a ejecutar la línea de PATH del paso 1.

Las URLs de wheel son versionadas por diseño — los instaladores validan la versión del nombre del archivo. El comando de arriba fija v0.3.1.

Para uso avanzado, visita el repo de GitHub

Despliega una vez, llega a todas partes 3

Configura un Agent y atiende a usuarios en múltiples canales

Terminal Web Slack Discord Telegram MS Teams Matrix Lark DingTalk WeCom QQ

Cada centavo, gastado donde importa

OpenSquilla hace que tu Agent gaste menos, recuerde más y funcione más seguro.

💰

Optimización de costos

Múltiples estrategias coordinadas para maximizar cada Token

Enrutamiento inteligente ²
Como ride-sharing — preguntas simples toman el bus (modelos baratos), las complejas obtienen el coche premium (modelos top). El sistema decide.
Análisis híbrido de características
Combina características hechas a mano (longitud, idioma, bloques de código, palabras clave) con características semánticas basadas en embeddings para evaluar complejidad y elegir el modelo correcto.
Niveles de profundidad de razonamiento
Desactiva facturación de razonamiento para consultas simples, solo activa pensamiento profundo para las complejas — sin pagar Tokens de razonamiento por un "hola".
Prompts adaptativos
Auto-ajusta el prompt según la complejidad de la tarea — ligero para lo simple, plena potencia para lo complejo.
Skills bajo demanda
Sin volcar todas las capacidades en el contexto. Solo carga lo necesario para la tarea actual — evita desperdicio de Tokens.
🪄

Protocolo MetaSkills

Un meta-protocolo que le dice al Agent cómo buscar, filtrar, componer — y hasta evolucionar — skills a escala

Auto-organización
El trabajo multi-paso se convierte en flujos reutilizables e inspeccionables. Parsing de composición, planificación de pasos, proposal gates — recetas en las que confías al ejecutarlas.
meta-skill-creator
Una MetaSkill incluida que convierte colaboraciones recurrentes de varias skills en propuestas de nuevas MetaSkills — el Agent amplía así su propio catálogo.
N+ Skills de la comunidad
El Agent descubre, prioriza e invoca Skills del catálogo de la comunidad de forma autónoma — sin selección manual, la correcta se carga sola.
10+ MetaSkills incluidas
MetaSkills curadas listas para usar — research-to-report, redacción de papers, preparación de búsqueda de empleo, planificación de proyectos, producción de cortos y más workflows de alta calidad, listos para ejecutar.
Replay y Modo Sueño
Cada ejecución deja un rastro auditable y reproducible. Cuando estás inactivo, OpenSquilla revisa esos rastros, destila patrones de uso y redacta MetaSkills candidatas — la capacidad crece en segundo plano.
🧠

Memoria humana

Arquitectura cognitiva de cuatro niveles — más inteligente con el uso

Memoria de 4 niveles
Memoria de trabajo (tarea actual) → Episódica (experiencia y causalidad) → Semántica (hechos y reglas) → Cruda (auditoría y base de reentrenamiento) — refleja la cognición humana.
Búsqueda híbrida + embeddings locales
Búsqueda vectorial semántica + palabras clave de texto completo en paralelo. Inferencia ONNX integrada en CPU — los embeddings permanecen en tu máquina, opción de cambiar a OpenAI / Ollama.
Promoción de memorias activas
Las memorias frecuentemente recordadas suben automáticamente. Cuanto más útiles, más accesibles. Las memorias frías se hunden naturalmente.
Decaimiento temporal
Las memorias datadas se desvanecen exponencialmente, mientras los elementos marcados como "permanentes" permanecen intactos.
Consolidación Memory Dream
Cada 24 horas, la IA "sueña" — consolidando memorias dispersas en conocimiento estructurado. Como el sueño consolida la memoria humana.
🛡️

Sandbox de seguridad

Deja que tu Agent actúe — sin temer lo que pueda hacer

Política de tres niveles
Standard ejecuta directamente, Strict requiere aprobación de sandbox, Locked exige revisión humana — escalada basada en riesgo.
Aislamiento sandbox real
Bubblewrap en Linux, Seatbelt en macOS — el código se ejecuta en entorno aislado, sin tocar tus archivos reales.
Registro de denegaciones
¿Tres rechazos seguidos? La IA se pausa automáticamente. Detiene intentos de "fuerza bruta" para saltarse las políticas.
Protección de salidas obsoletas
Los resultados de operaciones rechazadas se purgan inmediatamente — la IA no puede usarlos vía "leer salida anterior".
Defensa contra Prompt Injection
Escapa en XML todos los metadatos de skills y resultados de herramientas — cierra los vectores comunes de inyección.

Microkernel: núcleo diminuto, ecosistema vasto

Inspirado en microkernels de SO — el motor central hace lo mínimo: orquestación y gestión de estado. Todo lo demás corre como plugin en "espacio de usuario". ¿Cambiar proveedor LLM? Implementa un Protocol. ¿Añadir herramienta? 5 líneas de código. Los crashes de plugins no afectan al núcleo; las actualizaciones del núcleo no rompen los plugins.

OpenSquilla
OpenSquilla Core Engine
Orquestador de pipeline compacto · Máquina de estados · Totalmente async · Auto-rollback en errores
⚙️
engine/
Máquina de estados
🤖
provider/
Multi-LLM Provider
🌐
gateway/
Gateway ASGI RPC
🧠
memory/
Memoria multi-nivel
📡
channels/
Adaptadores de canal
🔧
tools/ + mcp/
Herramientas MCP-First
🛡️
sandbox/
Sandbox de seguridad
scheduler/
Programador de tareas
🧩
skills/
Plugins de skills
🎭
identity/
Identidad y Prompts
Integrado
🔍 Búsqueda: Brave / DuckDuckGo 🧬 Embeddings locales: inferencia ONNX (offline · datos permanecen en el dispositivo) 🔌 Embeddings opcionales: OpenAI / Ollama

Mismo presupuesto, mayor densidad de inteligencia

Comparación punto por punto con frameworks Agent open source equivalentes4

🏗️Arquitectura
OpenSquilla
✅ Microkernel con separación de 5 capas, orquestador ultracompacto (~100 líneas), todas las capacidades como plugins, auto-skip + rollback en errores
OpenClaw
⚠️ Ecosistema de plugins maduro (decenas de extensiones), límites claros pero más capas
Hermes Agent
❌ Bucle principal síncrono monolítico masivo (miles de líneas), toda la lógica fuertemente acoplada
💰Optimización de costos
OpenSquilla
✅ Enrutamiento ML + niveles de razonamiento + aislamiento de cache de prompts + skills bajo demanda — ahorros multi-estrategia del 60-80%
OpenClaw
⚠️ Modelo principal + cadena fallback fijados en config, sin selección por contenido
Hermes Agent
⚠️ Heurísticas crudas de palabras clave + longitud, única estrategia de enrutamiento
💾Sistema de memoria
OpenSquilla
✅ Vector + palabras clave + dedup + decaimiento temporal + promoción de memoria activa + migración automática de schema
OpenClaw
⚠️ Tiene decaimiento / promoción / reranking de diversidad, pero le falta estructura cognitiva de 4 niveles y consolidación Memory Dream
Hermes Agent
⚠️ Solo búsqueda por palabras clave, sin semántica vectorial, memoria semántica requiere integración externa
🛡️Sandbox de seguridad
OpenSquilla
✅ Sin dependencia de Docker — aislamiento a nivel syscall CPU/memoria/tiempo + control de red 3 niveles. Compatible con serverless
OpenClaw
⚠️ Docker opcional con OpenShell como alternativa ligera, más pesado que aislamiento syscall
Hermes Agent
✅ Aprobación de comandos peligrosos + 6 entornos de ejecución (local/Docker/SSH etc)
💰Seguimiento de costos
OpenSquilla
✅ Costo real por llamada listo para usar, hooks de cuota para auto-throttling en sobreconsumo
OpenClaw
✅ Tabla de precios integrada, costo escrito en metadatos de sesión
Hermes Agent
✅ Tokens entrada/salida/cache-read/cache-write/razonamiento rastreados por separado
📊Observabilidad
OpenSquilla
✅ Logs de decisión almacenan hashes (sin texto crudo, amigable a compliance), cada etapa del pipeline instrumentada
OpenClaw
✅ OpenTelemetry nativo (como plugin), plug-and-play con Prometheus/Grafana
Hermes Agent
⚠️ Tabla de sesión SQLite + contador de llamadas, nivel básico
🧩DX de extensión
OpenSquilla
✅ Una clase duck-typed de pocas líneas es plugin válido — sin clase base, sin paquete SDK, sin manifest
OpenClaw
⚠️ Implementar interfaz en plugin-sdk + escribir archivo manifest
Hermes Agent
⚠️ Herramientas se auto-registran al import (efectos secundarios implícitos)

¿Quién se beneficia más de OpenSquilla?

Estos escenarios obtienen el mayor ROI

🏢
Despliegue on-premise
Totalmente offline, los datos nunca salen de tu red, el enrutamiento ML corre localmente
📋
Compliance y auditoría
Políticas de tres niveles + logs de decisión hasheados + puertas de aprobación humana
💸
Presupuesto ajustado, exigencias altas
Más tareas por el mismo costo — el enrutamiento inteligente elige el modelo más rentable
🧠
Un Agent que te entiende
Memoria humana de 4 niveles que acumula contexto — nunca empieces desde cero
Oferta limitada de Tokens gratis

Tokens gratis, prueba sin riesgo

OpenSquilla es totalmente open source — descarga desde GitHub y autoaloja cuando quieras.
Pero ejecutar LLMs sigue costando Tokens. Te damos un crédito Token inicial para que verifiques "OpenSquilla ahorra 60-80%" sin riesgo.

10 segundos para completar, sin tarjeta de crédito.

Open source Apache 2.0
Sin tarjeta de crédito
Soporte prioritario
Cantidad limitada · Por orden de llegada