v0.3.1 · Apache License 2.0 · Python 3.12+

Inteligencia de Agente IA optimizada en Tokens

AI Agent de microkernel — mismo presupuesto, tu Agent hace más y mejor.
Enrutamiento inteligente, memoria persistente, sandbox seguro, además de búsqueda y embeddings locales integrados.

Inicio rápido GitHub

60-80%¹

Ahorro de Costos Tokens

N+

Meta-skills

1-clic

Migración desde OpenClaw / Hermes

10+

Canales integrados

Novedades Ver todas las noticias

OpenSquilla 0.3.1 versión de mantenimiento 2026-06-03

Una versión de mantenimiento de 0.3 que hace el uso diario menos frágil: renderizado de chat, configuración de Slack, entrega de medios y validación de proveedores.

Leer más
OpenSquilla 0.3.0 ya disponible 🎉 2026-05-31

Los MetaSkills convierten el trabajo repetible de varios pasos en flujos reutilizables. Más diagnóstico Health Doctor, compresión estructurada de herramientas y un conjunto real de documentación de producto.

Leer más
Vídeo-tutorial de la instalación portable de Windows ya disponible 🎬 2026-05-27

Recorrido completo de descarga, arranque y configuración de OpenSquilla en Windows — CPython integrado, sin necesidad de instalar Python aparte.

Leer más

Inicio rápido

Cuatro caminos para empezar — elige el que mejor te encaje

La ruta más rápida en Windows — el zip incluye un runtime CPython integrado, por lo que no hace falta instalar Python aparte.

Tutorial en vídeo

Recorrido completo de instalación y configuración.

Grabado en v0.2.1; los pasos son prácticamente los mismos entre versiones.

Descarga y extrae

Descargar el zip portable más reciente

Paquete preview actual:

OpenSquilla-windows-x64-portable.zip

Extrae a una carpeta con permisos de escritura como Descargas o Documentos.

Botón derecho en Start OpenSquilla.cmd → Ejecutar como administrador

Start OpenSquilla.cmd Como admin

Mantén la ventana de la terminal abierta — cerrarla detiene el gateway.

Completa la configuración inicial y abre la Web UI

El launcher abre el onboarding antes de iniciar el gateway. En el primer arranque elige un proveedor y pega las keys solicitadas; en arranques posteriores podrás revisar o cambiar la configuración.

Luego abre http://127.0.0.1:18791/control/ en tu navegador.

Las builds preview no están firmadas; el arranque como administrador es la vía soportada. Si aparece SmartScreen, elige Más información → Ejecutar de todas formas. Si Smart App Control o una política empresarial bloquean la app sin firmar, usa la Instalación rápida por terminal.

Uso avanzado del paquete portable

Usa estas opciones solo si quieres configuración scripteada o comandos CLI portables.

Proporcionar una key de OpenRouter antes del primer arranque:

# El launcher escribe una config con referencia env y arranca el gateway directamente
> $env:OPENROUTER_API_KEY="sk-..."
> Set-ExecutionPolicy -Scope Process Bypass
> .\start.ps1

Si OPENROUTER_API_KEY está definida y no hay config local, el launcher portable crea una config de OpenRouter con referencia env y arranca el gateway sin pedir la key. Sin la variable, el asistente de onboarding te deja elegir cualquier provider libremente.

El zip portable no instala un comando global opensquilla. Para una terminal donde funcionen los comandos opensquilla ..., ejecuta OpenSquilla Shell.cmd, o llama al launcher integrado mediante .\opensquilla.cmd:

# Ejemplo: configurar OpenRouter desde la carpeta extraída
> .\opensquilla.cmd onboard --provider openrouter --api-key-env OPENROUTER_API_KEY

Solución de problemas del paquete portable

Si Windows bloquea el launcher, asegúrate de que el zip proviene de la página oficial de GitHub Releases y permítelo en la ventana de aviso de Windows.
Si la Web UI no se abre, mantén la terminal del gateway abierta y visita http://127.0.0.1:18791/control/ manualmente.
Si opensquilla no se reconoce, usa OpenSquilla Shell.cmd o .\opensquilla.cmd desde la carpeta extraída.

La ruta recomendada en Windows, macOS y Linux. uv instala OpenSquilla en su propio entorno aislado y gestiona su propio Python — no hace falta Python del sistema. Esta ruta instala solo releases publicados.

Instala uv

Sáltalo si uv --version ya funciona.

$ curl -LsSf https://astral.sh/uv/install.sh | sh
$ . "$HOME/.local/bin/env"

Instala OpenSquilla

El mismo comando en cualquier plataforma.

$ uv tool install --python 3.12 "opensquilla[recommended] @ https://github.com/opensquilla/opensquilla/releases/download/v0.3.1/opensquilla-0.3.1-py3-none-any.whl"

Instala el wheel de OpenSquilla desde la URL del release; después uv descarga las dependencias declaradas por los extras elegidos. El extra recommended por defecto incluye las dependencias de runtime de SquillaRouter (ONNX Runtime, LightGBM, NumPy, tokenizers).

Configura y ejecuta

# Asistente de onboarding interactivo
$ opensquilla onboard

# Inicia el servidor ASGI
$ opensquilla gateway run

Si opensquilla no aparece justo después de una instalación nueva de uv, abre una terminal nueva o vuelve a ejecutar la línea de PATH del paso 1.

Las URLs de wheel son versionadas por diseño — los instaladores validan la versión del nombre del archivo. El comando de arriba fija v0.3.1.

Requisitos: Git · Git LFS · uv

Si uv no está disponible, el instalador usa Python 3.12+ con pip ≥ 23.

Opcional: instala los requisitos desde una terminal

Windows PowerShell

winget install --id Git.Git -e
winget install --id GitHub.GitLFS -e
powershell -ExecutionPolicy Bypass -c "irm https://astral.sh/uv/install.ps1 | iex"
git lfs install

macOS (Homebrew)

brew install git git-lfs uv
git lfs install

Debian / Ubuntu

sudo apt update
sudo apt install -y git git-lfs
curl -LsSf https://astral.sh/uv/install.sh | sh
git lfs install

Fedora

sudo dnf install -y git git-lfs
curl -LsSf https://astral.sh/uv/install.sh | sh
git lfs install

Arch

sudo pacman -S --needed git git-lfs
curl -LsSf https://astral.sh/uv/install.sh | sh
git lfs install

Clonar con LFS

$ git lfs install
$ git clone https://github.com/opensquilla/opensquilla.git
$ cd opensquilla
$ git lfs pull --include="src/opensquilla/squilla_router/models/**"

Git LFS descarga los modelos de enrutamiento ML incluidos. El pull es idempotente — sale silenciosamente si el checkout ya está completo.

Ejecutar el instalador

# Instala .[recommended] vía uv tool install (cae a pip --user si no hay uv)
$ bash scripts/install_source.sh

La mayoría de canales funcionan con la instalación base. Extras opcionales: matrix, matrix-e2e, document-extras — vía OPENSQUILLA_INSTALL_EXTRAS=matrix (bash) o -Extras matrix (PowerShell).

Configurar (asistente interactivo)

$ opensquilla onboard

Te guía a través de proveedores de modelos, canales y políticas de seguridad. Usa el comando opensquilla ya instalado — no antepongas uv run salvo que uses Desarrollar desde código.

Iniciar el Gateway

# Iniciar servidor ASGI (por defecto 127.0.0.1:18791)
$ opensquilla gateway run

Luego visita http://127.0.0.1:18791/control/ para abrir el panel de control.

En Windows sin Visual C++ Redistributable el gateway igual arranca; el router incluido cae a una ruta directa segura.

Usa esta ruta solo para modificar, probar o depurar el checkout actual. A diferencia de Instalar desde código, esta ruta requiere uv: uv sync crea un .venv local al checkout y uv run ejecuta directamente contra el árbol fuente vivo.

# Crear el .venv local al checkout con extras recommended + dev
$ uv sync --extra recommended --extra dev

# Verificar la instalación
$ uv run opensquilla --help

El extra recommended también incluye SquillaRouter para desarrollo; el extra dev instala las herramientas de test, lint y typecheck.

Instala extras adicionales en el mismo entorno: uv sync --extra recommended --extra dev --extra matrix

En este modo, antepón uv run a cada comando opensquilla. No depures un checkout de desarrollo a través de un opensquilla de usuario — ese comando corre en otro entorno de Python.

Abrir la guía de contribución en GitHub

Para uso avanzado, visita el repo de GitHub

Despliega una vez, llega a todas partes ³

Configura un Agent y atiende a usuarios en múltiples canales

Terminal Web Slack Discord Telegram MS Teams Matrix Lark DingTalk WeCom QQ

Cada centavo, gastado donde importa

OpenSquilla hace que tu Agent gaste menos, recuerde más y funcione más seguro.

💰

Optimización de costos

Múltiples estrategias coordinadas para maximizar cada Token

Enrutamiento inteligente ²

Como ride-sharing — preguntas simples toman el bus (modelos baratos), las complejas obtienen el coche premium (modelos top). El sistema decide.

Análisis híbrido de características

Combina características hechas a mano (longitud, idioma, bloques de código, palabras clave) con características semánticas basadas en embeddings para evaluar complejidad y elegir el modelo correcto.

Niveles de profundidad de razonamiento

Desactiva facturación de razonamiento para consultas simples, solo activa pensamiento profundo para las complejas — sin pagar Tokens de razonamiento por un "hola".

Prompts adaptativos

Auto-ajusta el prompt según la complejidad de la tarea — ligero para lo simple, plena potencia para lo complejo.

Skills bajo demanda

Sin volcar todas las capacidades en el contexto. Solo carga lo necesario para la tarea actual — evita desperdicio de Tokens.

🪄

Protocolo MetaSkills

Un meta-protocolo que le dice al Agent cómo buscar, filtrar, componer — y hasta evolucionar — skills a escala

Auto-organización

El trabajo multi-paso se convierte en flujos reutilizables e inspeccionables. Parsing de composición, planificación de pasos, proposal gates — recetas en las que confías al ejecutarlas.

meta-skill-creator

Una MetaSkill incluida que convierte colaboraciones recurrentes de varias skills en propuestas de nuevas MetaSkills — el Agent amplía así su propio catálogo.

N+ Skills de la comunidad

El Agent descubre, prioriza e invoca Skills del catálogo de la comunidad de forma autónoma — sin selección manual, la correcta se carga sola.

10+ MetaSkills incluidas

MetaSkills curadas listas para usar — research-to-report, redacción de papers, preparación de búsqueda de empleo, planificación de proyectos, producción de cortos y más workflows de alta calidad, listos para ejecutar.

Replay y Modo Sueño

Cada ejecución deja un rastro auditable y reproducible. Cuando estás inactivo, OpenSquilla revisa esos rastros, destila patrones de uso y redacta MetaSkills candidatas — la capacidad crece en segundo plano.

🧠

Memoria humana

Arquitectura cognitiva de cuatro niveles — más inteligente con el uso

Memoria de 4 niveles

Memoria de trabajo (tarea actual) → Episódica (experiencia y causalidad) → Semántica (hechos y reglas) → Cruda (auditoría y base de reentrenamiento) — refleja la cognición humana.

Búsqueda híbrida + embeddings locales

Búsqueda vectorial semántica + palabras clave de texto completo en paralelo. Inferencia ONNX integrada en CPU — los embeddings permanecen en tu máquina, opción de cambiar a OpenAI / Ollama.

Promoción de memorias activas

Las memorias frecuentemente recordadas suben automáticamente. Cuanto más útiles, más accesibles. Las memorias frías se hunden naturalmente.

Decaimiento temporal

Las memorias datadas se desvanecen exponencialmente, mientras los elementos marcados como "permanentes" permanecen intactos.

Consolidación Memory Dream

Cada 24 horas, la IA "sueña" — consolidando memorias dispersas en conocimiento estructurado. Como el sueño consolida la memoria humana.

🛡️

Sandbox de seguridad

Deja que tu Agent actúe — sin temer lo que pueda hacer

Política de tres niveles

Standard ejecuta directamente, Strict requiere aprobación de sandbox, Locked exige revisión humana — escalada basada en riesgo.

Aislamiento sandbox real

Bubblewrap en Linux, Seatbelt en macOS — el código se ejecuta en entorno aislado, sin tocar tus archivos reales.

Registro de denegaciones

¿Tres rechazos seguidos? La IA se pausa automáticamente. Detiene intentos de "fuerza bruta" para saltarse las políticas.

Protección de salidas obsoletas

Los resultados de operaciones rechazadas se purgan inmediatamente — la IA no puede usarlos vía "leer salida anterior".

Defensa contra Prompt Injection

Escapa en XML todos los metadatos de skills y resultados de herramientas — cierra los vectores comunes de inyección.

Microkernel: núcleo diminuto, ecosistema vasto

Inspirado en microkernels de SO — el motor central hace lo mínimo: orquestación y gestión de estado. Todo lo demás corre como plugin en "espacio de usuario". ¿Cambiar proveedor LLM? Implementa un Protocol. ¿Añadir herramienta? 5 líneas de código. Los crashes de plugins no afectan al núcleo; las actualizaciones del núcleo no rompen los plugins.

OpenSquilla Core Engine

Orquestador de pipeline compacto · Máquina de estados · Totalmente async · Auto-rollback en errores

⚙️

engine/

Máquina de estados

🤖

provider/

Multi-LLM Provider

🌐

gateway/

Gateway ASGI RPC

🧠

memory/

Memoria multi-nivel

📡

channels/

Adaptadores de canal

🔧

tools/ + mcp/

Herramientas MCP-First

🛡️

sandbox/

Sandbox de seguridad

⏰

scheduler/

Programador de tareas

🧩

skills/

Plugins de skills

🎭

identity/

Identidad y Prompts

Integrado

🔍 Búsqueda: Brave / DuckDuckGo 🧬 Embeddings locales: inferencia ONNX (offline · datos permanecen en el dispositivo) 🔌 Embeddings opcionales: OpenAI / Ollama

Mismo presupuesto, mayor densidad de inteligencia

Comparación punto por punto con frameworks Agent open source equivalentes⁴

Dimensión	OpenSquilla	OpenClaw	Hermes Agent
🏗️Arquitectura	✅ Microkernel con separación de 5 capas, orquestador ultracompacto (~100 líneas), todas las capacidades como plugins, auto-skip + rollback en errores	⚠️ Ecosistema de plugins maduro (decenas de extensiones), límites claros pero más capas	❌ Bucle principal síncrono monolítico masivo (miles de líneas), toda la lógica fuertemente acoplada
💰Optimización de costos	✅ Enrutamiento ML + niveles de razonamiento + aislamiento de cache de prompts + skills bajo demanda — ahorros multi-estrategia del 60-80%	⚠️ Modelo principal + cadena fallback fijados en config, sin selección por contenido	⚠️ Heurísticas crudas de palabras clave + longitud, única estrategia de enrutamiento
💾Sistema de memoria	✅ Vector + palabras clave + dedup + decaimiento temporal + promoción de memoria activa + migración automática de schema	⚠️ Tiene decaimiento / promoción / reranking de diversidad, pero le falta estructura cognitiva de 4 niveles y consolidación Memory Dream	⚠️ Solo búsqueda por palabras clave, sin semántica vectorial, memoria semántica requiere integración externa
🛡️Sandbox de seguridad	✅ Sin dependencia de Docker — aislamiento a nivel syscall CPU/memoria/tiempo + control de red 3 niveles. Compatible con serverless	⚠️ Docker opcional con OpenShell como alternativa ligera, más pesado que aislamiento syscall	✅ Aprobación de comandos peligrosos + 6 entornos de ejecución (local/Docker/SSH etc)
💰Seguimiento de costos	✅ Costo real por llamada listo para usar, hooks de cuota para auto-throttling en sobreconsumo	✅ Tabla de precios integrada, costo escrito en metadatos de sesión	✅ Tokens entrada/salida/cache-read/cache-write/razonamiento rastreados por separado
📊Observabilidad	✅ Logs de decisión almacenan hashes (sin texto crudo, amigable a compliance), cada etapa del pipeline instrumentada	✅ OpenTelemetry nativo (como plugin), plug-and-play con Prometheus/Grafana	⚠️ Tabla de sesión SQLite + contador de llamadas, nivel básico
🧩DX de extensión	✅ Una clase duck-typed de pocas líneas es plugin válido — sin clase base, sin paquete SDK, sin manifest	⚠️ Implementar interfaz en plugin-sdk + escribir archivo manifest	⚠️ Herramientas se auto-registran al import (efectos secundarios implícitos)

🏗️Arquitectura

OpenSquilla

✅ Microkernel con separación de 5 capas, orquestador ultracompacto (~100 líneas), todas las capacidades como plugins, auto-skip + rollback en errores

OpenClaw

⚠️ Ecosistema de plugins maduro (decenas de extensiones), límites claros pero más capas

Hermes Agent

❌ Bucle principal síncrono monolítico masivo (miles de líneas), toda la lógica fuertemente acoplada

💰Optimización de costos

OpenSquilla

✅ Enrutamiento ML + niveles de razonamiento + aislamiento de cache de prompts + skills bajo demanda — ahorros multi-estrategia del 60-80%

OpenClaw

⚠️ Modelo principal + cadena fallback fijados en config, sin selección por contenido

Hermes Agent

⚠️ Heurísticas crudas de palabras clave + longitud, única estrategia de enrutamiento

💾Sistema de memoria

OpenSquilla

✅ Vector + palabras clave + dedup + decaimiento temporal + promoción de memoria activa + migración automática de schema

OpenClaw

⚠️ Tiene decaimiento / promoción / reranking de diversidad, pero le falta estructura cognitiva de 4 niveles y consolidación Memory Dream

Hermes Agent

⚠️ Solo búsqueda por palabras clave, sin semántica vectorial, memoria semántica requiere integración externa

🛡️Sandbox de seguridad

OpenSquilla

✅ Sin dependencia de Docker — aislamiento a nivel syscall CPU/memoria/tiempo + control de red 3 niveles. Compatible con serverless

OpenClaw

⚠️ Docker opcional con OpenShell como alternativa ligera, más pesado que aislamiento syscall

Hermes Agent

✅ Aprobación de comandos peligrosos + 6 entornos de ejecución (local/Docker/SSH etc)

💰Seguimiento de costos

OpenSquilla

✅ Costo real por llamada listo para usar, hooks de cuota para auto-throttling en sobreconsumo

OpenClaw

✅ Tabla de precios integrada, costo escrito en metadatos de sesión

Hermes Agent

✅ Tokens entrada/salida/cache-read/cache-write/razonamiento rastreados por separado

📊Observabilidad

OpenSquilla

✅ Logs de decisión almacenan hashes (sin texto crudo, amigable a compliance), cada etapa del pipeline instrumentada

OpenClaw

✅ OpenTelemetry nativo (como plugin), plug-and-play con Prometheus/Grafana

Hermes Agent

⚠️ Tabla de sesión SQLite + contador de llamadas, nivel básico

🧩DX de extensión

OpenSquilla

✅ Una clase duck-typed de pocas líneas es plugin válido — sin clase base, sin paquete SDK, sin manifest

OpenClaw

⚠️ Implementar interfaz en plugin-sdk + escribir archivo manifest

Hermes Agent

⚠️ Herramientas se auto-registran al import (efectos secundarios implícitos)

¿Quién se beneficia más de OpenSquilla?

Estos escenarios obtienen el mayor ROI

🏢

Despliegue on-premise

Totalmente offline, los datos nunca salen de tu red, el enrutamiento ML corre localmente

📋

Compliance y auditoría

Políticas de tres niveles + logs de decisión hasheados + puertas de aprobación humana

💸

Presupuesto ajustado, exigencias altas

Más tareas por el mismo costo — el enrutamiento inteligente elige el modelo más rentable

🧠

Un Agent que te entiende

Memoria humana de 4 niveles que acumula contexto — nunca empieces desde cero

Oferta limitada de Tokens gratis

Tokens gratis, prueba sin riesgo

OpenSquilla es totalmente open source — descarga desde GitHub y autoaloja cuando quieras.
Pero ejecutar LLMs sigue costando Tokens. Te damos un crédito Token inicial para que verifiques "OpenSquilla ahorra 60-80%" sin riesgo.

10 segundos para completar, sin tarjeta de crédito.

Reclamar Tokens gratis

¿Tienes tus propios Tokens? Usa la versión open source en GitHub

Open source Apache 2.0

Sin tarjeta de crédito

Soporte prioritario

Cantidad limitada · Por orden de llegada

Inteligencia de Agente IA optimizada en Tokens

Inicio rápido

Tutorial en vídeo

Descarga y extrae

Botón derecho en Start OpenSquilla.cmd → Ejecutar como administrador

Completa la configuración inicial y abre la Web UI

Instala uv

Instala OpenSquilla

Configura y ejecuta

Clonar con LFS

Ejecutar el instalador

Configurar (asistente interactivo)

Iniciar el Gateway

Despliega una vez, llega a todas partes 3

Cada centavo, gastado donde importa

Optimización de costos

Protocolo MetaSkills

Memoria humana

Sandbox de seguridad

Microkernel: núcleo diminuto, ecosistema vasto

Mismo presupuesto, mayor densidad de inteligencia

¿Quién se beneficia más de OpenSquilla?

Tokens gratis, prueba sin riesgo

Despliega una vez, llega a todas partes ³