Documentación
Todo lo que necesitas para instalar, configurar y aprovechar al máximo Halcón CLI.
Instalación
Instalación rápida (recomendado)
curl -sSfL https://cuervo.cloud/install.sh | sh iwr -useb https://cuervo.cloud/install.ps1 | iex
El instalador detecta tu plataforma, descarga el binario correcto, verifica el checksum SHA-256
y lo coloca en ~/.local/bin/halcon.
No requiere sudo.
Otros métodos
brew tap cuervo-ai/tap && brew install halcon curl -sSfL https://cuervo.cloud/install.sh | sh -s -- --version v0.2.0 Flags globales
Los flags globales van antes del subcomando y se aplican a toda la sesión. La mayoría tienen equivalentes como variables de entorno.
Ejemplo: halcon -p openai -m gpt-4o chat "refactoriza esta función"
Configuración
Halcón lee la configuración desde ~/.halcon/config.toml (global)
y ./.halcon/config.toml (override de proyecto).
En la primera ejecución se crea una configuración por defecto automáticamente.
Cambio en tiempo real: halcon config set general.default_provider openai
Primera conversación
halcon auth login anthropic halcon chat "¿Cuánto es 2+2?" halcon chat --tui halcon chat --full "explica este codebase" Activa orquestación, reflexión, tareas estructuradas y feedback experto.
Referencia CLI
halcon chat
Inicia una sesión con acceso completo a herramientas. Pasa un prompt para modo puntual o sin argumento para el REPL interactivo.
halcon auth
Gestiona las claves API. Las claves se guardan en el keychain del sistema operativo — nunca se escriben en disco en texto plano.
halcon config
Lee y escribe valores de configuración sin editar el archivo TOML manualmente.
halcon init
Inicializa Halcón en el directorio del proyecto actual. Crea un override .halcon/config.toml.
halcon status
Muestra el estado actual del sistema: proveedor y modelo activos, número de sesiones, versión y estado del keychain.
halcon tools
Inspecciona y gestiona las 21 herramientas integradas. Añade herramientas personalizadas via manifests TOML en
~/.halcon/tools/<nombre>.toml.
halcon memory
Consulta y gestiona el almacén de memoria episódica. El agente lee automáticamente la memoria relevante antes de cada respuesta usando búsqueda semántica BM25.
halcon trace
Inspecciona y exporta trazas de sesión. Las trazas son archivos JSONL legibles que capturan cada round del agente, llamada a herramienta y respuesta del modelo.
halcon replay
Reproduce un archivo de traza JSONL. Los resultados de herramientas se leen de la traza — no hay ejecución de herramientas en vivo. Útil para pruebas deterministas y depuración.
halcon metrics
Visualiza y gestiona métricas de rendimiento agregadas de sesiones pasadas: latencia, coste, uso de tokens, invocaciones de herramientas.
halcon doctor
Ejecuta diagnósticos completos del sistema — conectividad de proveedores, salud de herramientas, validez de config, acceso al keychain, integridad de base de datos. Adjunta la salida al reportar problemas.
halcon update
Auto-actualización: descarga el manifest de la última versión desde cuervo.cloud, verifica el checksum SHA-256 y reemplaza el binario de forma atómica.
halcon mcp-server
Inicia Halcón como servidor MCP sobre stdio. Expone las 21 herramientas vía JSON-RPC a cualquier IDE compatible (Cursor, VS Code, Zed, etc.).
halcon serve
Inicia un API de control HTTP con streaming por WebSocket. Útil para integraciones de escritorio y control programático.
Feature flags
Las capacidades avanzadas son opt-in por sesión. Usa --full para activarlas todas de una vez,
o actívalas individualmente para una sesión más liviana.
--full Activa orquestación + reflexión + tareas + salida experto en un solo flag. --orchestrate Orquestación multi-agente con grafos de dependencias y wave scheduling. Requiere planificación adaptativa. --reflexion Bucle de auto-mejora: el agente reflexiona sobre su propio output y se autocorrige antes de responder. --tasks Framework de tareas estructuradas con FSM de 9 estados, políticas de reintento, tracking de artefactos y provenance. --expert Mostrar feedback completo del agente: selección de modelo, cache hits, eventos de compactación, estadísticas de round. --metrics Imprimir métricas de sesión al salir: rounds, tokens, coste, duración, invocaciones de herramientas. --timeline Exportar el timeline completo de ejecución como JSON al salir. --trace-out <ruta> Escribir una traza JSONL de ejecución. Editable; reproducir con halcon replay o --trace-in. --resume <id> Reanudar una sesión previa por UUID — restaura mensajes, conteos de tokens y estado de sesión. TUI Cockpit
Se lanza con halcon chat --tui.
Una interfaz de terminal de 3 zonas que ofrece visibilidad y control en tiempo real sobre cada acción del agente.
Las tres zonas
Atajos de teclado
Secciones del panel lateral
Sistema de memoria
Halcón gestiona el contexto automáticamente con una arquitectura de memoria de 5 niveles. No hace falta configurarlo — el agente decide qué mantener, comprimir y recuperar según relevancia y presupuestos de tokens.
Niveles de contexto (sesión activa)
Memoria episódica (entre sesiones)
Almacenada en ~/.halcon/halcon.db con SQLite e índice FTS5 de texto completo.
El agente registra automáticamente decisiones, patrones de código y hechos importantes, recuperando las entradas más relevantes antes de cada respuesta.
Slash commands
Dentro del REPL o TUI, escribe / para acceder a comandos en vivo sin salir de la sesión.
Configuración de proveedores
Las claves API se guardan en el keychain del OS via halcon auth login.
La estrategia de routing (balanced · fast · cheap) elige entre los proveedores configurados automáticamente.
ANTHROPIC_API_KEY OPENAI_API_KEY DEEPSEEK_API_KEY GEMINI_API_KEY (sin clave requerida) Permisos de herramientas
Cada herramienta tiene un nivel de permiso explícito. Las herramientas Destructive solicitan confirmación antes de ejecutarse.
Configura tools.confirm_destructive = false para deshabilitar en pipelines CI/automatizados.
¿Necesitas más ayuda?
halcon doctor — Ejecuta diagnósticos primero y adjunta la salida a tu reporte