Si los precios de Claude Code—entre $20 y $200 mensuales, con límites de uso que se reinician cada cinco horas—te tienen replanteando tu configuración de IA para programación, existe una alternativa gratuita y creíble que vale la pena probar. Goose, un agente de código abierto de Block (la empresa de pagos de Jack Dorsey), hace gran parte de lo que hace Claude Code: escribe, ejecuta, depura y orquesta código en múltiples archivos. La diferencia es que puede ejecutarse completamente en tu propio hardware, con el modelo que elijas, sin costo alguno.
El gancho práctico es la agnóstica respecto a modelos. Goose se conecta a Claude de Anthropic, GPT-5 de OpenAI, Gemini de Google, o servicios de enrutamiento como Groq y OpenRouter, pero también puede ejecutarse completamente en local usando Ollama y modelos de código abierto. Local significa sin suscripción, sin límites de uso, sin restricciones de velocidad, y sin que tu código abandone tu máquina. Puedes trabajar sin conexión, incluso en un avión. El proyecto tiene impulso para demostrarlo: más de 26.100 estrellas en GitHub, 362 contribuidores y 102 lanzamientos, con la versión 1.20.1 entregada en enero de 2026.
¿Por qué importa esto ahora? Los límites de uso de Anthropic han frustrado a usuarios intensivos. El plan Pro ($17–20/mes) te limita a aproximadamente 10–40 prompts cada cinco horas; incluso el plan Max de $200 impone límites semanales expresados en vagas "horas" que en realidad se traducen en presupuestos de tokens—análisis independientes estiman límites por sesión cercanos a 44.000 tokens para Pro y 220.000 para Max. Anthropic afirma que menos del 5% de los usuarios se ven afectados, pero no ha aclarado si es el 5% de los suscriptores Max o de todos los usuarios. De cualquier forma, desarrolladores serios reportan chocar contra estos límites en menos de 30 minutos de trabajo intensivo.
Comenzar con una configuración completamente gratuita requiere tres componentes. Instala Ollama desde ollama.com y descarga un modelo con buen soporte para llamadas de herramientas—ollama run qwen2.5 funciona bien para programación. Instala Goose (versión de escritorio o CLI) desde sus lanzamientos en GitHub; Block proporciona binarios para macOS, Windows y Linux. Luego apunta Goose hacia Ollama: en la aplicación de escritorio ve a Configuración → Configurar Proveedor → Ollama y confirma que el host sea http://localhost:11434; en la CLI, ejecuta goose configure, selecciona Ollama e ingresa el nombre del modelo. Ese es todo el proceso—un agente autónomo ejecutándose localmente sin cargos.
Presupuesta tu hardware con realismo. Block recomienda 32GB de RAM como línea de base sólida para modelos más grandes; en Macs es memoria unificada, en Windows/Linux la VRAM de una GPU NVIDIA discreta hace el trabajo pesado. No necesitas una estación de trabajo para empezar—variantes más pequeñas de Qwen 2.5 funcionan con 16GB—pero una MacBook Air de 8GB tendrá dificultades. Comienza en pequeño para validar tu flujo de trabajo, luego escala.
Conoce los compromisos antes de comprometerte. Claude 4.5 Opus sigue liderando en las tareas más difíciles, sigue instrucciones matizadas mejor, y encabeza el Ranking de Llamadas de Función de Berkeley para uso de herramientas. La ventana de contexto de Claude (hasta un millón de tokens) supera ampliamente el típico local de 4K–8K. La inferencia en la nube es más rápida, y las herramientas de Anthropic—almacenamiento en caché de prompts, salidas estructuradas—son más pulidas. Pero la brecha se cierra rápidamente: modelos abiertos como Kimi K2 y GLM 4.5 ahora se comparan con Sonnet 4. Para desarrolladores que valoran el costo, la privacidad, el acceso sin conexión y el control sobre el pulido y la calidad máxima, Goose es una opción real que posees completamente.