Claude Code + Ollama Cloud
Hoy estaba en un grupo de WhatsApp de nerds hablando de IA y salió el tema de siempre: cómo usar modelos distintos con Claude Code sin perder la experiencia.
Lo comparto aquí porque sé que más de uno en la comunidad tiene la misma duda.
Lo primero que tengo que decir: llevo meses buscando algo mejor que Claude Code como interfaz agéntica. No lo encontré. La herramienta de Anthropic sigue siendo la mejor para coding agéntico, automatizaciones, refactors, debug. No es opinión — la probé contra las alternativas y sigo volviendo a ella.
Pero lo que sí cambié son los modelos que uso por detrás.
Y aquí viene lo que la mayoría no sabe: Claude Code no es un modelo, es una interfaz. Habla un protocolo estándar, y ese protocolo lo soportan decenas de proveedores. Cambias una URL en tu configuración y Claude Code pasa a correr con el modelo que tú elijas — sin aprender nada nuevo, sin cambiar tu flujo.
Tengo un benchmark propio donde mido esto con datos reales. No es opinión ni marketing de ningún proveedor: son 10.303 tests contra 111 modelos, con juez Phi-4 de Microsoft corriendo local (sin conflicto de interés). Datos del benchmark v2.8, junio 2026. Lo puedes explorar tú mismo en 👉 benchmarks.cristiantala.com
El dato que más me sorprendió cuando lo armé: la correlación entre precio y calidad es negativa. Los modelos más caros tienden a rendir peor en la mayoría de tareas. No porque sean malos — sino porque están optimizados para razonamiento profundo, y en tareas cotidianas ese razonamiento interno factura tokens extra sin mejorar el resultado.
Ahora bien, el modelo que me tiene sorprendido esta semana específicamente: Kimi K2.7 de Moonshot via Ollama Cloud.
Está respondiendo extraordinariamente rápido, el coding es muy sólido, soporta 256k tokens de contexto, y el costo es una fracción de lo que pagarías por Sonnet o Opus para la misma tarea.
Lo estoy usando directo desde Claude Code. El setup tarda 5 minutos.
Cómo conectar Claude Code con Ollama Cloud
1. Instala Ollama
En Mac también lo puedes bajar como app nativa desde ollama.com.
2. Prueba el modelo
ollama run kimi-k2.7-code:cloud "hola"
Ahora tienes dos formas de conectarlo con Claude Code. Yo prefiero la segunda.
Opción A — Variables de entorno (afecta toda tu sesión de terminal)
Abre ~/.zshrc y agrega:
export ANTHROPIC_BASE_URL="http://localhost:11434"
export ANTHROPIC_AUTH_TOKEN="ollama"
export ANTHROPIC_API_KEY=""
Después ejecuta source ~/.zshrc. Luego: claude --model kimi-k2.7-code:cloud y listo.
Para volver a Claude Max tienes que abrir otra ventana de terminal o comentar esas líneas. Funciona, pero es engorroso si cambias seguido entre proveedores.
Opción B — archivo settings.json por proyecto (la más limpia ✅)
Claude Code lee un archivo settings.json dentro de la carpeta .claude/ de cada proyecto. Si pones la configuración ahí, aplica solo cuando estás en ese directorio — tu Claude Max global no se toca.
Crea la carpeta:
bashmkdir -p .claude
Crea .claude/settings.json con este contenido:
json{
"env": {
"ANTHROPIC_BASE_URL": "http://localhost:11434",
"ANTHROPIC_AUTH_TOKEN": "ollama",
"ANTHROPIC_API_KEY": "",
"ANTHROPIC_MODEL": "kimi-k2.7-code:cloud",
"ANTHROPIC_SMALL_FAST_MODEL": "kimi-k2.7-code:cloud"
}
}
Desde esa carpeta ejecutas simplemente:
claude
Claude Code ya sabe que tiene que usar Ollama + Kimi. Sin tocar nada global, sin variables de entorno, sin recordar nada. Abres el proyecto y funciona.
Para volver a Claude Max: vas a cualquier otra carpeta que no tenga ese settings.json, o simplemente eliminas el archivo.
Otros modelos que vale la pena probar vía Ollama Cloud:
glm-4.7-flash → rápido, barato, bueno para tareas de chat y documentación
qwen3.5:cloud → buen balance para uso general
nemotron-3-ultra:cloud → 262k contexto, bueno para documentos largos
Si quieres ver el detalle completo — incluyendo cómo conectar MiniMax, DeepSeek, NVIDIA NIM y otros 15+ proveedores — está todo en la guía que publiqué en mi blog:
Y si querés comparar modelos para tu caso específico (agentes N8N, coding, contenido en español, lo que sea):
¿Alguien más en la comunidad está usando modelos alternativos con Claude Code? Me interesa saber cuál les está funcionando mejor y para qué tarea.
8
7 comments
Cristian Tala
6
Claude Code + Ollama Cloud
Cágala, Aprende, Repite | CAR
skool.com/cagala-aprende-repite
Emprende con IA y haz rentable tu PYME o Startup — aprendiendo de tropiezos reales, no de gurús vendehumo. Cágala, Aprende, Repite.
Leaderboard (30-day)
Powered by