Pasos para ahorrar créditos en Claude
1. No dejes una sesión pausada más de una hora. En Claude Code el caché vive 1 hora (TTL). Si dejas la sesión quieta y vuelves después, todo se recachea desde cero y pagas el costo completo otra vez. Si ya pasó una hora, mejor abre una sesión nueva. 2. Empieza fresco cuando cambies de tarea. Usa /clear o /compact al saltar a un trabajo distinto. Mantener una sola sesión inflada con contexto irrelevante encarece cada turno porque arrastra más tokens. 3. Mantén la sesión enfocada y activa. La regla práctica es: mantenla viva, mantenla enfocada, y reinicia al cambiar de tema. Así maximizas los cache reads, que cuestan solo el 10% de un input normal (10x más barato). 4. No cambies de modelo a mitad de sesión. Cada modelo tiene su propio caché y funciona por prefix matching. Si haces /model y cambias, el siguiente request lee toda la conversación sin cache hits aunque el contenido sea idéntico. 5. Cuidado con el truco "Opus plan". Configurar Opus para plan mode y Sonnet para ejecución suena eficiente, pero cada toggle es un cambio de modelo y reinicia el caché. A largo plazo puede ahorrar límite de sesión, pero rompe el caché en cada cambio. 6. Edita tu CLAUDE.md a mitad de sesión sin miedo. La edición no se aplica hasta reiniciar la sesión, así que el caché se mantiene intacto mientras sigues trabajando. Cambiar el system prompt en caliente sí rompería todo. 7. En Claude chat, usa Proyectos en vez de pegar documentos en el chat. Los archivos en Proyectos se cachean de forma distinta y más optimizada para almacenar varios documentos, comparado con soltarlos directo en la conversación. 8. Vigila el TTL según cómo pagas. En suscripción es 1 hora. Si pasas el límite semanal y entras a uso extra (API por token), el TTL baja a 5 minutos por defecto, peligroso si manejas varias sesiones en paralelo. Los sub-agents son 5 minutos en cualquier plan.