Hay una razón por la que a veces Claude o ChatGPT te dan respuestas genéricas o se "olvidan" de lo que dijiste antes.
Se llama límite de tokens.
Los tokens son la cantidad de información que tu IA puede leer y recordar en una sola conversación. Piénsalo como una mesa de trabajo. Cuando la llenas de papeles ya no hay espacio para trabajar bien.
Lo que consume tus tokens sin que lo notes:
Pegar textos largos o correos completos gasta tokens innecesarios con información que la IA no necesita.
Subir PDFs o fotos consume una cantidad enorme de tokens de golpe. Una foto puede gastar lo mismo que varios párrafos de texto.
Los chats largos acumulan tokens con cada mensaje.
Y aquí está lo que pocos saben: tu IA no solo lee tu último mensaje. Lee toda la conversación desde el inicio cada vez que respondes. Cada mensaje nuevo suma al total. Por eso cuando llevas mucho tiempo en el mismo chat las respuestas se vuelven más lentas, más genéricas y pierde el hilo.
El problema que tiene la mayoría:
Tienen conversaciones de horas con la IA acumulando contexto de temas completamente distintos. Para cuando llegan a la pregunta importante la IA ya tiene la mesa llena y no puede trabajar bien.
Lo que yo hago:
En lugar de pegar el correo completo le digo:
"Tengo un cliente que pregunta por precio y tiempo de entrega de conectores de cobre. ¿Cómo respondo?"
Contexto específico. Pregunta clara. Respuesta útil.
Las 4 reglas que uso:
- Una sola tarea por mensaje. No le pidas 5 cosas al mismo tiempo.
- Describe en lugar de pegar. Resume el contexto en 2 líneas en lugar de copiar documentos completos.
- Cuando subas un PDF o foto dile exactamente qué buscar. No lo dejes adivinar porque gasta tokens leyendo todo.
- Empieza conversación nueva cuando el tema cambia. No acumules temas distintos en el mismo chat.
La acción de hoy es una sola:
Toma algo que le ibas a pegar completo y descríbeselo en 2 líneas en lugar de copiarlo. Nota la diferencia en la respuesta.
Mañana te enseño cómo resolver esto de raíz con Proyectos para que nunca tengas que repetir contexto otra vez.
¿Alguien ha notado que mientras más larga la conversación peores se vuelven las respuestas?