Hola comunidad, Estoy implementando un sistema de búsqueda de clientes en una base de datos de Supabase usando RAG y un sistema multiagente. La idea es que, al consultar por Telegram, el bot pueda encontrar y devolver la información de un cliente según su ID y, en caso de no encontrarlo, buscar por nombre.
Problema:
En pruebas con una base reducida de 60 clientes, el sistema funcionó correctamente. Sin embargo, al probar con la base real (1,140 filas y 22 columnas), el bot no encuentra a los clientes en Supabase.
Configuración actual:
- Chunk Size: 350
- Chunk Overlap: 50 (según recomendación del prompt)
- Longitudes de texto en el documento:Mínima: 103 caracteres, Máxima: 353 caracteres, Promedio: 192.63 caracteres, Total: 219,401 caracteres
Datos en la base
Mi archivo original en Google Sheets contiene información estructurada con los siguientes encabezados: id, nombre_cliente, rfc, terminos_de_pago, forma_de_pago, metodo_de_pago, uso de CFDI, servicio, correo, numero_telefono, direccion_factura, pais, estado, municipio, cp, archivos_finales_impresion_cliente, costo_por_pieza, numero_de_piezas, costo_total_ultimo_servicio, fecha_de_venta, estado_pedido, notas.
Acciones probadas
- He ajustado los valores de Chunk Size y Chunk Overlap sin éxito.
- Verifiqué que el prompt del agente está correctamente configurado para priorizar la búsqueda por ID y, si no encuentra coincidencias, por nombre.
- En la prueba con 60 clientes, la búsqueda funcionó correctamente.
- No sé si el problema está en la indexación en Supabase o en la forma en que el bot consulta la base.
¿Alguien ha tenido un problema similar con Supabase y RAG? ¿Alguna recomendación para mejorar la indexación o depurar la consulta del bot?
¡Gracias de antemano por la ayuda!