Salut à tous,
Pour ceux qui créent des Agents IA, question : comment faites-vous des jeux de tests pour tester vos Agent avant mise en prod?
Mon idée (pas encore testé) c'est de
- Demander à ChatGPT de me générer une centaine d'input d'agent différents
- Mettre tout ça dans une db type Airtable
- Faire un worfklow dédié "tests run" où je loop sur tous ces input pour déclencher mon agent
- Mettre dans la db les résultats
- Faire évaluer ça ou par moi-même (des fois on voit vite où ce qui merde) ou carrément par un LLM (avec un autre workflow dédié "vérification des tests")
Vous en pensez quoi? Ceux qui pratiquent dans la vraie vie comme ou d'autres, vous faites comment vous? Merci pour vos retours, ça va m'aider à faire un pas de plus vers l'acquisition de mon voilier :)
Christophe