Salut à tous, quelqu’un utilise Claude Code et un routeur ici par hasard ?
J’aimerais utiliser un modèle pour le raisonnement (Qwen2.5-27B ou un modèle MOE de la gamme Qwen) et un autre pour le code (Qwen3 Coder Next). Quel seuil de tokens vous semble réaliste dans Claude Code Router pour basculer vers Coder Next ? Merci.
Aussi, est-ce qu’il y a un moyen de suivre les tokens en entrée/sortie dans le temps/en cumulé ? (histoire de voir si le setup IA local amortit vraiment le coût du MacBook 🙂).
À part ça, pour ceux qui utilisent oMLX, je recommande d’essayer. Chez moi, ça a vraiment amélioré la vitesse grâce à son système de pagination mémoire sur SSD.
Merci.