Question routing + compte de tokens

Salut à tous, quelqu’un utilise Claude Code et un routeur ici par hasard ?

J’aimerais utiliser un modèle pour le raisonnement (Qwen2.5-27B ou un modèle MOE de la gamme Qwen) et un autre pour le code (Qwen3 Coder Next). Quel seuil de tokens vous semble réaliste dans Claude Code Router pour basculer vers Coder Next ? Merci.

Aussi, est-ce qu’il y a un moyen de suivre les tokens en entrée/sortie dans le temps/en cumulé ? (histoire de voir si le setup IA local amortit vraiment le coût du MacBook 🙂).

À part ça, pour ceux qui utilisent oMLX, je recommande d’essayer. Chez moi, ça a vraiment amélioré la vitesse grâce à son système de pagination mémoire sur SSD.

Merci.

2 comments

AISANCE

skool.com/aisance-8291

Ici on partage notre passion de l'automatisation, on s'entraide et on progresse ensemble 💪🏻

KubeCraft Career Accelerator

AI Cyber Value Creators

AI Money Lab

GenHQ - Creative AI Education

Ai Creators Academy

Bring people together around your passion and get paid.