Das Modell ist lokal als 3b 8b und 14b Variante und in der Cloud als 675b Variante verfügbar. Die Performance Werte der lokalen Modelle sehen beeindruckend aus. Wenn es hält was es verspricht, kann sich daraus und schlanker und schneller Ersatz für gpt-oss ergeben.
Ich habe die Modelle mal durch meinen kleinen Benchmarktest -workflow geschickt, schnell sind die beiden Modelle (siehe Anhang)
Gruß
Elmar