Grok Imagine 1.0 w higgsfield
Testowaliście już? Start frame - nie ma end frame, ale rewelacyjnie trzyma spójność postaci. Brakuje lip sync na ten moment (patrz drugie video) i ma jakieś braki - przy siadaniu w samolocie (jedno miejsce między alejką a oknem i zaczepianie górą o panel pod lukiem bagażowym), ale samo polskie audio ogarnia. Potrzeba jeszcze dopracować wg mnie zgranie dźwięków z tych co na ekranie, testowałam na szczekaniu naszego najmłodszego skarbu (pierwsze wideo) ale widać że nie ma tu zgrania, a myślałam że będzie to łatwiejsze niż lip sync w mowie. Ale tak generalnie to model daje całkiem niezłe wyniki, tylko jak ze wszystkimi trzeba dograć sobie samemu do czego nam akurat może się przydać. Generuje mniejszą rozdzielczość 480p lub 720p a i tak jakość jest bardzo fajna (testowałam 720p). Różnica jest taka, że wewnątrz groka generuje 10 sekund, w Higgsfield mamy wybór: 1, 3, 6, 9 ,12 lub 15 sekund. Przy 9 sekundach w 720 p - pobiera 14 kredytów. Ważne - grafika referencyjna musi mieć to samo aspect ratio co wybrane video w higgsfield, bo w przeciwnym razie nie wycina tylko ściska klatkę startową co całkowicie deformuje późniejszy efekt.