Grok Imagine 1.0 w higgsfield
Testowaliście już?
Start frame - nie ma end frame, ale rewelacyjnie trzyma spójność postaci.
Brakuje lip sync na ten moment (patrz drugie video) i ma jakieś braki - przy siadaniu w samolocie (jedno miejsce między alejką a oknem i zaczepianie górą o panel pod lukiem bagażowym), ale samo polskie audio ogarnia.
Potrzeba jeszcze dopracować wg mnie zgranie dźwięków z tych co na ekranie, testowałam na szczekaniu naszego najmłodszego skarbu (pierwsze wideo) ale widać że nie ma tu zgrania, a myślałam że będzie to łatwiejsze niż lip sync w mowie.
Ale tak generalnie to model daje całkiem niezłe wyniki, tylko jak ze wszystkimi trzeba dograć sobie samemu do czego nam akurat może się przydać.
Generuje mniejszą rozdzielczość 480p lub 720p a i tak jakość jest bardzo fajna (testowałam 720p).
Różnica jest taka, że wewnątrz groka generuje 10 sekund, w Higgsfield mamy wybór: 1, 3, 6, 9 ,12 lub 15 sekund. Przy 9 sekundach w 720 p - pobiera 14 kredytów.
Ważne - grafika referencyjna musi mieć to samo aspect ratio co wybrane video w higgsfield, bo w przeciwnym razie nie wycina tylko ściska klatkę startową co całkowicie deformuje późniejszy efekt.
0:09
0:15
0
3 comments
Nina Malinowska
6
Grok Imagine 1.0 w higgsfield
Startuj.AI
skool.com/startujai
Pokazujemy jak zrozumieć i praktycznie wykorzystać sztuczną inteligencję w życiu, pracy i biznesie.
Leaderboard (30-day)
Powered by