Ez már nem az a „mozgóképes szövegértelmezés”, amit eddig ismertünk. A Google DeepMind új modellje teljes jeleneteket rak össze – párbeszéddel, háttérzajjal, mozis kameramozgással.
És ami durva: nem csak a képeket érti, hanem a sztori ívét is.
(A Gemini Ultra és Flow felületeken lehet kipróbálni, sajnos egyelőre csak az USA-ban.)