TOPlist

Film za pár sekund? Nová AI od tvůrců ChatGPT generuje působivá videa

Mamuti vygenerovaní pomocí umělé inteligence
  • Nový jazykový model Sora od OpenAI umí vytvářet videa na přání
  • Zvládne generovat velice působivé záběry s délkou až 60 sekund
  • Zatím není určený široké veřejnosti, ale pouze hrstce akademiků

Loňský rok byl nepochybně rokem generativní umělé inteligence. Široké veřejnosti se dostaly do rukou nástroje, které dokáží nevídané věci – upravovat či vytvářet nové texty, generovat obrázky nebo vkládat lidem do úst slova, která nikdy neřekli. Závody pokročilých jazykových modelů neberou konce, přičemž ten nejnovější od OpenAI doslova bere dech. V článku si můžete prohlédnout celou řadu ukázek, se kterými se tvůrci pochlubili.

Video vygenerované umělou inteligencí

Za poslední rok se podařilo umělou inteligenci naučit vytvářet věrohodně vypadající obrázky, v nichž mnohdy nerozeznáte realitu od fikce – koneckonců můžete sami sebe prověřit v našem nedávném kvízu. Společnost OpenAI tento týden posunula hranice ještě o notný kus dále, její nový jazykový model Sora (v japonštině „nebe“) totiž neumí generovat pouze statické obrázky, ale rovnou celá videa.

Sora podle OpenAI umí vytvářet složité scény, jejichž součástí může být řada postav a předmětů. Sora dokáže porozumět i velmi podrobnému zadání, a protože ví, jak věcí existují v reálném světě, je schopná generovat komplexní scény. OpenAI jako ukázku zveřejnilo několik působivých videí vygenerovaných v rozlišení Full HD.

Zasněžené Tokio plné ruchu – kamera se pohybuje rušnou ulicí a sleduje několik lidí, jak si užívají zasněžené počasí a nakupují v okolních stáncích. Vzduchem létají sněhové vločky a okvětní lístky sakury.

Filmový trailer znázorňující dobrodružství třicetiletého kosmonauta v červené pletené motocyklové helmě v solné poušti pod modrou oblohou natočený 35mm filmem s živými barvami a korálový útes vytvořený z papíru plný barevných ryb a mořských živočichů.

 

Běh mamutů zabraný z nízké výšky znázorňující lehce se vlnící srst ve větru a zasněžené stromy a hory v pozadí.

Mimochodem, zcela identický prompt, který použili tvůrci k vytvoření videa s mamuty, jsme zadali do Midjourney a nechali si podle něj vytvořit náhledový obrázek k tomuto článku.

Na veřejnost se Sora dostane později

Sora není úplně prvním jazykovým modelem, který dokáže vytvářet z textových příkazů videa, je však ale nejdál – neskládá totiž dohromady snímek po snímku, ale tvoří rovnou celé až 60sekundové video najednou. Díky tomu zůstávají veškeré objekty ve videu stejné, i když se třeba na krátkou dobu vytratí ze záběru.

Přestože videa působí na první pohled ohromně, při bližším prozkoumání je z nich patrné, že nebyly natočené v reálném světě. OpenAI také varuje, že Sora může mít problém s porozuměním příčiny a následku – například může vygenerovat video člověka, jak jí sušenku, na ní ale nemusí být vůbec viditelné stopy po kousnutí. To však v tuto chvíli není podstatné, koneckonců první vygenerované obrázky umělou inteligencí rovněž nevypadaly věrohodně.

Tip: další klipy vygenerované pomocí umělé inteligence si můžete prohlédnout přímo na stránkách projektu

Sora navíc není v tuto chvíli určena do rukou veřejnosti, zpřístupněna bude nejprve malé skupině akademiků a výzkumníků, jejichž úkolem bude posoudit, do jaké míry bude tento nástroj zneužitelný.

Autor článku Jakub Karásek
Jakub Karásek
Příznivec mobilních technologií, konvertibilních zařízení a bezdrátového nabíjení, fanoušek tvrdé hudby a milovník rychlé jízdy v motokárách, na kole a na lyžích.

Kapitoly článku