- Generátor AI videí Veo je už k mání, chlubí se Full HD kvalitou a velkou realističností
- Veo je zatím k dispozici pouze v rámci testovacího preview, v Česku si na uvedení ještě počkáme
- Google tak trochu předběhl OpenAI – jejich Sora má vyjít ale ještě letos
Google „vydal“ svůj dlouho očekávaný generativní AI video model Veo. Uvozovky proto, že Veo nyní debutuje zatím pouze v rámci privátní testovací verze na platformě Vertex AI. Veo umožňuje generovat videa ve vysoké kvalitě 1080p na základě textových či obrazových zadání a má ambici zásadně změnit procesy tvorby obsahu pro firmy.
Videa jen pro někoho
První zmínka o Veo se objevila už v květnu 2023 a jeho uvedení předběhlo konkurenci v podobě modelu Sora od OpenAI, který tu zatím není, ale dorazit by měl ještě letos. A pokud bude Sora dostupná například všem předplatitelům ChatGPT Plus, de facto by tím OpenAI Google zase předběhla.
Každopádně teď je tady alespoň v nějaké formě Veo (byť pro Česko zatím k mání není). To je navrženo pro širokou škálu vizuálních a filmových stylů, přičemž generovaný obsah dosahuje opravdu působivě realistické úrovně. Ukázky modelu demonstrují schopnost zachovat konzistenci i v komplexních detailech, jako je třeba pohyb srsti na obojku psa.
Na druhou stranu, ne vše je dokonalé – v některých videích se objevují vizuální artefakty, například nerealistické světelné efekty. S podobnými problémy se bude pravděpodobně potýkat i Sora či jiné modely, ostatně ani generování prostých obrázků není dokonalé a videa jsou násobně složitější.
Google zdůrazňuje přísné zabezpečení proti zneužití, včetně ochrany před šířením škodlivého nebo autorsky chráněného obsahu. V modelu pak nechybí ani technologie SynthID od DeepMind pro digitální vodoznaky. Od toho si Google slibuje předcházení dezinformacím a zajištění správného uvedení zdroje. Co to ale časem udělá se šířením dezinformací, to ukáže až čas.
Konkurence s OpenAI
Google se snaží, seč jim síly stačí, ale navzdory všem snahám pořád ne a ne být lídrem. Gemini, jakkoliv povedený, pořád nedosahuje kvalit ChatGPT o1 a leckdy ani 4o. Teď by se Googlu líbilo být lídrem i v oblasti videa, ale jak už padlo výše, Veo je k mání zatím jen někde a pouze v rámci omezeného testovacího režimu.
Zamávat s tím může blížící se Sora nebo jiný model pro generování videa. Takový, který bude dostupný ideálně celosvětově a koncovým uživatelům.
Je jasné, že video bude po textu a obrázcích další AI frontou, na které se svede velká bitva všech velikánů. Videa, jakkoliv asi nepříliš užitečná pro běžné uživatele, mohou výrazně pomoci ve všemožných reklamách, marketingových kampaních, nebo alespoň jako doplněk na sociálních sítích.
Minimálně ze začátku si skrze Veo, Soru či jiný model ale zcela jistě nebudeme generovat hollywoodské filmy. A to ani co do délky, ani co do kvality.
Opatření a výhled do budoucna
Google do Veo začlenil robustní ochranu pro zajištění bezpečnosti a zodpovědného používání. Digitální vodoznaky, bezpečnostní filtry a přísná správa dat odpovídají etickým principům Googlu – je ovšem otázka, jestli Veo nenarazí na podobné bizarní problémy, se kterými se potýkal například model Imagen, skrze který umí Google generovat obrázky. Ten nejdřív generoval kontroverzní a nerealistické obrázky, jen aby pak vytváření lidí na nějakou dobu raději zakázal.