Na YouTube dochází k masivnímu kopírování videí pomocí umělé inteligence

Jako alespoň částečné řešení se nabízí vložení titulků v málo známém formátu .ASS

Ani to ale nelze brát jako univerzální řešení, vedení YouTube zatím o problému mlčí

Obsah generovaný umělou inteligencí celkem rychle plevelí internet. Nejde jen o phishingové podvody napodobující známé značky, ale třeba i AI generované články a videa na YouTube. Pokud jste tvůrcem na této platformě, možná i vaše videa teď zrovna „chroustá“ umělá inteligence a vy o tom možná ani nevíte. A aby toho nebylo málo, způsobů, jak s tím bojovat, není zrovna moc.

Krádeže videí na YouTube

Zhruba před dvěma lety se v kuloárech platformy YouTube rozhořela diskuze o tom, jak anonymní tvůrci pomocí umělé inteligence kradou obsah jiným tvůrcům. Nejčastěji se jednalo o videa tzv. speedrunů, tedy extrémně rychlých průchodů celou videohrou, bez jediné smrti, opakování úkolů a podobně. Opakovaně se s tímto jevem setkal například americký youtuber Smallant, který se věnuje rychlým průchodům hrám z univerza Mario.

Jak ke krádežím dochází, vysvětluje youtuber Abyssoft, kterému bylo také několik videí odcizeno. Anonymní tvůrci využijí AI pro extrakci textových přepisů zvukové stopy přímo ze souboru videa, okopírují i název, popisek nebo třeba náhledový obrázek. A právě v textových souborech uvnitř videa, o kterých divák ani neví, se skrývá úspěšná metoda, jak toto AI kopírování zastavit.

Zastaví AI speciální formát .ASS?

Youtuberka F4mi přišla na způsob, jak lze speciálním formátem titulků .ASS (Advanced SubStation Alpha) zmást umělou inteligenci při případné extrakci informací přímo ze souboru videa. Textový soubor s tímto formátem, který běžně slouží k pokročilému formátování titulek a textu ve videu, lze naplnit obecnými informacemi o politice, umění, či čemkoliv, co s videem nemá nic společného. AI pak vše vyexportuje, ale nedokáže z toho složit potřebné informace ke zkopírování celého videa.

Co je .ASS? Formát .ASS (Advanced SubStation Alpha) je pokročilý formát titulků, který nabízí rozsáhlé možnosti stylizace a formátování textu ve videích. Kromě běžného zobrazení dialogů umožňuje .ASS vytvářet komplexní vizuální efekty, animace a přesné umístění textu na obrazovce. Tvůrci mohou využít sofistikované funkce formátu k vytvoření titulků, které jsou čitelné pro lidské diváky, ale matoucí pro AI systémy snažící se extrahovat text. Tímto způsobem lze významně ztížit automatizované kopírování a přeformulování obsahu videí, což poskytuje určitou míru ochrany proti krádežím intelektuálního vlastnictví v digitálním prostředí.

F4mi ale zároveň dodává, že nejpokročilejší AI modely, jako třeba OpenAI o1, sem tam umí vyfiltrovat tyto nadbytečné informace. Jejich úspěšnost je však výrazně nižší než u běžných, nijak neupravených videí. Problém pro tvůrce je v tom, že YouTube neumožňuje nativně nahrát titulky ve formátu .ASS, nýbrž ve vlastním formátu .YTT. Lze to obejít vytvořením skriptu v jazyku Python, jako to udělala právě ona, ale to je pro „běžné smrtelníky“ z řad tvůrců na YouTube naprosto irelevantní, protože nemusí umět programovat.

YouTube bude muset převzít iniciativu

Ani zdaleka tak nejde o ultimátní řešení. Proti samotným youtuberům, kteří se s kopírováním videí setkali, jde i fakt, že jazykové modely a AI nástroje se neustále vyvíjí. V září 2022 například OpenAI představila nástroj Whisper, trénovaný na 680 tisíc hodinách mluveného slova, který umí s velkou přesností převádět hlas na text. S využitím takového nástroje může zloděj videí zcela ignorovat textové soubory v jakémkoliv formátu a rovnou převzít celé video.

Řešení tohoto neblahého jevu tak bude pravděpodobně na vedení platformy YouTube, případně i dalších služeb, kde k podobným krádežím videí dochází. Vzhledem k obrovskému počtu videí si však lze jen těžko představit, jaké kontrolní mechanismy by YouTube v praxi mohl zavést, aby tomu předcházel.