- Společnost OpenAI není schopná jasně odpovědět a prokázat, na čem přesně trénuje svůj model Sora
- Google varuje, že to rozhodně nesmí být na jeho videích z YouTube, prý by tím OpenAI porušovala podmínky
- Sám Google ale přiznává, že na YouTube trénuje svůj model Gemini
V nedávném rozhovoru pro agenturu Bloomberg upozornil šéf YouTube Neal Mohan na fakt, že pokud by OpenAI využívala k tréninku svého nástroje pro generování videí Sora obsah z YouTube, bylo by to porušení podmínek a neměla by to dělat.
Podmínky především
Mohan zdůraznil, že jediné, co se dá z YouTube sesbírat, jsou názvy kanálů, názvy videí či náhledové obrázky k videím a tím to víceméně hasne. YouTube toto umožňuje například pro možnost vyhledávání videí jinými vyhledávači, jenže to je asi tak všechno, co s tím mohou ostatní dělat.
Například je přísně zakázáno videa stahovat, stahovat jejich části, nebo stahovat byť jen jejich titulky. Trénuje ale OpenAI svůj generativní model Sora i na videích z YouTube? Nikdo neví. Technická ředitelka OpenAI Mira Murati se konkrétním otázkám deníku The Wall Street Journal nedávno vyhýbala a nebyla na ně schopná odpovědět.
Obavy tvůrců
Mohanovy poznámky odrážejí rostoucí obavy tvůrců obsahu ohledně respektování a využívání jejich duševního vlastnictví v kontextu tréninku generativních modelů umělé inteligence. Šéf YouTube zdůraznil očekávání tvůrců, že jejich obsah nahraný na YouTube bude chráněn a nebude používán způsobem, který porušuje podmínky platformy. Sám přitom přiznal, že některá videa na YouTube může sám Google interně využívat k tréninku svého modelu Gemini.
Tento spor je součástí širšího příběhu technologických gigantů, kteří využívají obrovské množství online obsahu pro vývoj umělé inteligence, což je někdy v rozporu s právy a očekáváními tvůrců obsahu. Ostatně například The New York Times není jediný subjekt, který OpenAI (a Microsoft) kvůli tomu žaluje.
Sora společnosti OpenAI, která je schopna generovat vysoce realistická videa na základě textových pokynů, představuje významný skok v tvorbě obsahu na bázi umělé inteligence. Debata o původu jejích tréninkových dat pak jen zdůrazňuje zásadní etický rozměr vývoje AI: spoléhání se na existující obsah vytvořený lidmi bez jasného souhlasu nebo uznání původních tvůrců. Což nakonec neplatí jen a pouze pro generativní tvorbu videa – ví někdo zcela přesně, co vlastně všechno (a do jaké míry, kdy a jak) bylo použito pro trénink textových modelů v čele s ChatGPT? Na takovou otázku vám dnes nebude schopná odpovědět prakticky žádná technologická firma.
Lidská tvorba s otazníkem
Diskuse kolem Sory a podobných generativních technologií také vyvolává otázky o budoucnosti tvůrčí práce a úloze lidské kreativity v době, kdy může tvořit pomocí generativní umělé inteligence prakticky kdokoliv a prakticky cokoliv. Technologie umělé inteligence sice nabízejí ještě do nedávna nepředstavitelné možnosti, ale zároveň zpochybňují tradiční pojetí kreativity a hodnotu lidské kreativity, umění a tvorby obecně.
Vzhledem k tomu, že technologické společnosti nadále posouvají hranice možností umělé inteligence, zůstává spornou otázkou debata o využívání veřejně dostupného obsahu pro trénink umělé inteligence. Smutnou a nejpravděpodobnější realitou je nakonec ale nejspíš nevyhnutelný fakt, že než (a pokud vůbec) budou modely transparentní, než usedne prach z žalob a než se to všechno nějakým způsobem vyřeší, budeme tu mít technologie na takové úrovni, že už definitivně nepoznáme, co kdo vytvořil.