- Vydavatelům encyklopedií Britannica a Merriam-Webster se nelibí praktiky ChatGPT
- Podle jejich žaloby využívala AI nelegálně jejich duševní vlastnictví
- Tím přímo ohrožuje obchodní model, na kterém encyklopedie staví
AI je jen tak dobrá, jak dobrá jsou data, kterými disponuje. Toho jsou si jejich tvůrci vědomi, nicméně dostat se k těm opravdu kvalitním datům není zrovna dvakrát jednoduché a pro začínající firmu ani zrovna levné. Není proto divu, že se řada firem uchýlila do šedé zóny, kdy využívala data pro vylepšení své umělé inteligence bez svolení držitelů práv. I když po vlně kontroverze od této praxe většina ustoupila, OpenAI se svým ChatGPT nicméně podle všeho stále tuto praktiku využívají, přičemž nyní se dostali do křížku s giganty v oblasti encyklopedií.
Vykrádání dat v podání ChatGPT
Encyklopedie Britannica a Merriam-Webster podaly u amerického okresního soudu pro jižní okres New Yorku žalobu týkající se porušení autorských práv a ochranných známek proti společnosti OpenAI. V žalobě tvrdí, že AI ChatGPT byla vycvičena na jejich autorsky chráněném obsahu a nadále jej bez povolení reprodukuje, čímž oběma vydavatelům způsobuje značnou škodu. Žaloba obviňuje OpenAI z toho, že jako vstupní data pro trénování svých jazykových modelů umělé inteligence použila téměř 100 tisíc online článků z encyklopedie Britannica. Jak se v žalobě uvádí, skutečný rozsah tohoto kopírování zná pouze OpenAI.
„ChatGPT poskytuje na dotazy uživatelů textové odpovědi, které často obsahují doslovné nebo téměř doslovné reprodukce, shrnutí či zkrácené verze původního obsahu, včetně děl chráněných autorskými právy žalobců,“ stojí v žalobě. Britannica tvrdí, že OpenAI porušila jejich práva v několika rovinách. Například tím, že z jejích webových stránek získávala data pro vytvoření trénovacích vstupů, tím, že tento obsah vkládala do svých modelů během trénování, a následně tím, že generovala výstupy, které reprodukují nebo podrobně shrnují originály.
Základní obchodní argument vychází z logiky, která byla použita v rámci širší vlny soudních sporů vydavatelů proti firmám zabývajícím se umělou inteligencí. Současná obchodní činnost Britannicy je převážně digitální a opírá se o příjmy z předplatného a reklamy, které závisí na návštěvnosti webových stránek. Když ChatGPT odpoví na otázku uživatele, například ohledně příčin Francouzské revoluce nebo vlastností chemického prvku, a čerpá přitom z článků encyklopedie Britannica, mají tito uživatelé méně důvodů navštívit webové stránky Britannicy přímo.
