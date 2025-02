Nové evropské konsorcium si klade za cíl vyvinout open-source velké jazykové modely

Na iniciativu „OpenEuroLLM“ je vyhrazeno 52 milionů eur

Na projektu pracuje přes 20 předních evropských výzkumných institucí

Evropa se probudila a oficiálně zahájila iniciativa s názvem OpenEuroLLM. Jejím cílem je vyvinout evropskou alternativu k velkým jazykovým modelům (LLM), kterým v současnosti dominují technologičtí giganti ze Silicon Valley, nebo naopak firmy z Číny.

Výzkumné ambice

Ambiciózní projekt, podpořený Evropskou komisí a disponující rozpočtem 52 milionů eur a nemalými výpočetními zdroji, si klade za cíl vytvořit rodinu open-source, vícejazyčných LLM navržených tak, aby posílily digitální suverenitu Evropy a podpořily inovace po celém našem kontinentu.

Konsorcium OpenEuroLLM, které zahrnuje přes 20 předních evropských výzkumných institucí, společností a center vysoce výkonného počítání (HPC), vedou významné osobnosti v oboru, včetně Jana Hajiče, renomovaného počítačového lingvisty z Univerzity Karlovy v České republice, a Petera Sarlina, spoluzakladatele společnosti Silo AI, největší soukromé laboratoře AI v Evropě, kterou nedávno koupil americký výrobce čipů AMD.

Mezi dalšími známými účastníky jsou německá společnost Aleph Alpha, přední představitel v německém sektoru AI, finské CSC, které hostí jeden z nejvýkonnějších superpočítačů na světě, a francouzská společnost LightOn, první veřejně obchodovaná společnost v Evropě zabývající se generativní AI.

„Unikátní na této iniciativě je, že spojujeme mnoho předních evropských organizací zabývajících se AI do jednoho cíleného úsilí, namísto mnoha malých, roztříštěných projektů,“ uvedl Peter Sarlin pro The Next Web. „Tento koncentrovaný přístup Evropa potřebuje k vybudování otevřených evropských modelů AI, které nakonec umožní inovace ve velkém měřítku.“ Finanční podpora projektu spolu s výpočetními závazky, které mohou mít vyšší peněžní hodnotu než přidělený rozpočet, podtrhují serióznost a rozsah ambic Evropy v oblasti AI.

Víc modelů víc ví

Hlavním cílem projektu OpenEuroLLM je vybudovat řadu vysoce výkonných, vícejazyčných základních modelů velkých jazyků, které budou přístupné pro komerční, průmyslové a veřejné služby. Modely mají být plně open-source, včetně softwaru, dat a metod hodnocení, aby byla zajištěna transparentnost a podpora spolupráce. Iniciativa navíc slibuje, že modely budou obsahovat evropské hodnoty, s důrazem na demokracii, transparentnost, otevřenost a zapojení komunity, a zároveň zachovají jazykovou a kulturní rozmanitost. Modely mají také prý umožňovat jemného doladění či instrukčního doladění pro specifické potřeby průmyslu a veřejného sektoru.

Iniciativa OpenEuroLLM přichází v pro Evropu kritické době, protože rychlý pokrok v oblasti AI ze strany amerických a čínských technologických firem představuje potenciální hrozbu pro technologickou nezávislost kontinentu a časem nepochybně i ekonomickou konkurenceschopnost.

Vývojem vlastních LLM se Evropa snaží tahle rizika zmírnit, otázkou však je, jestli to není typické příliš málo, příliš pozdě. Nakonec půjde ale o něco pravděpodobně dost jiného, než konkurenci ChatGPT tak, jak ho známe. Sarlin totiž zdůraznil praktické využití projektu a uvedl: „Nejde o vytvoření univerzálního chatbota – jde o vybudování digitální a AI infrastruktury, která evropským společnostem umožní inovovat s AI.“ Představuje si budoucnost, ve které evropské podniky, od zdravotnictví po finance, mohou tyto modely využít k vývoji specializovaných řešení AI šitých na míru jejich specifickým potřebám a jazykům, ve kterých působí, a v konečném důsledku tuto technologii vlastnit a kontrolovat.

Dopady na průmysl a region

Vznik konsorcia OpenEuroLLM má významné důsledky pro různá odvětví v celé Evropě. Dostupnost open-source, vícejazyčných LLM přizpůsobených evropskému kontextu by mohla v některých odvětvích, jako je zdravotnictví, finance a veřejná správa, přiložit ruku k dílu.

Například poskytovatelé zdravotní péče by mohli vyvinout specializované asistenty AI pro zdravotnické pracovníky, od čehož si EU slibuje potenciální zlepšení přesnosti diagnostiky a péče o pacienty. Podobně by finanční instituce mohly vytvořit personalizované finanční služby, zlepšit zákaznickou zkušenost a efektivitu provozu. K zamyšlení tady ovšem je, proč by s tím některé instituce čekaly roky, když už to mohou dělat teď.

Iniciativa rovněž řeší rostoucí obavy z koncentrace vývoje AI v několika velkých technologických společnostech, primárně se sídlem v USA a Číně. Podporou kolaborativního, open-source přístupu si OpenEuroLLM klade za cíl demokratizovat vývoj AI tak, aby byl dostupnější pro podniky v celé Evropě. Jak a kdy toho chce ale přesně dosáhnout se teprve uvidí.

Budíček!

Jakkoliv je dobře, že Evropa začala alespoň „něco“ dělat, nabízí se zamyšlení, zda už není pozdě. Dalo by se říci, že EU se sotva probouzí ze spánku, zatímco vlak nejenže opustil stanici, ale už se řítí po kolejích zběsilou rychlostí. Realita je taková, že američtí technologičtí giganti vyvíjejí a nasazují sofistikované LLM už několik let, přičemž modely jako GPT-4 jsou již hluboce zakořeněny v globálním vývojářském ekosystému.

Evropští vývojáři, stejně jako jejich protějšky po celém světě, využívají tyto snadno dostupné, výkonné a stále cenově dostupnější americké modely k budování široké škály aplikací. Tyto modely přicházejí s rozsáhlou podporou, komplexní dokumentací a obrovskou komunitou uživatelů a vývojářů, kteří je neustále vylepšují. Nejde tak už jen o kdejaké nástroje, které můžete lehce vyměnit, ale o základní stavební kameny celé řady aplikací, workflow a knowhow.

Náskok amerických modelů není jen otázkou času; jde o celý ekosystém, který kolem nich vzkvétá. S každou další verzí jsou levnější, dostupnější a výkonnější. Ostatně něco takového dokázal před nedávnem i čínský DeepSeek, kterému se údajně podařil husarský kousek s vytvořením modelu snad srovnatelného s o1 od OpenAI, ovšem za výrazně menší cenu. Jak se k tomu čínští vývojáři dostali a zda to skutečně stálo jen jednotky milionů dolarů je pochopitelně věc druhá.

Paradoxně je to DeepSeek, který může dávat OpenEuroLLM šanci. Evropě se tak může podařit skrze už existující knowhow a opensource LLM jako je například Llama od Mety vytvořit schopný produkt. Jenže i tak bude EU vystavena těžkému boji. Nejde jen o budování technicky kvalitních modelů; jde o přesvědčení vývojářů, aby přešli z dobře zavedeného, neustále se vyvíjejícího ekosystému na nový, neprověřený.

Kdy přesně budou navíc k dispozici první modely? Podle některých zpráv údajně za více než rok. A s tím, jak rychle postupují zahraniční modely, se nabízí otázka, zda to bude stačit. Zvládne OpenEuroLLM držet krok například s aktuálním o3? Nebo s ChatGPT 4o? OpenAI sice nic konkrétního neřekli, nicméně dá se předpokládat, že letos tu budeme mít minimálně model o4 a ChatGPT 5. S další generací modelů pravděpodobně přijde i Google a Anthropic. Zvládne s budoucí generací modelů od lídrů trhu držet OpenEuroLLM krok? A pokud nějakým zázrakem ano, co bude vývojáře motivovat k přechodu?

Nakonec může být pravdou, že zatímco soukromý sektor v EU bude postaven na modelech od OpenAI či Googlu, projekty státních správ budou muset být ze zákona postavené na OpenEuroLLM? Třeba se pak budou moct firmy přihlásit do soutěží o veřejné zakázky pouze v případě, že budou využívat evropský, nikoliv americký model.