- Gigant z Mountain View na nic nečekal a oficiálně představil AI Gemini
- To obohatí stávající AI jménem Bard a bude vážným konkurentem pro ChatGPT
- Gemini se postupně dostane také do chytrých telefonů, vyhledávání, reklamy či prohlížeče Chrome
- V Evropě i Velké Británii si na nový model počkáme, zatím zde dostupný nebude
Odvolávám, co jsem odvolal, slibuji, co jsem slíbil. Ještě včera to vypadalo, že umělá inteligence s názvem Gemini od Googlu to letos nestihne a dočkáme se jej až v příštím roce. Spekulace ale tentokrát byly mylné a gigant z Mountain View všem vytřel zrak, když oficiálně uvedl svého konkurenta pro ChatGPT na trh. Po odhalení modelu Gemini AI na konferenci I/O 2023 společnost Google v úterý oficiálně představila Gemini 1.0. Firma označuje Gemini za svůj dosud největší a nejschopnější model, který dokáže porozumět textu, obrázkům, zvuku, videu a kódu a kombinovat je.
Nejpokročilejší AI od Googlu
Model Gemini je k dispozici ve třech různých variantách: Ultra, Pro a Nano. Ultra je největší model, který zvládne velké a složité úlohy. Model Pro je takovou zlatou střední cestou a dokáže škálovat nejrůznější úlohy. Nano je nejvýkonnější model a je určen pro úlohy prováděné přímo na zařízení. Gemini si poradí s různými výzvami, ať už na datových centrech nebo na chytrých telefonech.

Generální ředitel společnosti Google Sundar Pichai a generální ředitel společnosti DeepMind Demis Hassabis vysvětlili, jak se Gemini liší od ostatních multimodálních modelů: „Gemini jsme navrhli tak, aby byl nativně multimodální a od začátku předtrénovaný na různé modality. Poté jsme jej vyladili pomocí dalších dat, abychom dále zdokonalili jeho efektivitu. Díky tomu Gemini od základu bezproblémově rozumí všem druhům vstupů a uvažuje o nich mnohem lépe než stávající multimodální modely – a jeho schopnosti jsou na špičkové úrovni téměř ve všech oblastech.“
Ředitelé se také neváhali podělit o data porovnávající Gemini s GPT-4, přičemž Gemini se často umisťovalo na předních místech. Ve 30 z 32 široce používaných akademických srovnávacích testů pro výzkum a vývoj LLM překonal Gemini Ultra výsledky GPT-4. Gemini Ultra je také prvním modelem, který porazil lidské experty v testu MMLU (masivní víceúlohové porozumění jazyku), a to s výsledkem 90 %.
V Evropě zatím máme smůlu
Od dnešního dne bude Bard používat vyladěnou verzi Gemini Pro pro pokročilejší funkce. Podle Googlu se jedná o největší vylepšení Barda od uvedení této konverzační umělé inteligence na trh. Google také přinese Gemini Nano do Pixelu 8 Pro, který bude pohánět funkce jako Summarize v aplikaci Recorder a Smart Reply v Gboard.
V budoucnu se Gemini objeví také ve vyhledávání, reklamách, Chromu a Duet AI. Vývojáři a firemní zákazníci budou mít 13. prosince přístup ke službě Gemini Pro pomocí rozhraní Gemini API v aplikaci Google AI Studio nebo Google Cloud Vertex AI. Vývojáři pro systém Android se mohou zaregistrovat do předběžného náhledu AICore a začít vytvářet s Gemini Nano.
Až doposud vše znělo skvěle, nicméně jak uvádí TheGuardian.com, drobnou vadou na kráse je fakt, že uživatelé ze zemí Evropské unie a Velké Británie si nový model zatím nevyzkouší. Google už sice kvůli zpřístupnění Gemini s příslušnými správními orgány komunikuje, ale jednání jsou teprve v začátcích. Nicméně některé části Gemini bude Google využívat i u nás, například ve svém vyhledávači.