- Roboti Gem zastanou specifické funkce, které jim jako uživatel zadáte
- Google tím reaguje na GPTs od OpenAI, které mají stejnou funkcionalitu
- Nová verze generátoru obrázků je srovnatelná s Midjourney a brzy zvládne i lidi
Google aktualizuje AI jako o život a vylepšuje tak svoji AI Gemini, jak to jen jde. Nově si můžete v rámci placeného Gemini Advanced vytvářet vlastní Gemy, tedy specializované „AI experty“ na specifická témata či tematické okruhy. Google tím tak v podstatě reaguje na GPTs od konkurenčního ChatGPT, které nabízí podobnou funkcionalitu už několik měsíců.
Gems
Gems jsou už v Gemini Advanced dostupné a umožňují vytvářet personalizované AI experty, které lze přizpůsobit konkrétním potřebám uživatele. V praxi fungují velice podobně jako zmíněné GPTs a stejně tak si je můžete i sami vytvářet. Jednoduše svůj Gem nějak pojmenujete a jednoduchou lidskou řečí popíšete přesně to, co chcete, aby dělal. Stejně jako u promptingu platí, že čím konkrétnější, jasnější a přesnější budete, tím lepší bude výsledek.
Google už předem připravil několik svých oficiálních Gemů, konkrétně Brainstormovacího pomocníka, Kariérního průvodce, Parťáka v programování, Vzdělávacího kouče a Jazykového redaktora. Tito Gemové (Google o nich občas mluví také jako o „robotech Gem“) vám tak pomohou s vymýšlením nápadů, poskytnou kariérní tipy a triky, pomohou s programováním, se vzděláváním a navrch vám ještě mohou upravit text.
I v češtině, jen na webu
Gemy jsou v současné době k dispozici jen a pouze v desktopové verzi Gemini. Na mobilu dokonce nejde ani otevřít už z desktopu rozjetou konverzaci s Gemem, a to ani ke čtení, natož abyste na mobilu pokračovali v konverzaci. Při otevření Gemu v mobilní aplikaci uvidíte pouze hlášku, že Gemy se do aplikace dostanou později a že máte pokračovat přes web.
Poněkud zvláštní pak samozřejmě je, že když si otevřete Gemini na telefonu v prohlížeči, máte tam kompletní funkcionalitu, včetně Gemů. Se svým Gemem se tak můžete bavit i na mobilu, jen to zkrátka musíte dělat těžkopádně přes mobilní prohlížeč a nikoliv skrze oficiální aplikaci.
Obrázky skoro jako z Midjourney
Kromě nových Gemů rozšiřuje Google své možnosti generování obrázků skrze nový Imagen 3. Tento nejnovější model je použit ve všech verzích Gemini, tedy i v té bezplatné, a to dokonce i v češtině. Mně osobně zatím Gemini stále tvrdí, že obrázky generovat neumí, ale nejspíš bude nasazení do ostrého provozu jen otázkou dnů. Imagen 3 vyniká schopností vytvářet fotorealistické obrázky, včetně krajin, olejomaleb a všemožných specifických stylů. Kvalitou přitom, zdá se, dalece převyšuje Dalle 3 od OpenAI a v některých případech může být srovnatelný i s Midjourney.

Imagen 3 je také vybaven vestavěnými ochrannými prvky, které zajišťují, že generovaný obsah dodržuje zásady designu produktů Google. Model se zejména vyhýbá generování fotorealistických obrázků identifikovatelných osob, nezletilých nebo nevhodného obsahu. U modelu Imagen 3 se nadále používá nástroj SynthID od Googlu pro vytváření vodoznaků, který poskytuje vrstvu zabezpečení a autenticity obrázků generovaných umělou inteligencí.
Google navíc zavádí verzi předběžného přístupu ke schopnosti generovat obrázky osob, která bude zpočátku k dispozici uživatelům Gemini Advanced, Business a Enterprise. Tato funkce, která se postupně rozjíždí pouze v angličtině, se do AI systémů Googlu pomalu vrací po předchozí kontroverzi, kdy byla schopná generovat například nacistické vojáky černé pleti a podobné, stručně řečeno „historické nepřesnosti“.