- Google se v generování obrázků posouvá o obrovský kus dopředu
- Imagen 3 je zatím ale dostupný pouze pro americké uživatele
- Eventuálně by měl pohánět i tvorbu obrázků v rámci chatbota Gemini
Google rozšiřuje generátor obrázků Imagen už na třetí verzi a posouvá se tak zase o kus dál. Pro Google to znamená velký pokrok v oblasti generování obrázků pomocí umělé inteligence a firma jej označuje za svůj dosud nejkvalitnější nástroj. Imagen 3 prý nabízí ve srovnání se svými předchůdci lepší detaily, bohatší osvětlení a menší množství artefaktů.
Nová verze jen pro Ameriku
Nová verze, která je k dispozici v USA prostřednictvím platformy Google AI Test Kitchen a Vertex AI, přichází několik měsíců poté, co byl nástroj poprvé představen na květnové konferenci I/O. První uživatelé, zejména ti na Redditu, již začali s nástrojem Imagen 3 experimentovat a testují tak jeho možnosti i omezení.
Imagen 3 funguje podobně jako jiné generátory obrázků s umělou inteligencí a jednoduše tak transformuje textová zadání do více či méně detailních obrázků. Podobně jako třeba Dalle umí upravovat i pouze vybrané části obrázku, a tak můžete ladit třeba jen pozadí, nebo jednoduše jakýkoliv prvek. Na ukázky vygenerovaných obrázků se můžete podívat přímo na oficiálním webu.
Příčetné generování
Na rozdíl od aktuálního modelu Grok 2 byl Google trochu více při smyslech a do Imagen 3 implementoval několik obsahových omezení, která vám zabrání ve vytváření obrázků s veřejnými osobnostmi, politiky, zbraněmi nebo postavami které jsou chráněné autorskými právy. Přesto se některým uživatelům podařilo bezpečnostní zábrany obejít a vytvořit tak obrázky s postavami, které připomínají známé osobnosti či loga firem.
Zásady moderování obsahu tak vyvolaly předpokládané smíšené reakce. Zatímco někteří uživatelé oceňují lepší kvalitu a funkčnost, jiní jsou z přísných filtrů obsahu frustrovaní. Komentáře na Redditu ukazují na rostoucí nespokojenost s tím, co mnozí vnímají jako příliš restriktivní cenzuru, zejména když jsou blokovány zdánlivě neškodné podněty.
Integrace i rozšíření jsou jen otázkou času
Je ale nicméně jasné, že Google bude tentokrát s nástrojem na generování obrázků opatrnější. Je to teprve jen pár měsíců, co měla firma mediální a medializovaný problém právě s vytvářením obrázků, kdy šlo v rámci Gemini vytvořit obrázky například černých nacistů.
Pro podobné a jiné kontroverzní obrázky tak budete muset sáhnout například po zmíněném generátoru Grok 2, který se s tím nepáře, a síť X je tak aktuálně plná naprosto neuvěřitelných obrázků. U Googlu teď musíme logicky očekávat mnohem opatrnější přístup. A na rozdíl od xAI, pod kterou Grok 2 spadá, můžeme u Imagen 3 očekávat i nevyhnutelnou integraci do celého ekosystému Googlu. Stejně jako, doufejme, i brzkou expanzi do dalších zemí mimo USA, včetně Česka. U nás ostatně Gemini (Advanced) funguje a funguje dobře, jenže obrázky si v něm bohužel nevytvoříte.