Google vrací úder a vytahuje z rukávu nový působivý AI generátor obrázků

Adam Homola 17. 8. 2024 10:00

Google se v generování obrázků posouvá o obrovský kus dopředu
Imagen 3 je zatím ale dostupný pouze pro americké uživatele
Eventuálně by měl pohánět i tvorbu obrázků v rámci chatbota Gemini

Google rozšiřuje generátor obrázků Imagen už na třetí verzi a posouvá se tak zase o kus dál. Pro Google to znamená velký pokrok v oblasti generování obrázků pomocí umělé inteligence a firma jej označuje za svůj dosud nejkvalitnější nástroj. Imagen 3 prý nabízí ve srovnání se svými předchůdci lepší detaily, bohatší osvětlení a menší množství artefaktů.

Nová verze jen pro Ameriku

Nová verze, která je k dispozici v USA prostřednictvím platformy Google AI Test Kitchen a Vertex AI, přichází několik měsíců poté, co byl nástroj poprvé představen na květnové konferenci I/O. První uživatelé, zejména ti na Redditu, již začali s nástrojem Imagen 3 experimentovat a testují tak jeho možnosti i omezení.

Imagen 3 funguje podobně jako jiné generátory obrázků s umělou inteligencí a jednoduše tak transformuje textová zadání do více či méně detailních obrázků. Podobně jako třeba Dalle umí upravovat i pouze vybrané části obrázku, a tak můžete ladit třeba jen pozadí, nebo jednoduše jakýkoliv prvek. Na ukázky vygenerovaných obrázků se můžete podívat přímo na oficiálním webu.

Příčetné generování

Na rozdíl od aktuálního modelu Grok 2 byl Google trochu více při smyslech a do Imagen 3 implementoval několik obsahových omezení, která vám zabrání ve vytváření obrázků s veřejnými osobnostmi, politiky, zbraněmi nebo postavami které jsou chráněné autorskými právy. Přesto se některým uživatelům podařilo bezpečnostní zábrany obejít a vytvořit tak obrázky s postavami, které připomínají známé osobnosti či loga firem.

Zásady moderování obsahu tak vyvolaly předpokládané smíšené reakce. Zatímco někteří uživatelé oceňují lepší kvalitu a funkčnost, jiní jsou z přísných filtrů obsahu frustrovaní. Komentáře na Redditu ukazují na rostoucí nespokojenost s tím, co mnozí vnímají jako příliš restriktivní cenzuru, zejména když jsou blokovány zdánlivě neškodné podněty.

Integrace i rozšíření jsou jen otázkou času

Je ale nicméně jasné, že Google bude tentokrát s nástrojem na generování obrázků opatrnější. Je to teprve jen pár měsíců, co měla firma mediální a medializovaný problém právě s vytvářením obrázků, kdy šlo v rámci Gemini vytvořit obrázky například černých nacistů.

Pro podobné a jiné kontroverzní obrázky tak budete muset sáhnout například po zmíněném generátoru Grok 2, který se s tím nepáře, a síť X je tak aktuálně plná naprosto neuvěřitelných obrázků. U Googlu teď musíme logicky očekávat mnohem opatrnější přístup. A na rozdíl od xAI, pod kterou Grok 2 spadá, můžeme u Imagen 3 očekávat i nevyhnutelnou integraci do celého ekosystému Googlu. Stejně jako, doufejme, i brzkou expanzi do dalších zemí mimo USA, včetně Česka. U nás ostatně Gemini (Advanced) funguje a funguje dobře, jenže obrázky si v něm bohužel nevytvoříte.

Vstoupit do diskuze (9)

Zdroj článku

Autor článku

Adam Homola

Nové technologie mě fascinují už od útlého věku. K dlouhodobému zájmu o hry a herní průmysl se mi postupem času přirozeně přidal i hardware, software, internetové služby a od roku 2022 i umělá inteligence.