TOPlist

Nano Banana Pro: velký pokrok v renderování textu a fotorealistické konzistenci obrazu

Ukázka precizní tvorby Google Nano Banana Pro
  • Nový model postavený na architektuře Gemini 3 Pro přináší bezkonkurenční schopnost generování čitelného textu a přesných infografik
  • Pokročilé editační možnosti umožňují zachovat konzistenci postav a detailně upravovat osvětlení či kompozici scény
  • Technologie je nyní dostupná v aplikaci Gemini i firemních nástrojích a obsahuje ochranný vodoznak SynthID

Google je v posledních dnech na koni. Oznámením a rovnou i vydáním doposud nejlepšího LLM Gemini 3 to neskončilo. Krátce na to došlo i na uvedení jejich dosud nejpokročilejšího modelu pro generování a úpravu obrazu, Nano Banana Pro („Gemini 3 Pro Image“). Nový Nano Banana je postavený na architektuře aktuálního Gemini 3 Pro a podle prvních informací, reakcí i vlastního testování představuje dost velký technologický posun oproti předchozí verzi 2.5.

Inteligentní vizualizace a práce s textem

Nano Banana Pro se zaměřuje především na řešení dlouhodobých slabin generativní AI: bezchybnou integraci textu do obrazu, logickou vizualizaci dat a zachování vizuální konzistence při složitějších kompozicích.

Nejvýraznější inovací modelu Nano Banana Pro je jeho schopnost hlubšího „reasoningu“ neboli uvažování nad kontextem. Na rozdíl od starších modelů, které často chybovaly při tvorbě nápisů, dokáže NBP generovat čitelný a gramaticky správný text v několika jazycích přímo do obrazu. To otevírá nové možnosti pro tvorbu marketingových plakátů, log nebo lokalizaci obsahu pro zahraniční trhy.

Díky propojení s reálnými znalostmi světa skrze Gemini 3 Pro a vyhledáváním Googlu model vyniká taky v tvorbě infografik a diagramů. Díky tomu tak můžete generovat vizuální návody (například recepty krok za krokem) nebo vizualizovat data v reálném čase, jako jsou meteorologické mapy, přičemž systém dbá na faktickou přesnost a logickou strukturu zobrazených informací.

Studiová kontrola a konzistence

Pro profesionální tvůrce a marketéry přináší Nano Banana Pro zásadní vylepšení v oblasti kontroly nad výstupem. Model dokáže zpracovat až 14 vstupních obrázků najednou a sloučit je do jedné kompozice, přičemž udrží konzistentní podobu až pěti různých postav. To řeší častý problém AI, kdy se vzhled postav v sérii obrázků mění.

Nově jsou k dispozici také pokročilé „studiové“ nástroje. Díky nim můžete měnit osvětlení scény (například změna dne v noc), upravovat hloubku ostrosti, měnit úhly kamery nebo provádět lokální úpravy bez narušení zbytku obrazu. Všechny výstupy jsou generovány ve vysokém rozlišení (až 4K) s možností volby poměru stran pro různé platformy.

Dostupnost a bezpečnostní opatření

Model je od dnešního dne dostupný pro spotřebitele v aplikaci Gemini (v rámci tarifů Google AI Plus, Pro a Ultra). Pro firemní zákazníky se technologie integruje do služby Google Ads a nástrojů Workspace, zatímco vývojáři k ní získají přístup skrze Vertex AI a Google AI Studio.

V rámci boje proti dezinformacím jsou všechny obrázky generované tímto modelem opatřeny neviditelným digitálním vodoznakem SynthID, který umožňuje ověřit jejich původ. Uživatelé bezplatných a Pro verzí uvidí na obrázcích také viditelný vodoznak, který je u nejvyšší verze předplatného (Ultra) odstraněn pro profesionální použití.

Autor článku Adam Homola
Adam Homola
Nové technologie mě fascinují už od útlého věku. K dlouhodobému zájmu o hry a herní průmysl se mi postupem času přirozeně přidal i hardware, software, internetové služby a od roku 2022 i umělá inteligence.

Kapitoly článku