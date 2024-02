Nový AI systém Applu zpřístupňuje editaci obrázků pomocí „přirozeného jazyka“

Čeká nás zásadní přepracování iOS?

V praxi může najít MGIE mnohem širší uplatnění

Apple představil MGIE („MLLM-Guided Image Editing“), průlomový model umělé inteligence, který má inovativním způsobem upravovat obrázky podle pokynů v přirozeném jazyce. Inovace vznikla ve spolupráci s Kalifornskou univerzitou v Santa Barbaře a umožňuje úpravy obrázků na úrovni jednotlivých pixelů, včetně úprav ve stylu Photoshopu, optimalizace fotografií a úprav konkrétních oblastí fotek a obrázků.

Systém MGIE funguje tak, že generuje přesné pokyny na základě uživatelských vstupů, jako je například změna úrovně sytosti, a vytváří vizuální reprezentaci požadovaného výsledku, která slouží jako vodítko během procesu úprav.

Schopnosti MGIE zahrnují širokou škálu editačních funkcí. Může provádět jednoduché úpravy barev, složité manipulace s objekty, globální vylepšení fotografií a cílené úpravy konkrétních oblastí snímku.

AI může vyzkoušet každý

MGIE zatím na iPhonech nenajdete, ale hrát si s ním můžete sami. Na serveru GitHub je totiž přístup ke kódu, datům a předtrénovaným modelům spolu s ukázkovým zápisníkem pro nové uživatele. Kromě toho je na webu Hugging Face Spaces k dispozici online ukázka, která umožňuje trochu snadnější experimentování. Výsledky ale zatím nejsou úplně optimální.

MGIE je jednou z prvních výraznějších vlaštovek nadcházející předpokládané AI baráže Applu, který toho v oblasti generativní umělé inteligence, minimálně navenek a uživatelsky, moc nedělá. To se má ale změnit už v nadcházejícím iOS 18 a ostatně i sám Tim Cook naznačoval, že ještě letos od něj o AI něco uslyšíme.

Praktické použití

Jak přesně Apple integruje MGIE do iOS, se zatím samozřejmě neví, budeme si muset počkat na oficiální oznámení. Automaticky se nabízí uživatelsky jednoduché, ale prakticky náročné úpravy fotek, kdy by uživatelé pomocí jednoduchých (textových či hlasových) příkazů mohli provádět úpravy, na které by jinak potřebovali sofistikovanější nástroje.

Dále se ale nabízí třeba i využití pro tvorbu obsahu, tedy vlastní generování obrázků, avatarů, emoji nebo jednoduše různých vizuálních efektů nejen do komunikačních aplikací Applu, ale třeba i do marketingové komunikace či osobních projektů. Aplikace Canva a jí podobné nástroje by tak mohly mít další silnou konkurenci.

Zapomínat nesmíme ani na případné funkce přístupnosti, kdy by se dalo zpracování přirozeného jazyka pomocí MGIE využít k novým funkcím pro zrakově postižené uživatele. Nemluvě o Siri, která je dlouhodobě poněkud „pozadu“, a právě výrazně lepší porozumění přirozené řeči by jí jenom prospělo.

Celkově by mohla integrace MGIE, respektive práce s přirozenou řečí, přidat do ekosystému Applu tolik potřebný AI náboj, který by z iPhonu, iPadu a v neposlední řadě i Apple Watch najednou mohl udělat podstatně chytřejší a uživatelsky přívětivější zařízení.