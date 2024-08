Malé jazykové modely se dostávají ke slovu nejen v chatbotech

Nvidia představila svůj vlastní malý jazykový model

Ten se začne rozšiřovat nejen ve hrách, ale časem i do zákaznického servisu

Nvidia oznámila uvedení svého prvního malého jazykového modelu (SLM) Nemotron-4 4B Instruct, který představuje významný krok vpřed ve vývoji digitálních lidí využívajících generativní umělou inteligenci. Nový model je součástí sady technologií Nvidia ACE, která se soustředí na realističtější a obecně vzato lepší digitální postavy nejen ve hrách.

Malý, ale výkonný

Nemotron-4 4B Instruct SLM je optimalizovaný právě pro to, aby běžel lokálně na vašem vlastním zařízení s využitím co nejmenšího množství paměti. Díky tomu mohou vývojáři teoreticky implementovat mnohem lepší postavy do her, které pak díky tomu mohou běžet na počítačích s technologiemi Nvidia RTX o dost lépe. Sofistikované interakce s postavami poháněnými umělou inteligencí mohou být totiž integrovány přímo do systémů běžících na lokálním zařízení uživatele s menším dopadem na výkon.

Velké jazykové modely (LLM) jsou robustnější a umějí toho víc, jenže jejich obrovské možnosti mají velkou cenu – jsou extrémně náročné na výkon a na vlastním počítači si je prostě a jednoduše jen tak nespustíte. Naproti tomu modely SLM, jako je Nemotron-4 4B, jsou zjednodušené pro konkrétní případy použití a poskytují tak rychlejší a relevantnější odpovědi. Podobným směrem se ostatně vydávají prakticky všichni provozovatelé velkých jazykových modelů, kdy začínají pracovat, nabízet a vydávat i jejich odlehčené verze.

Titulní model od Nvidie byl vydestilován z většího modelu Nemotron-4 15B LLM, čímž se zmenšila jeho velikost a složitost při zachování vysoké úrovně přesnosti. Proces destilace a kvantizace ořezává nepotřebné výstupy a snižuje přesnost modelových vah, což ve výsledku vede ke štíhlejšímu a rychlejšímu modelu, který může efektivně fungovat na široké škále zařízení.

Avatar Creation Engine pomůže s vytvářením realistických lidí

Nvidia ACE (Avatar Creation Engine) je modulární platforma umělé inteligence, která vývojářům umožňuje vytvářet realistické digitální lidi schopné interakce v reálném čase. ACE obsahuje různé modely AI pro převod řeči na text, zpracování jazyka, převod textu na řeč a animaci obličeje. Každý prvek lze použít prostřednictvím cloudových služeb nebo spustit lokálně na počítačích a pracovních stanicích RTX AI, což nabízí flexibilitu v závislosti na požadavcích aplikace či hry.

Platforma pak také integruje technologii Nvidia Riva pro rozpoznávání řeči, díky čemuž zvládá přesný přepis a překlad mluvené řeči do textu, který pak mohou zpracovávat velké jazykové modely, jako je třeba právě Nemotron-4 4B. Takový přepis se pak totiž přenáší do modelů, které generují příslušné odpovědi, které se pak převádějí zpět do řeči. Součástí systému je také technologie Nvidia Audio2Face (A2F), která synchronizuje výrazy obličeje s mluveným dialogem a vytváří tak digitální postavy, které mohou realisticky vyjadřovat řadu emocí.

Rozšíření aplikací mimo hry

Ačkoli se technologie Nvidia ACE a SLM zpočátku zaměřují na vylepšení her a nějakou dobu je uvidíme nejspíš jen právě ve hrách, jejich potenciální využití sahá o kus dál. Na nedávné konferenci SIGGRAPH předvedla Nvidia „Jamese“, interaktivního digitálního člověka určeného pro zákaznický servis.

A je to právě oblast zákaznického servisu, kterou technologie generativní umělé inteligence ruku v ruce s velkými jazykovými modely ovlivní velice brzy, respektive už asi ovlivňovat začínají. Očekává se totiž, že tito „digitální lidé“ budou další evolucí chatbotů, se kterými se vídáme na leckterých webech, kde se nám snaží (byť často marně) poradit.

Je tak otázkou, zda digitální lidi poháněné AI nástroji, třeba právě od Nvidie, uvidíme nejdřív v širším měřítku ve hrách, nebo v zákaznickém servisu. Skoro jisté ale je, že dříve či později budou v obou disciplínách digitální lidé téměř všudypřítomní.