Mňoukající trumpeta? Nový AI nástroj od Nvidie umí vytvářet zvuky, které jste nikdy neslyšeli

kočka vytváří zvukové efekty v nástroji Fugatto

Společnost Nvidia představila nový AI nástroj pro komplexní úpravu a vytváření hudby či zvukových efektů
Novinka s názvem Fugatto údajně dokáže vytvářet zvuky, které jsme dosud nikdy neslyšeli – například mňoukající trumpetu
Kromě toho umí upravovat lidský hlas a kompletně změnit melodii písně

Společnost Nvidia představila nový AI model, o němž tvrdí, že dokáže vytvářet zvuky, které jsme dosud nikdy neslyšeli – například mňoukající trumpetu. Nástroj, který se jmenuje Fugatto, údajně dokáže generovat hudbu, zvuky i mluvené slovo na základě textových či zvukových pokynů a dat, aniž by na nich byl předtím trénován.

Produced by Fugatto?

V přiloženém videu přímo od Nvidie se Fugatto stává hudebním producentem, který vytváří hudbu na základě nesourodých promptů jako „Vytvoř saxofonové vytí, štěkot a pak elektronickou hudbu se štěkotem psů“. Fuggato se nicméně neomezuje pouze na „komponování“ hudby, ale umožní vám vytvářet jedinečné zvukové efekty na základě popisu – například „hluboké, dunivé basové pulsy v kombinaci s přerušovaným, vysokofrekvenčním digitálním cvrlikáním, jako je zvuk probouzejícího se obřího inteligentního stroje“.

Novinka dokonce dokáže proměnit něčí hlas téměř k nepoznání – modifikovat jeho přízvuk nebo mu dát jiný tón, například naštvaný, či naopak klidný. Fugatto by si mělo poradit i s úpravou hudby. Umí totiž izolovat vokály, přidat hudební nástroje nebo kompletně změnit melodii výměnou klavíru za operního zpěváka.

Naprosto neslýchané, chlubí se Nvidia

Společně s oficiálním oznámením došlo také ke zveřejnění podrobného vědeckého článku, podle něhož se umělá inteligence učila z velkého množství datových sad včetně knihovny zvukových efektů od BBC. Datová sada podle výzkumníků čítala miliony zvukových nahrávek. V tuto chvíli nicméně není jasné, kdy – a zda vůbec – bude nástroj dostupný široké veřejnosti.

Umělá inteligence, smartphone (ilustrační obrázek)

Nepřehlédněte

Vážná konkurence pro OpenAI? Amazon sype další miliardy do nadějného startupu

Na trhu již existuje několik dalších zvukových AI nástrojů, jmenovitě třeba od společností Stability AI, OpenAI, Google DeepMind, ElevenLabs či Adobe. Ani jeden z nich se ovšem nemůže pochlubit schopností vytvářet zcela nové a dosud neslyšené zvuky. Některé startupy se zaměřením na umělou inteligenci dokonce kvůli svým nástrojům pro tvorbu hudby čelí žalobám kvůli porušení autorských práv. Připomeňme také, že podle nedávných zjištění i samotná Nvidia trénovala své jazykové modely na titulcích z tisíců videí na YouTube.

Vstoupit do diskuze

Zdroj článku

Autor článku

Marek Bartík

Redaktor serveru SMARTmania.cz a brněnský student. Vedle toho velký fanoušek videoher, jehož nepřestává udivovat jejich překotný vývoj. Svět kolem nás plyne takovou rychlostí, že se za ním mnohdy nestačíme otáčet, čímž se pro nás stává nepostižitelným.