- Společnost Nvidia představila nový AI nástroj pro komplexní úpravu a vytváření hudby či zvukových efektů
- Novinka s názvem Fugatto údajně dokáže vytvářet zvuky, které jsme dosud nikdy neslyšeli – například mňoukající trumpetu
- Kromě toho umí upravovat lidský hlas a kompletně změnit melodii písně
Společnost Nvidia představila nový AI model, o němž tvrdí, že dokáže vytvářet zvuky, které jsme dosud nikdy neslyšeli – například mňoukající trumpetu. Nástroj, který se jmenuje Fugatto, údajně dokáže generovat hudbu, zvuky i mluvené slovo na základě textových či zvukových pokynů a dat, aniž by na nich byl předtím trénován.
Produced by Fugatto?
V přiloženém videu přímo od Nvidie se Fugatto stává hudebním producentem, který vytváří hudbu na základě nesourodých promptů jako „Vytvoř saxofonové vytí, štěkot a pak elektronickou hudbu se štěkotem psů“. Fuggato se nicméně neomezuje pouze na „komponování“ hudby, ale umožní vám vytvářet jedinečné zvukové efekty na základě popisu – například „hluboké, dunivé basové pulsy v kombinaci s přerušovaným, vysokofrekvenčním digitálním cvrlikáním, jako je zvuk probouzejícího se obřího inteligentního stroje“.
Novinka dokonce dokáže proměnit něčí hlas téměř k nepoznání – modifikovat jeho přízvuk nebo mu dát jiný tón, například naštvaný, či naopak klidný. Fugatto by si mělo poradit i s úpravou hudby. Umí totiž izolovat vokály, přidat hudební nástroje nebo kompletně změnit melodii výměnou klavíru za operního zpěváka.
Naprosto neslýchané, chlubí se Nvidia
Společně s oficiálním oznámením došlo také ke zveřejnění podrobného vědeckého článku, podle něhož se umělá inteligence učila z velkého množství datových sad včetně knihovny zvukových efektů od BBC. Datová sada podle výzkumníků čítala miliony zvukových nahrávek. V tuto chvíli nicméně není jasné, kdy – a zda vůbec – bude nástroj dostupný široké veřejnosti.
Na trhu již existuje několik dalších zvukových AI nástrojů, jmenovitě třeba od společností Stability AI, OpenAI, Google DeepMind, ElevenLabs či Adobe. Ani jeden z nich se ovšem nemůže pochlubit schopností vytvářet zcela nové a dosud neslyšené zvuky. Některé startupy se zaměřením na umělou inteligenci dokonce kvůli svým nástrojům pro tvorbu hudby čelí žalobám kvůli porušení autorských práv. Připomeňme také, že podle nedávných zjištění i samotná Nvidia trénovala své jazykové modely na titulcích z tisíců videí na YouTube.