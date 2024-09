OpenAI chtějí údajně spustit pokročilý hlasový režim ještě během září

Původní oficiální informace mluvily o spuštění během podzimu

Konkurence v podobě Gemini Live nedávno přiostřila, ale nové hlasy ChatGPT by měly laťku zase posunout

Podzim začíná už 22. září a společně s ním se máme konečně dočkat i pokročilého hlasového režimu v ChatGPT. Ten měl prapůvodně dorazit výrazně dřív, nicméně na poslední chvíli došlo k odkladu s tím, že finální termín spuštění pro všechny platící zákazníky ChatGPT je „podzim“ letošního roku.

Září v září

Podle úniků na sociálních sítích by se tak měl veleočekávaný pokročilý hlasový režim OpenAI od příštího úterý rozšířit mezi všechny uživatele služby ChatGPT Plus. Funkce, která umožňuje přirozenější hlasové konverzace s chatbotem, je v omezeném testování od července a neznámý počet uživatelů ho tak už nějakou dobu má. Na internetu tak není těžké narazit na všemožná videa pokročilého hlasového modelu v praxi a jakkoliv nejde o nic dokonalého, je to skutečně působivé a zdá se, že to bude i výrazně lepší, než nedávno spuštěný Gemini Live od Googlu.

Aktuální nepotvrzené zprávy a spekulace tak nyní naznačují, že se blíží definitivní vydání, přičemž někteří uživatelé aktualizaci pravděpodobně obdrží už 24. září. Tedy hned na začátku podzimu.

Hlas i emoce

Pokročilý hlasový režim umožňuje ChatGPT porozumět přerušení během konverzace a reagovat způsobem více podobným lidskému, přičemž zachovává plynulost dialogu bez ztráty kontextu. Na rozdíl od taktéž působivého a konverzačního Gemini Live bude ale umět napodobovat také emocionální tóny, takže interakce pak ve výsledku působí osobněji a dynamičtěji.

V praxi si tak budete moct s pokročilým hlasovým modelem pohrávat všemožnými způsoby – simulovat pohovor, rozhovor, nebo ho nechat odvyprávět pohádku. To všechno umí standardní hlasový model ChatGPT pochopitelně už teď, jen to bude nově umět pořádně procítit, vložit do toho „skutečné“ emoce, přízvuky, dokáže měnit tón i intenzitu projevu apod. A navrch ho budete moct kdykoliv během projevu přerušit pouhým hlasem, nikoliv tlačítkem, jako je tomu nyní.

Tak kdy?

Přesný rozsah spuštění pokročilého hlasového modelu tak sice zůstává nejasný, nicméně všechno nasvědčuje tomu, že by to mělo být skutečně už brzy. A hlavně že by se to už snad nemuselo spouštět po několika fázích dlouhou dobu. Ostatně už nedávné vydání nového modelu ChatGPT o1-preview bylo velice rychlé a krátce po oznámení ho měli všichni platící uživatelé k dispozici.

OpenAI tak budou mít velice hektický konec roku. Před chvíli nám rozšířili ChatGPT o zmíněný o1-preview, teď je, zdá se, na spadnutí pokročilý hlasový režim a pokud platí informace z dřívějška, dočkáme se letos ještě generátoru videí Sora. Otazník možná visí ještě nad vyhledávačem SearchGPT, nicméně ten je zatím pouze v testovací, experimentální fázi a širšího vydání se letos nejspíš nedočká. Pokud tedy vůbec, neboť SearchGPT má být ve výsledku integrovaný do ChatGPT a pravděpodobně tak nakonec nepůjde o zcela samostatný produkt.