TOPlist

Pokročilý hlasový režim se má do ChatGPT dostat prý už za pár dní

open ai chat gpt advancedvoicemode
  • OpenAI chce údajně spustit pokročilý hlasový režim ještě během září
  • Původní oficiální informace mluvily o spuštění během podzimu
  • Konkurence v podobě Gemini Live nedávno přiostřila, ale nové hlasy ChatGPT by měly laťku zase posunout

Podzim začíná už 22. září a společně s ním se máme konečně dočkat i pokročilého hlasového režimu v ChatGPT. Ten měl prapůvodně dorazit výrazně dřív, nicméně na poslední chvíli došlo k odkladu s tím, že finální termín spuštění pro všechny platící zákazníky ChatGPT je „podzim“ letošního roku.

Září v září

Podle úniků na sociálních sítích by se tak měl veleočekávaný pokročilý hlasový režim OpenAI od příštího úterý rozšířit mezi všechny uživatele služby ChatGPT Plus. Funkce, která umožňuje přirozenější hlasové konverzace s chatbotem, je v omezeném testování od července a neznámý počet uživatelů ho tak už nějakou dobu má. Na internetu tak není těžké narazit na všemožná videa pokročilého hlasového modelu v praxi, a jakkoliv nejde o nic dokonalého, je to skutečně působivé a zdá se, že to bude i výrazně lepší než nedávno spuštěný Gemini Live od Googlu.

Aktuální nepotvrzené zprávy a spekulace tak nyní naznačují, že se blíží definitivní vydání, přičemž někteří uživatelé aktualizaci pravděpodobně obdrží už 24. září. Tedy hned na začátku podzimu.

Hlas i emoce

Pokročilý hlasový režim umožňuje ChatGPT porozumět přerušení během konverzace a reagovat způsobem více podobným lidskému, přičemž zachovává plynulost dialogu bez ztráty kontextu. Na rozdíl od taktéž působivého konverzačního Gemini Live bude ale umět napodobovat také emocionální tóny, takže interakce pak ve výsledku bude působit osobněji a dynamičtěji.

V praxi si tak budete moci s pokročilým hlasovým modelem pohrávat všemožnými způsoby – simulovat pohovor, rozhovor nebo ho nechat odvyprávět pohádku. To všechno umí standardní hlasový model ChatGPT pochopitelně už teď, jen to bude nově umět pořádně procítit, vložit do toho „skutečné“ emoce, přízvuky, měnit tón i intenzitu projevu apod. A navrch ho budete moci kdykoliv během projevu přerušit pouhým hlasem, nikoliv tlačítkem, jako je tomu nyní.

Tak kdy?

Přesný harmonogram spuštění pokročilého hlasového modelu tak sice zůstává nejasný, nicméně všechno nasvědčuje tomu, že by to mělo být skutečně už brzy. A hlavně že by se to už snad nemuselo spouštět po několika fázích dlouhou dobu. Ostatně už nedávné vydání nového modelu ChatGPT o1-preview bylo velice rychlé a krátce po oznámení ho měli všichni platící uživatelé k dispozici.

OpenAI tak bude mít velice hektický konec roku. Před chvílí nám rozšířil ChatGPT o zmíněný o1-preview, teď je, zdá se, na spadnutí pokročilý hlasový režim, a pokud platí informace z dřívějška, dočkáme se letos ještě generátoru videí Sora. Otazník možná visí ještě nad vyhledávačem SearchGPT, nicméně ten je zatím pouze v testovací, experimentální fázi a širšího vydání se letos nejspíš nedočká. Pokud tedy vůbec, neboť SearchGPT má být ve výsledku integrovaný do ChatGPT a pravděpodobně tak nakonec nepůjde o zcela samostatný produkt.

Autor článku Adam Homola
Adam Homola
Nové technologie mě fascinují už od útlého věku. K dlouhodobému zájmu o hry a herní průmysl se mi postupem času přirozeně přidal i hardware, software, internetové služby a od roku 2022 i umělá inteligence.

Kapitoly článku