TOPlist

Další zásadní AI evoluce je tady! ChatGPT umí analyzovat video v reálném čase

ilustrace hlasového ovládání s obrazem videem
  • ChatGPT dostal konečně analýzu videa v reálném čase
  • Funkce umožňuje analyzovat objekty kamerou telefonu a sdílet obrazovku
  • Může tak jít o šikovného pomocníka kutilům, postiženým nebo obecného i odborného rádce

Společnost OpenAI představila a rovnou vydala velkou a zásadní aktualizaci aplikace ChatGPT. Ta přidává analýzu videa v reálném čase do už dobře známého pokročilého hlasového režimu.

Analýza videa

Funkce, kterou OpenAI odhalila během čtvrtečního livestreamu, je dostupná předplatitelům ChatGPT Plus, Team a Pro. Uživatelé tak mohou nově analyzovat objekty pomocí kamery telefonu nebo sdílet obrazovku pro okamžitou asistenci.

Aktivace funkce je jednoduchá: stačí klepnout na ikonu hlasu vedle chatovacího pole a poté na ikonu videa vlevo dole. Pro sdílení obrazovky stačí vybrat možnost „Sdílet obrazovku“ v menu s třemi tečkami.

OpenAI uvedla, že funkci postupně zpřístupní během jednoho týdne. Někteří uživatelé, jako jsou předplatitelé verzí Enterprise a Education, ji budou moci využívat od ledna 2024. Uživatelé z EU, Švýcarska a některých dalších zemí si na přístup budou muset počkat (ale skrze VPN funguje bez problémů i u nás, vyzkoušeno).

Užitečnost především

Nová aktualizace rozšiřuje schopnosti ChatGPT interpretovat vizuální podněty z reálného světa i obrazovek zařízení. Mezi příklady využití patří vysvětlení menu nastavení nebo řešení matematických úloh.

Funkce může být mimořádně užitečná pro lidi se špatným nebo žádným zrakem, kteří mohou díky těmto vizuálním schopnostem získat okamžitou asistenci při řešení každodenních problémů. Stejně tak může pomoci například při odborných pracích, kdy je potřeba rychle vyhodnotit situaci nebo provést vizuální kontrolu.

ChatGPT se tak nyní stává odborníkem, který nemusí odpovídat jen textově nebo hlasem, ale dokáže vám doslova koukat pod ruce v reálném čase, což představuje zásadní posun – už se nemusíte jen ptát textově nebo uploadovat obrázky.

Pozdě, ale přece

Analýza videa v reálném čase se původně měla spustit už v dubnu, ale kvůli technickým komplikacím došlo k několika odkladům. Pokročilý hlasový režim, na který jsme také čekali poměrně dlouho, se poprvé objevil letos na podzim s omezenými funkcemi hlasové asistence. OpenAI mezitím funkci doladila a rozšířila její dostupnost.

Vedle nové analýzy videa představila OpenAI například režim Santa, což je ale „pouze“ další hlas s trochou té sváteční příměsi. Santu najdete jako jeden z několika hlasů v rámci zmíněného Advanced Voice Mode. A tak zatímco například Google skrze svůj zbrusu nový Gemini 2.0 Flash Experimental trochu dohání ChatGPT 4o, OpenAI posouvá laťku zase o kousíček výš skrze užitečné věci typu Canvas či právě díky analýze videa v reálném čase. Na tom pracuje i Google, ale zatím to tu není.

Autor článku Adam Homola
Adam Homola
Nové technologie mě fascinují už od útlého věku. K dlouhodobému zájmu o hry a herní průmysl se mi postupem času přirozeně přidal i hardware, software, internetové služby a od roku 2022 i umělá inteligence.

Kapitoly článku