Už myslí jako člověk! Nový model umělé inteligence od OpenAI je děsivě dokonalý

Umělá inteligence a grafický editor (ilustrační obrázek)

OpenAI oznámila a rovnou spustila nový model o1-preview
Jeho cílem je napodobovat myšlenkové pochody a způsob přemýšlení lidí
Zatím jde ale o ranou verzi bez analýzy souborů či přístupu na internet

Společnost OpenAI překvapila, když nejen oznámila, ale rovnou také vydala zbrusu nový model s názvem o1-preview. Přesněji řečeno jde o první z nové řady modelů umělé inteligence, které mají řešit složité úlohy uvažování efektivněji než předchozí verze.

Kapitoly článku

Nový model, nová doba

Vyšší výkon ve složitých doménách

Nová metodika tréninku

Přístup a dostupnost

Budoucí vývoj

Krok směrem k inteligenci

Nový model, nová doba

Model o1-preview představuje velký pokrok ve schopnostech umělé inteligence, zejména v oborech vyžadujících složité řešení problémů, jako je věda, kódování a matematika. Ale z mého zatím jen rychlého testování to vypadá na trochu lepší, detailnější a promyšlenější odpovědi i v celé řadě jiných oblastí.

Cílem řady o1 je napodobit lidské myšlení tím, že před odpovědí stráví více času zpracováním dotazů. A je pravdou, že jednou z nevýhod o1-preview je jeho pomalost, kdy v některých případech může trvat klidně až desítky vteřin, než začne odpovídat. Model si tak vyhrazuje čas na „přemýšlení“ a důkladnější zpracování dotazu. Zároveň vám ve fázi přemýšlení naznačuje, co právě řeší (přemýšlí, analyzuje, kóduje apod.), tudíž nekoukáte jen na prázdnou stránku, ale vidíte, že model opravdu něco dělá.

Díky novým metodám trénování by měly mít nové modely mnohem lepší procesy uvažování, měly by být schopny zkoumat různé strategie, úhly pohledu, a hlavně by měly rozpoznávat chyby. Ve výsledku by tak měly poskytovat výrazně přesnější a diferencovanější odpovědi než jakýkoliv jiný předchozí model.

Vyšší výkon ve složitých doménách

V interních hodnoceních prokázal systém o1-preview vynikající výkon při řešení náročných úloh. Například v kvalifikační zkoušce na Mezinárodní matematickou olympiádu (IMO) předchozí model GPT-4o správně vyřešil pouze 13 % úloh, zatímco o1-preview dosáhl 83% úspěšnosti. V soutěžích v kódování na Codeforces dosáhl nový model 89. percentilu účastníků.

„Model je rozhodně lepší v řešení testu AP z matematiky než já, a to jsem na vysoké škole studoval matematiku,“ poznamenal Bob McGrew, ředitel výzkumu společnosti OpenAI, jak reportuje The Verge. Firma předpokládá, že budoucí aktualizace umožní modelu dosahovat stejných výsledků jako studenti doktorského studia fyziky, chemie a biologie.

Nová metodika tréninku

OpenAI použila pro modely o1 nový přístup k tréninku, který využívá posilování učení k tréninku systému prostřednictvím odměn a trestů. To umožňuje modelu zpracovávat dotazy pomocí „myšlenkového pochodu“, podobně jako lidé řeší problémy krok za krokem.

„Trénovali jsme tyto modely tak, aby strávily více času přemýšlením o problémech, než začnou reagovat, podobně jako člověk,“ vysvětlila OpenAI. „Díky tréninku se naučí zdokonalovat svůj proces myšlení, zkoušet různé strategie a rozpoznávat své chyby.“

Rozhraní je navrženo tak, aby zobrazovalo kroky uvažování modelu, díky čemuž mohou uživatelé sledovat proces řešení problémů. Díky tomu je o1-preview nejen přesnější a transparentnější, ale měl by prý také výrazně snižovat počet halucinací. Úplně bez halucinací se to podle OpenAI zatím bohužel ještě neobejde, nicméně na o1-preview by měl být výrazně větší spoleh než na předchozím modelu 4o.

Přístup a dostupnost

OpenAI si tentokrát napravuje malinko pošramocenou reputaci co do vydání nového modelu. Na rozdíl od Advanced Voice Mode, Sory nebo SearchGPT nemusíme na o1-preview čekat. Není součástí žádné uzavřené testovací verze, nebude tady za „několik týdnů“ a nijak se neodkládá. Pokud si platíte ChatGPT Plus (či Team), máte k modelu o1-preview přístup už teď. Stejně tak máte možnost využívat jeho odlehčenou verzi o1-mini.

Uživatelé ChatGPT Enterprise a Edu získají k novým modelům přístup příští týden. Modely lze v platformě vybrat ručně, přičemž počáteční týdenní limity využívání jsou nastaveny na 30 zpráv pro o1-preview a 50 pro o1-mini.

Vývojáři s přístupem k API na úrovni 5 mohou začít s oběma modely okamžitě vytvářet prototypy, i když s omezením rychlosti na 20 požadavků za minutu. Rozhraní API v současné době postrádá některé funkce, jako je volání funkcí, streamování a podpora systémových zpráv, ale očekává se, že ty přibudou v budoucích aktualizacích.

Co se týče ceny, o1-preview je pro vývojáře podstatně dražší než předchozí modely. V rozhraní API stojí 15 dolarů za 1 milion vstupních tokenů a 60 dolarů za 1 milion výstupních tokenů ve srovnání se sazbami GPT-4o ve výši 5, resp. 15 dolarů. Podstatně lépe je na tom o1-mini, který stojí o 80 % méně než o1-preview, takže je vhodný pro aplikace, které vyžadují uvažování, ale ne rozsáhlou znalost světa.

OpenAI plánuje rozšířit přístup k o1-mini pro všechny uživatele bezplatné verze ChatGPT, ale konkrétní datum vydání neoznámila.

Budoucí vývoj

Není ale všechno zlato, co se třpytí, a sama OpenAI tvrdí, že model 4o bude pro většinu běžných uživatelů a většinu běžných dotazů mnohem lepší. Do o1-preview totiž zatím nemůžete nahrávat obrázky, model neumí pracovat ani se soubory, a dokonce neumí ani prohlížet web. Tohle všechno jsou sice jen dočasná omezení, nicméně v současné době je očividné, že o1-preview cílí spíše na velmi specifické a náročnější dotazy.

„Kromě nové řady OpenAI o1 plánujeme také pokračovat ve vývoji a vydávání modelů řady GPT,“ uvedla na svém webu OpenAI. Navzdory pokročilým schopnostem uvažování postrádá o1 v současné době zmíněné funkce, díky nimž je GPT-4o univerzálnější a pro většinu lidí nejen rychlejší, ale asi i užitečnější a schopnější. Pokud ale víte, co přesně potřebujete, a týká se to ideálně matematiky, kódování nebo vědy, bude pro vás o1-preview jako dělaný.

Řada o1 je tak přínosná zejména pro profesionály, kteří se zabývají složitými problémy. Výzkumní pracovníci ve zdravotnictví ji mohou podle OpenAI používat k anotaci dat buněčného sekvencování, fyzikové mohou generovat složité matematické vzorce pro kvantovou optiku a vývojáři mohou vytvářet a provádět vícekrokové pracovní postupy s vyšší efektivitou.

Krok směrem k inteligenci

Řada o1 tak představuje milník ve snaze OpenAI o dosažení umělé inteligence podobné té lidské. Zlepšením uvažovacích schopností modelů umělé inteligence chce společnost odblokovat průlomové objevy v oblastech, jako je medicína, inženýrství a další. A ve výsledku pak může vést k vytvoření schopných a především samostatných agentů, kteří zvládnou pracovat na složitých problémech vyžadujících celou řadu separátních kroků.

OpenAI tak opět posouvá laťku vývoje umělé inteligence o kus dál a bude zajímavé sledovat, jak rychle se podaří Googlu, Metě a Anthropicu ji dorovnat. Jak už název napovídá, o1-preview je skutečně jen „preview“ a celý model je tak pouze v rané fázi. Přesto nám tu OpenAI servíruje onen pomyslný náhled na to, jakým směrem se bude ubírat její další plnohodnotný model.

Vstoupit do diskuze (8)

2. zdroj Zdroj článku

Autor článku

Adam Homola

Nové technologie mě fascinují už od útlého věku. K dlouhodobému zájmu o hry a herní průmysl se mi postupem času přirozeně přidal i hardware, software, internetové služby a od roku 2022 i umělá inteligence.