- OpenAI vydala otevřený model GPT-OSS, který lze zdarma stáhnout, upravovat i provozovat lokálně
- Modely běží na běžném hardwaru, kdy 120B verzi rozjedete na jedné grafické kartě, 20B verzi i na laptopu s 16 GB RAM
- Modely prošly přísným testováním a jsou vhodné pro komerční použití i vývoj citlivých aplikací
OpenAI se po letech uzavřeného vývoje vrací k otevřenému modelu a vydává GPT-OSS. Dvojice nových jazykových modelů (s 120 a 20 miliardami parametrů) je dostupná zdarma a pod otevřenou licencí Apache 2.0, díky níž je můžete používat i pro komerční účely a můžete si jejich nastavení a váhy upravovat jak je libo.
Srovnatelné s nejlepšími modely
Model GPT-OSS-120B dosahuje výkonu srovnatelného s modelem o4-mini a lze ho provozovat na jediné GPU s 80 GB paměti. Menší varianta GPT-OSS-20B, která si vystačí s běžným notebookem s dnes už standardními 16 GB RAM, nabízí srovnatelný výkon jako o3-mini. Oba modely se hodí pro vývoj aplikací a softwaru na vlastním zařízení, tedy bez nutnosti drahé infrastruktury.
OpenAI tímto krokem tak trochu reaguje na rozmach otevřených modelů, jako jsou Llama od Mety či čínský DeepSeek, a přiznává, že dřívější zdrženlivost byla možná chybou. „Většina našich zákazníků už dnes využívá otevřené modely. Chtěli jsme jim nabídnout i naše technologie,“ uvedl výzkumník OpenAI Chris Cook.
Pestré možnosti použití
Funkčně jsou modely navrženy pro široké spektrum využití – od kódování a vyhledávání na webu přes práci s nástroji až po integraci do agentních systémů. Nabízejí také chain-of-thought reasoning (řetězec myšlení), díky čemuž je možné sledovat logiku, jakou model dochází k odpovědím. Což jde ruku v ruce s open source principy transparentnosti a lepší kontroly toho, co AI dělá a jak „přemýšlí“.
Zásadní roli tu hraje samozřejmě i bezpečnost. Oba modely GPT-OSS prošly nejen interním testováním, ale také hodnocením třetích stran podle tzv. Preparedness Frameworku. Výsledky ukazují, že modely dosahují srovnatelné úrovně bezpečnosti jako proprietární systémy, a to včetně rizik spojených s kybernetikou či biotechnologiemi.
U open source modelů je bezpečnost obzvlášť důležitá, protože jakmile se dostanou jednou ven, už nikdy své váhy, nastavení a vůbec veškeré vnitřnosti neschovají a mohou je využít, či potenciálně zneužít i lidé či organizace s nečestnými úmysly. Respektive mohou takové modely mnohem lépe „přinutit“ k dělání přesně to, co chtějí.
OpenAI je tak zase otevřená
OpenAI zatím nesdílí přímá srovnání s konkurenčními otevřenými modely jako Gemma od Googlu nebo DeepSeek, ale tvrdí, že GPT-OSS překonává většinu dostupných open-source modelů v oblasti využití nástrojů, logického uvažování i vývoje aplikací.
Firma zároveň spolupracuje s partnery jako AI Sweden, Orange nebo Snowflake na testování reálných aplikací, od hostování modelů přímo ve firemní infrastruktuře po doladění na specifická data.
Kdy bude případná další verze GPT-OSS se neví, OpenAI se nechce uvázat k oznámení více či méně pravidelného zveřejňování nových verzí modelu tak, jak to dělá u klasického ChatGPT. Dveře jsou nicméně otevřené, další otevřené modely od OpenAI nejsou nepravděpodobné. Případné další verze modelů jsou ale nyní jen hudbou možné daleké budoucnosti, aktuálně si mohou vývojáři, nadšenci a hračičkové zkusit GPT-OSS stáhnout a začít experimentovat a vyvíjet.
Lokální modely OpenAI běží nejrychleji na NVIDIA RTX
Společnost Nvidia při této příležitosti oznámila spolupráci s OpenAI na zpřístupnění nové rodiny open-source modelů gpt-oss běžným uživatelům. Díky tomu mohou špičkové AI modely, které byly dříve dostupné pouze v cloudových datacentrech, dostatečně rychle běžet přímo na počítačích a pracovních stanicích s GPU z rodiny RTX.
Tato novinka otevírá novou generaci rychlejších a chytřejších lokálních AI systémů, které pohání výkon GPU GeForce RTX a PRO. K dispozici jsou dvě nové varianty navržené pro široké využití napříč ekosystémem:
- Model gpt-oss-20b je optimalizovaný pro maximální výkon na AI PC s Nvidia RTX a alespoň 16 GB VRAM. Na GeForce RTX 5090 zvládá až 250 tokenů za sekundu.
- Větší model gpt-oss-120b je určen pro profesionální pracovní stanice s akcelerací pomocí Nvidia RTX Pro.
Tyto modely byly trénovány na GPU Nvidia H100a jako první podporují na GPU z rodiny RTX formát MXFP4, který oproti starším modelům zvyšuje kvalitu a přesnost modelu bez ztráty výkonu. Oba modely podporují kontext o délce až 131 072 tokenů, což je jedna z nejvyšších hodnot dostupných při lokálním inferencování. Jsou postaveny na flexibilní architektuře mixture-of-experts (MoE), s podporou pro řetězec myšlení (chain-of-thought), plnění instrukcí a používání nástrojů.
„OpenAI ukázala světu, co je možné vybudovat na NVIDIA AI – a nyní posouvají inovace i v oblasti open-source softwaru. Modely gpt-oss umožňují vývojářům po celém světě stavět na špičkových základech open-source AI, čímž posilují technologické vedení USA v oblasti umělé inteligence – a to vše na největší výpočetní AI infrastruktuře světa.“ uvedl Jensen Huang, CEO společnosti Nvidia.