TOPlist

OpenAI poprvé po šesti letech vydala otevřenou AI, rozjedete ji i na notebooku

Ilustrace pokročilé umělé inteligence na notebooku
  • OpenAI vydala otevřený model GPT-OSS, který lze zdarma stáhnout, upravovat i provozovat lokálně
  • Modely běží na běžném hardwaru, kdy 120B verzi rozjedete na jedné grafické kartě, 20B verzi i na laptopu s 16 GB RAM
  • Modely prošly přísným testováním a jsou vhodné pro komerční použití i vývoj citlivých aplikací

OpenAI se po letech uzavřeného vývoje vrací k otevřenému modelu a vydává GPT-OSS. Dvojice nových jazykových modelů (s 120 a 20 miliardami parametrů) je dostupná zdarma a pod otevřenou licencí Apache 2.0, díky níž je můžete používat i pro komerční účely a můžete si jejich nastavení a váhy upravovat jak je libo.

Srovnatelné s nejlepšími modely

Model GPT-OSS-120B dosahuje výkonu srovnatelného s modelem o4-mini a lze ho provozovat na jediné GPU s 80 GB paměti. Menší varianta GPT-OSS-20B, která si vystačí s běžným notebookem s dnes už standardními 16 GB RAM, nabízí srovnatelný výkon jako o3-mini. Oba modely se hodí pro vývoj aplikací a softwaru na vlastním zařízení, tedy bez nutnosti drahé infrastruktury.

OpenAI tímto krokem tak trochu reaguje na rozmach otevřených modelů, jako jsou Llama od Mety či čínský DeepSeek, a přiznává, že dřívější zdrženlivost byla možná chybou. „Většina našich zákazníků už dnes využívá otevřené modely. Chtěli jsme jim nabídnout i naše technologie,“ uvedl výzkumník OpenAI Chris Cook.

Pestré možnosti použití

Funkčně jsou modely navrženy pro široké spektrum využití – od kódování a vyhledávání na webu přes práci s nástroji až po integraci do agentních systémů. Nabízejí také chain-of-thought reasoning (řetězec myšlení), díky čemuž je možné sledovat logiku, jakou model dochází k odpovědím. Což jde ruku v ruce s open source principy transparentnosti a lepší kontroly toho, co AI dělá a jak „přemýšlí“.

Robot sedící za počítačem (ilustrační obrázek)
Robot sedící za počítačem (ilustrační obrázek)

Zásadní roli tu hraje samozřejmě i bezpečnost. Oba modely GPT-OSS prošly nejen interním testováním, ale také hodnocením třetích stran podle tzv. Preparedness Frameworku. Výsledky ukazují, že modely dosahují srovnatelné úrovně bezpečnosti jako proprietární systémy, a to včetně rizik spojených s kybernetikou či biotechnologiemi.

U open source modelů je bezpečnost obzvlášť důležitá, protože jakmile se dostanou jednou ven, už nikdy své váhy, nastavení a vůbec veškeré vnitřnosti neschovají a mohou je využít, či potenciálně zneužít i lidé či organizace s nečestnými úmysly. Respektive mohou takové modely mnohem lépe „přinutit“ k dělání přesně to, co chtějí.

OpenAI je tak zase otevřená

OpenAI zatím nesdílí přímá srovnání s konkurenčními otevřenými modely jako Gemma od Googlu nebo DeepSeek, ale tvrdí, že GPT-OSS překonává většinu dostupných open-source modelů v oblasti využití nástrojů, logického uvažování i vývoje aplikací.

Firma zároveň spolupracuje s partnery jako AI Sweden, Orange nebo Snowflake na testování reálných aplikací, od hostování modelů přímo ve firemní infrastruktuře po doladění na specifická data.



Robot jako terapeut (ilustrační obrázek)



Nepřehlédněte

ChatGPT pozná, že se necítíte dobře. OpenAI přidává funkce pro duševní zdraví

Kdy bude případná další verze GPT-OSS se neví, OpenAI se nechce uvázat k oznámení více či méně pravidelného zveřejňování nových verzí modelu tak, jak to dělá u klasického ChatGPT. Dveře jsou nicméně otevřené, další otevřené modely od OpenAI nejsou nepravděpodobné. Případné další verze modelů jsou ale nyní jen hudbou možné daleké budoucnosti, aktuálně si mohou vývojáři, nadšenci a hračičkové zkusit GPT-OSS stáhnout a začít experimentovat a vyvíjet.

Lokální modely OpenAI běží nejrychleji na NVIDIA RTX

Společnost Nvidia při této příležitosti oznámila spolupráci s OpenAI na zpřístupnění nové rodiny open-source modelů gpt-oss běžným uživatelům. Díky tomu mohou špičkové AI modely, které byly dříve dostupné pouze v cloudových datacentrech, dostatečně rychle běžet přímo na počítačích a pracovních stanicích s GPU z rodiny RTX.

AI Garage společnosti Nvidia

Tato novinka otevírá novou generaci rychlejších a chytřejších lokálních AI systémů, které pohání výkon GPU GeForce RTX a PRO. K dispozici jsou dvě nové varianty navržené pro široké využití napříč ekosystémem:

  • Model gpt-oss-20b je optimalizovaný pro maximální výkon na AI PC s Nvidia RTX a alespoň 16 GB VRAM. Na GeForce RTX 5090 zvládá až 250 tokenů za sekundu.
  • Větší model gpt-oss-120b je určen pro profesionální pracovní stanice s akcelerací pomocí Nvidia RTX Pro.

Tyto modely byly trénovány na GPU Nvidia H100a jako první podporují na GPU z rodiny RTX formát MXFP4, který oproti starším modelům zvyšuje kvalitu a přesnost modelu bez ztráty výkonu. Oba modely podporují kontext o délce až 131 072 tokenů, což je jedna z nejvyšších hodnot dostupných při lokálním inferencování. Jsou postaveny na flexibilní architektuře mixture-of-experts (MoE), s podporou pro řetězec myšlení (chain-of-thought), plnění instrukcí a používání nástrojů.

OpenAI ukázala světu, co je možné vybudovat na NVIDIA AI – a nyní posouvají inovace i v oblasti open-source softwaru. Modely gpt-oss umožňují vývojářům po celém světě stavět na špičkových základech open-source AI, čímž posilují technologické vedení USA v oblasti umělé inteligence – a to vše na největší výpočetní AI infrastruktuře světa.“ uvedl Jensen Huang, CEO společnosti Nvidia.

Autor článku Adam Homola
Adam Homola
Nové technologie mě fascinují už od útlého věku. K dlouhodobému zájmu o hry a herní průmysl se mi postupem času přirozeně přidal i hardware, software, internetové služby a od roku 2022 i umělá inteligence.

Kapitoly článku