- OpenAI naskakuje na vlnu malých, schopných a především efektivních modelů
- GPT-4o mini je výrazně levnější a zároveň je schopnější než GPT-3.5
- Nový model cílí na vývojáře, ale vyzkoušet ho můžete na webu ChatGPT i vy sami
Společnost OpenAI představila GPT-4o mini, nový cenově výhodný malý jazykový model, který má zpřístupnit pokročilou umělou inteligenci širšímu spektru vývojářů.
Levně a efektivně
Model s cenou 15 centů za milion vstupních tokenů a 60 centů za milion výstupních tokenů je výrazně levnější než předchozí modely a o více než 60 % levnější než GPT-3.5 Turbo.
GPT-4o mini se může pochlubit solidními výkonnostními ukazateli, když v benchmarku MMLU (Measuring Massive Multitask Language Understanding) dosáhl 82 % a překonal tak konkurenty, jako jsou Gemini Flash (77,9 %) a Claude Haiku (73,8 %). Vykazuje také silné schopnosti v úlohách matematického uvažování a kódování, kde dosáhl 87,0 % v testu MGSM a 87,2 % v testu HumanEval.

Nový model podporuje v rozhraní API textové a vizuální vstupy, v budoucnu se plánuje rozšíření na video a zvuk. GPT 4o mini je vybaven kontextovým oknem o velikosti 128 tisíc tokenů a dokáže generovat až 16 tisíc výstupních tokenů na jeden požadavek. Uzávěrka znalostí GPT-4o mini je v říjnu 2023.
Malý, ale šikovný
Od dnešního dne mají uživatelé ChatGPT s tarify Free, Plus a Team přístup ke GPT-4o mini namísto GPT-3.5 Turbo. Uživatelé podnikových aplikací získají přístup příští týden. OpenAI plánuje v budoucnu vyřadit GPT-3.5 z API, ačkoli žádný konkrétní časový plán nebyl oznámen.
Očekává se, že spuštění GPT-4o mini umožní širší škálu aplikací umělé inteligence, zejména těch, které vyžadují volání více modelů, rozsáhlé kontextové zpracování nebo textové odpovědi v reálném čase.

Vydání a vůbec existence GPT-4o mini odráží širší trend ve vývoji umělé inteligence, který kombinuje vyšší inteligenci se snížením nákladů. OpenAI uvádí, že náklady na jeden token klesly od zavedení systému text-davinci-003 v roce 2022 o 99 %.
Efektivita především
Jedním z největších problémů současných modelů generativní umělé inteligence jsou právě jejich velké náklady na provoz. Proto je mezi těmi největšími hráči velký tlak na co největší snížení cen. Od toho jsou na trhu právě modely jako zmíněný Claude Haiku nebo Gemini Flash.

Nepřehlédněte
Apple svou AI bez svolení trénoval na obsahu z YouTube, včetně videí od MrBeast a MKBHD (aktualizováno)
GPT-4o mini je k mání už i v rámci ChatGPT a po rychlém otestování musím říct, že pro většinu běžných případů je kvalita odpovědí naprosto bez problémů a rychlost je výrazně vyšší než se standardním GPT-4o.