Návrat na trůn: nový AI model Gemini 3.1 Pro drtí v testech konkurenci

Google se s novým AI modelem Gemini 3.1 Pro trefil do černého
Hned v několika benchmarcích porazil nejen svého předchůdce, ale také řadu konkurentů
Gigant z Mountain View tvrdí, že novinka má být lepší hlavně v praktických dovednostech

Segmentu umělé inteligence v současné době kraluje několik velkých modelů, přičemž o prvenství se přetahují především ChatGPT od OpenAI, Claude z dílny Perplexity, Copilot vytvořený Microsoftem a Gemini, za kterým stojí Google. Nyní gigant z Mountain View představil Gemini 3.1 Pro, nejnovější aktualizaci svého vlajkového modelu umělé inteligence, jen několik měsíců po vydání Gemini 3. Nová verze je od dnešního dne k dispozici v předběžné verzi pro vývojáře, podniky a běžné uživatele. Google slibuje vylepšenou logiku, lepší výkon kódování a pohotovější zpracování dlouhých dokumentů.

Googlu se nový model Gemini 3.1 Pro opravdu povedl

Ačkoli se v některých benchmarkových testech zdají být vylepšení spíše skromná, Google tvrdí, že aktualizace přináší konzistentnější a spolehlivější výkon při reálných úkolech. Google zdůraznil navýšení výkonu v několika standardizovaných testech – například v testu Humanity’s Last Exam, který měří pokročilé znalosti v dané oblasti, dosáhl Gemini 3.1 Pro skóre 44,4 %, zatímco předchůdce Gemini 3 Pro dosáhl skóre 37,5 %. Konkurenční GPT 5.2 od OpenAI naproti tomu dosáhl skóre 34,5 %. Firma také poukázala na výrazné zlepšení v benchmarku ARC-AGI-2, který je určený k testování nových problémů v oblasti uvažování.

Gemini 3.1 Pro is here: A smarter model for your most complex tasks.

Building on the Gemini 3 series, 3.1 Pro is a step forward in reasoning. It's designed for tasks where a simple answer isn’t enough, taking advanced reasoning and making it useful for your hardest challenges.🧵

— Google Gemini (@GeminiApp) February 19, 2026

Hodnocení Gemini 3.1 Pro vyskočilo na 77,1 procenta, což je více než dvojnásobek předchozího výsledku. Gemini 3.1 Pro však není na špici všech žebříčků. V benchmarku Arena vede Claude Opus 4.6 před Gemini v textových úkolech, přičemž Gemini předstihuje o čtyři body s 1 504 body. V kategoriích kódování jsou Opus 4.6, Opus 4.5 a GPT 5.2 High také na předních místech žebříčku.

Umělá inteligence Galaxy AI/Gemini AI na Samsungu Galaxy S25 Ultra

Nepřehlédněte

Od obrázků k symfoniím: AI Gemini se naučila skládat hudbu a jde jí to sakra dobře

Nutno podotknout, že hodnocení Arena se opírá o hlasování uživatelů. Účastníci si vybírají výstupy, které se jim líbí, takže tento formát může odměňovat odpovědi, které se jeví jako správné, i když obsahují drobné chyby.

Google se nezapomněl pochlubit s tím, že navrhl Gemini 3.1 Pro s ohledem na vývojáře – nový model generuje kód, vysvětluje složité funkce a pomáhá odstraňovat chyby, avšak nyní zvládá také větší bloky kódu v jedné relaci. Google chce Gemini 3.1 Pro prosadit jako spolehlivý nástroj pro zákaznickou podporu, automatizaci a kontrolu dokumentů. Jestli se mu to podaří, se teprve ukáže.

Vstoupit do diskuze (7)