Deník N – rozumět lépe světu

Deník N

Dvanáct úkolů pro umělou inteligenci. Hodí se pro vás víc GPT, Bard, nebo Bing? Nabízíme velké porovnání

GPT-3.5, GPT-4, Google Bard, Microsoft Bing. Každý má své přednosti a nedostatky. Grafika: Deník N
GPT-3.5, GPT-4, Google Bard, Microsoft Bing. Každý má své přednosti a nedostatky. Grafika: Deník N

Už to není jen ChatGPT. V tuto chvíli si český uživatel může vybrat ze tří neplacených jazykových modelů. Předložili jsme jim dvanáct úloh, abychom vás mohli lépe informovat o jejich schopnostech.

Jazykové modely na bázi generativní umělé inteligence (AI) postupně ztrácejí kouzlo novosti. Přibývá lidí, pro které jsou každodenní praktickou pomůckou. Je dost možné, že k nim můžete patřit i vy, jen to zatím nevíte. Abychom vám rozhodnutí usnadnili, nabízíme obsáhlý srovnávací test těchto nástrojů.

K třem volně dostupným službám (OpenAI GPT-3.5, Google Bard, Microsoft Bing) jsme pro účely našeho testu přibrali ještě placený GPT-4. Další jazykové modely, například Anthropic Claude, zatím nejsou přístupné z Česka. Vymysleli jsme pro ně dvanáct úloh – ve snaze prozkoumat typické oblasti použití AI. Zaměřili jsme se spíše na praktické úkoly než na zábavná zadání typu „napiš haiku o krokodýlech ve vesmíru z pohledu piráta“. Všechny úlohy (s výjimkou jedné, v níž jde o překlad) jsme zadávali v češtině.

Detailnější vysvětlení k průběhu testů najdete na konci článku. Všechny odpovědi jazykových modelů uvádíme bez jakýchkoli úprav, jen v některých případech jsme kvůli stručnosti (článek je i tak velmi dlouhý) škrtli nadbytečné zdvořilostní fráze typu „Doufám, že Vám moje odpověď pomohla“. Zůstaly v nich tedy zachovány i gramatické chyby. Těch není málo. Některé testy jsme pro srovnání prováděli také v angličtině (jejich výsledky zde neuvádíme). V té všechny modely formulují lépe a přesněji.

Výsledky testů ukázaly, že pro naše specifické úlohy se výkonnost jazykových modelů poměrně hodně liší a že tyto rozdíly úplně neodpovídají předběžným předpokladům. Placená verze GPT-4 se sice ukázala jako nejvyrovnanější – nedopustila se žádných velkých chyb a u některých úloh excelovala –, nezvítězila však ve všech kategoriích. Příjemně nás překvapil

Tento článek je exkluzivním obsahem pro předplatitele Deníku N.

Umělá inteligence

Věda

V tomto okamžiku nejčtenější