Deník N – rozumět lépe světu

Deník N

Budou psát roboti básně či povídky v češtině? Prečo nie?

Číst už digitální systémy dokážou. Kdy začnou psát beletrii? Foto: Brian Matis, Flickr
Číst už digitální systémy dokážou. Kdy začnou psát beletrii? Foto: Brian Matis, Flickr

V prosinci loňského roku odvysílal Český rozhlas v rámci projektu Digitální spisovatel sérii povídek, které „napsala“ umělá inteligence. O tom, proč dáváme slovo napsala do uvozovek a o tom, zda se skutečně jedná o „konec spisovatelů v Čechách“, jak zněl titulek na serveru iDnes, pojednává následující text.

Jedním z míst, na kterém se odehrává atraktivní závod o to, kdo sestrojí umělou mysl, která bude schopna konkurovat mysli lidské, je také literatura. Napsat báseň či povídku nerozeznatelnou svým jazykem a stylem od „lidské tvorby“ je pro počítače rok od roku lehčím úkolem. Mimochodem, když čtete tyto věty, opravdu jste si jistí, že je napsal člověk, jehož jméno je uvedeno v záhlaví tohoto článku? Nebo ještě jinak: Opravdu jste si jistí, že je napsal člověk? Neměli byste. Proč? Odpověď je stručná a zní: GPT2.

Pod touto zkratkou se skrývá technologie, která počítačům umožňuje učit se libovolný jazyk, vytvářet texty v libovolném stylu, napodobovat způsoby tvorby známých autorů či experimentovat s tak nespoutanou imaginací, že by všichni surrealisté či jiní literární experimentátoři museli blednout závistí. Abyste těchto kouzel dosáhli, potřebujete nezbytně tři základní věci.

V první řadě se neobejdete bez umělé neuronové sítě, tedy softwaru, jehož struktura je – jak už název napovídá – inspirována strukturou biologické neuronové sítě, lidského mozku. Dále pak budete potřebovat již avizovaný jazykový model GPT2 (či jeho dokonalejšího brášku GPT3), který udělá z vaší neuronové sítě jazykového génia. Jedná se totiž o nástroj, který na základě libovolné posloupnosti slov umí vybrat slova, která by pravděpodobně mohla následovat.

Všichni to svým způsobem známe z různých podob tzv. našeptávačů (ať už jsou součástí internetových vyhledávačů, nebo nám pomáhají psát na displeji mobilního telefonu). GPT2 dělá něco podobného – „jen“ mnohem dokonaleji, neboť disponuje neuvěřitelnou půldruhou miliardou parametrů, o které svůj výpočet pravděpodobnosti může opřít. A jelikož vaše neuronová síť pracuje na principu strojového učení, budete nezbytně potřebovat také pořádně velký soubor digitalizovaných textů (tzv. tréninkový korpus), na kterém se váš virtuální svěřenec bude učit, jak funguje jazyk a jak mohou vypadat texty.

A právě tady už začíná kouzelná alchymie počítačového generování textů pomocí neuronových sítí. Totiž už složení onoho tréninkového souboru textů určuje podobu a styl výstupů, které vaše neuronová síť bude nabízet. Pro příklad nemusíme daleko. V roce 2016 český matematický lingvista a odborník na strojové učení Jiří Materna natrénoval neuronovou síť

Tento článek je exkluzivním obsahem pro předplatitele Deníku N.

Literatura

Kultura

V tomto okamžiku nejčtenější