Deník N – rozumět lépe světu

Deník N

Hrám vděčíme za vyšší výkon počítačů, pornu za rychlost, říká expert na analýzu řeči. Učí roboty „rozumět“

"Stroje musí také vědět, kdy pracují dobře a kdy špatně – jako když něco učíte psa a za správně provedený povel mu dáte kostku cukru a za špatně provedený mu naplácáte." Jan Černocký. Foto: Karolína Poláčková
„Stroje musí také vědět, kdy pracují dobře a kdy špatně – jako když něco učíte psa a za správně provedený povel mu dáte kostku cukru a za špatně provedený mu naplácáte.“ Jan Černocký. Foto: Karolína Poláčková

V laboratoři na brněnské VUT vyvíjejí nástroje, které posléze využívají policisté, vojáci, ale i tajné služby. Včetně těch amerických. Jan Černocký a jeho „kluci a holky“ učí stroje analyzovat řeč. Jejich prací je data mining, tedy dolování dat ze zvukových nahrávek. Nepřímo se tak podílejí i na boji se zločinem a s teroristy. Za co vděčí vědci počítačovým hrám a pornu? A proč se musí tréninková data „zabordelit“?

Mluvíme spolu po Skypu, kde máte přezdívku Rypadlo. To proto, že se zabýváte dolováním dat?

To je dobrý! Ne, to mě vůbec nenapadlo, dala jste tomu nový význam, budu to používat. Rypadlo, ten obrovský stroj, mě fascinuje. Obdivuju ho od dětství, proto ten nick.

Kdy jste při dolování dat z řeči narazil naposledy na antracit?

Sám dlouho ne, protože posledních dvacet let už sám moc nedoluju. Snažím se organizovat, řídit, shánět šikovný lidi, projekty, peníze a dělat svým lidem na fakultě zázemí, aby mohli dolovat a nemuseli se zabývat otravnou administrativou. A kecám o tom do novin.

Hra na zločineckou organizaci

Ve vaší laboratoři se specializujete na vývoj algoritmů na rozpoznávání řeči nebo mluvčích v komplikovaných podmínkách, ať už jde o vzácné nebo exotické jazyky, zvuková znečištění, šumy či krátké „zaštěkání do vysílačky na bojišti“. Jako fanynku detektivek mě nejvíc zaujalo, že vaše nástroje používají kriminalisté, protože díky nim mohou například v dlouhých nahrávkách odposlechů označit relevantní úseky – podle toho, kdo mluví nebo o čem. Kolik zločinců už díky vám chytili?

Bohužel, vaše velká očekávání zklamu. Moc vám k tomu neřeknu, protože naši kamarádi od policie nebo tajných služeb nám taky nic neříkají. Musím vysvětlit, že naše skupina dělá výzkum, aplikace pak jdou přes naše průmyslové partnery, kteří z našich algoritmů udělají komerční software třeba pro policii nebo vojsko. A zpětná vazba se k nám moc nedonese. Je to možná lepší, protože vědecká komunita je hodně otevřená a všechno utajovat a mít u vchodu samopalníky by nám bylo proti srsti.

Ale bylo by to cool.

Asi ano. Ale nás spíš trápí, že z nich nedostaneme data, na kterých bychom naše stroje mohli učit rozpoznávat to, co například v odposleších rozpoznat mají, třeba kdo s kým právě mluví. Dokonce to nemáme ani jak otestovat. Momentálně jsme ve velkém evropském projektu, kde je i devět různých policejních složek. Doufali jsme, že nám dají data třeba z uzavřeného případu, který prošel soudy, ale prdlajs!

Když nemáte tréninkové odposlechy, čím své stroje „krmíte“?

Zkoušíme to sami nasimulovat.

Sami je vyrábíte?

Ano. Zrovna si hrajeme se simulací kriminální sítě inspirované

Tento článek je exkluzivní obsah pro předplatitele Deníku N.

Rozhovory

Česko, Věda

V tomto okamžiku nejčtenější