Deník N – rozumět lépe světu

Deník N

Kde se lidé nejčastěji nakazí covidem? Nový únik „dat“ na to odpovědět nemůže

Ilustrační foto: Adobe Stock
Ilustrační foto: Adobe Stock

Naprostá většina z nás zemře v posteli. Vyhýbejte se posteli, budete dlouho živi! Nesmysl? Ano, ale právě tak mylná je většina závěrů, jež zdánlivě vyplývají z úniku „dat“ o tom, kde se nakazilo kolik lidí.

Informace, které jako první ve středu zveřejnil server Echo24 a po něm některá další média, vzbuzují pozornost plným právem. Otázka, které činnosti jsou v době epidemie rizikové a které méně, ve kterých prostředích se nákaza nejvíce šíří a která jsou relativně bezpečné, je nejen správná; je naprosto zásadní.

Kdybychom na ni znali spolehlivou odpověď, mohli bychom se všichni chovat odpovědněji, a přitom se nezbavovat aktivit, které nejsou z epidemiologického hlediska rizikové. Tak například šíření nákazy ve školách vypadá podle zveřejněných údajů jako téměř zanedbatelné. Položky „hromadná/společenská akce“ a „dovolená/rekreace“ taky skoro nestojí za řeč. K čemu tedy lockdown?

Abychom byli konkrétní: kumulativně se podle zveřejněných údajů od začátku března do 17. října 38,9 % všech pozitivních nakazilo na pracovišti, 21,8 % doma (ale pozor: tato kategorie se přesně jmenuje „rodina, domácnost, volný čas“). Na položku „běžné aktivity bez upřesnění“ připadá 14,5 % infekcí a na „neznámo“ 23,9 %. To je dohromady 99,1 %.

Základní školy se naproti tomu podílejí na počtu nákaz ze 4,8 %, střední 2,6 % a vysoké 1,7 %, hromadné akce přispívají jedním procentem a dovolené 0,8 %. Součet příčin přesahuje sto procent, protože dotazovaní mají možnost uvést víc než jeden pravděpodobný zdroj nákazy.

Jsme si vědomi vážnosti zhoršující se situace s epidemií koronaviru a naší absolutní prioritou je přinášet spolehlivé a ověřené informace. Většina obsahu o covidu je k dispozici zdarma v části Minuta N nebo v podcastech Studia N. Rozhodli jsme se také odemykat vybrané články o koronaviru. Budeme rádi, když naši práci podpoříte předplatným, abychom vám mohli dlouhodobě poskytovat kvalitní informační servis.

Začněme od uvozovek

ÚZIS sám v reakci na únik upozornil, že jeho sdělení je zavádějící. To se sice říkává v podobných situacích běžně, tady však jde o přiměřenou a výstižnou reakci.

Především je třeba říci, že to, co uniklo z ÚZIS do médií, opravdu nejsou data, ale „data“. Přesněji řečeno, je to interpretace dat, informace, u níž je způsob jejího odvození právě tak podstatný jako samy výchozí údaje.

Jak vypadají skutečná data, tedy surovina, z níž únik vzešel? Pocházejí z rozhovorů pracovníků hygienické služby s osobami, jimž vyšel pozitivní test – z rozhovorů, které probíhají při trasování.

Nejde tedy o informaci, kde se lidé nakazili, ale kde si myslí, že se nakazili (a ještě přesněji: co z toho, co si o tom myslí, jsou ochotní sdělit hygienikovi). Jen málokdo si ostatně může být zcela jist, kde a od koho se nakazil. Když žijete víceméně normálním životem ve městě – chodíte do práce, nakupovat, jezdíte hromadnou dopravou –, pak ani při sebelepší vůli nemůžete předložit víc než více či méně pravděpodobnou domněnku. Samozřejmě, jestliže z domova nevystrčíte nos a váš rodinný příslušník onemocní, je to něco jiného. Data o původu nákazy se tedy liší co do spolehlivosti od velmi jistých po velmi nejistá.

Dále o nich můžeme říci, že zachycují jen ty, kdo byli testováni a následně absolvovali důkladný trasovací pohovor. S naprostou jistotou lze tvrdit, že nakažených je mnohem více, než odpovídá velikosti této skupiny, a to zejména v posledních několika týdnech. Výrazně nepodchycenou skupinou jsou právě školní děti, které se až na nečetné výjimky už vůbec netestují.

Příliš mnoho neznáma

Kategorizace způsobu nákazy je dalším problematickým bodem. „Rodina, domácnost, volný čas“ je velice univerzální šuplík. Spadají do něj návštěvy přátel? Společná cesta na nákup? (Obchody a služby se vůbec nevyskytují jako samostatná kategorie, hromadná doprava také ne.) Návštěva kina? A pár piv v hospodě s přáteli, to je přece také volný čas, nebo ne? Zde nám data nestačí; potřebovali bychom znát také přinejmenším pravidla dotazování a metodiku kategorizace, to ovšem z ÚZIS ani odjinud zatím neuniklo.

Obsáhlá kategorie „běžné aktivity bez upřesnění“ a „neznámo“ ukazuje (podle očekávání), že nejistota v určení původu nákazy je velká a že lidé pravděpodobně dost často nechtějí na takovou otázku vůbec odpovídat – lze si představit mnoho důvodů, proč tomu tak je.

Při pohledu na zveřejněné tabulky a grafy lze konstatovat očividné: lidé se nejčastěji nakazí tam, kde pobývají nejvíce, tedy doma a v práci.

S tím se nedá příliš polemizovat, ale také se z toho nedá odvodit mnoho užitečných závěrů. Doma být musíme, v práci většina z nás také. Domovy a pracoviště jsou z hlediska viru ideální místa – je to pod střechou, je tam hodně lidí, ti spolu tráví hodně času, jsou v těsném kontaktu a nepoužívají ochranné pomůcky.

Závěry nelze učinit

Jiná věc je, odkud se tam nákaza dostane; kde se nakazil ten člověk, který ji tam zanese jako první. To je z epidemiologického hlediska důležitější informace, protože je nesamozřejmá. Pobyt doma a v práci samozřejmý je.

Procenta nakažených by byla vypovídající o něco více, kdyby se přepočetla přinejmenším podle počtu osob, které se v jednotlivých „škatulkách“ vyskytují; lépe podle průměrného počtu hodin za měsíc, po které tam pobývají; a vůbec nejlepší by bylo brát ještě v úvahu, jaká je v které situaci apriorní pravděpodobnost přenosu.

Názor, který teď obíhá sociálními sítěmi – že se neměly zavírat školy a tlumit další aktivity, neboť z „dat“ plyne, že nejde o významná místa nákazy –, je naprosto mylný.

Ale pozor, ze zveřejněných údajů neplyne ani opak, tedy ospravedlnění lockdownu. Jsou to skutečně jen zavádějící čísla s malou výpovědní hodnotou.

To neznamená, že stejnou vlastnost nutně mají i zdrojová data. Statistické metody dovedou pracovat s daty obsahujícími šum a chyby, ostatně právě to je hlavní pracovní náplní všech statistiků a obzvláště pak biostatistiků. Je klidně možné, že kvalitním zpracováním trasovacích pohovorů by se daly získat přímo použitelné znalosti.

Líbí se vám článek Deníku N? Pokud nechcete přijít o ty další, objednejte si do mailu některý z našich přehledů, které pravidelně posíláme. Vybrat si můžete na této stránce.

Musela by to však být skutečně surová zdrojová data, nikoli ty údaje, které se dostaly přes média na veřejnost. Z těch sebelepší statistik nevykouzlí nic – ze stejného důvodu, z jakého nejde z omelety získat zpět syrová vejce. Zásadní význam by například mělo propojit jednotlivé odpovědi se základními údaji o té které dotazované osobě: věk, pohlaví, profese, převažující styl života v předpokládané době nákazy. Z toho se dalo například nejspíš poznat, jak účinný je přechod na home office.

Celou dobu mluvíme jen o souhrnných údajích za celou dobu epidemie. Zveřejněny však byly časové řady od března do října. To je nejzajímavější část; s velkou opatrností se z ní dá například usoudit, jak zabralo které vládní opatření. I k tomu je však zapotřebí zevrubná analýza skutečných výchozích dat.

Zůstaňte v obraze a sledujte nejčerstvější informace kolem koronaviru na jednom místě.

Koronavirus

Odemčeno o koronaviru

Česko, Věda

V tomto okamžiku nejčtenější