Deník N – rozumět lépe světu

Deník N

Skutečný počet nakažených jen odhadujeme. Prověříme, kolik je otestovaných, říká tvůrce českých modelů vývoje nemoci

Velkým rozdílem proti jarní vlně koronaviru je, že se víc testuje. Foto: Gabriel Kuchta, Deník N
Velkým rozdílem proti jarní vlně koronaviru je, že se víc testuje. Foto: Gabriel Kuchta, Deník N

Je jedním z mozků, které vytvářejí modely očekávaného vývoje onemocnění Covid-19 v Česku. Epidemiolog Ondřej Májek z Ústavu zdravotnických informací a statistiky v rozhovoru pro Deník N vysvětluje, jak se počítá často diskutované reprodukční číslo R, které vypovídá o rychlosti šíření nemoci. A potvrzuje, že skutečný počet nakažených i testovaných není známý.

Jako zdravotničtí statistici očekáváte na konci dubna 14 200 laboratorně potvrzených případů nemoci Covid-19. Jak vaše modely propočtů a odhadů vznikají?

Jsou konečným výstupem poměrně velkého informačního systému pro sledování infekčních nemocí, který jsme během jednoho týdne upravili pro potřeby sledování onemocnění Covid-19 a nadále jej rozvíjíme. Začíná u sběru dat v laboratořích a krajských hygienických stanicích.

Tam případy onemocnění podrobně popisují, bez nich bychom byli slepí. Nastavení sběrů obnáší složitá jednání s ministerstvem a s dalšími – musíme najít rovnováhu mezi naší potřebou mít robustní data a mezi tím, abychom nepřetížili pracovníky laboratoří.

Když máme data částečně odprezentovaná a věříme jim, můžeme přistoupit k modelování. Začínáme s relativně malým datovým souborem a snažíme se z něj vytáhnout hodně informací, takže je modelování složité. Aby měly modely smysl, musíme například vědět, jak dlouhá je inkubační doba viru, tedy doba od nakažení k prvním příznakům.

To je ale ošemetné, protože ta doba má poměrně široký rozptyl, zhruba od pěti do čtrnácti dnů.

Ve finále jsme se v našem modelu přiklonili k šesti dnům, v souladu se vzorovými modely a průměrem z odborné literatury.

Pak do modelu začneme vkládat data a začnou nám z něj padat proměnné, které nejsou na první pohled pozorovatelné. Na konci je nejambicióznější část – predikce do budoucnosti.

Stojíte v čele týmu zodpovědného za modely, s kolegy se díváte i do zahraničí. Jaký předobraz následujeme?

První publikované modely vycházely ze studie pasažérů výletní lodi nebo z čínských dat. Ta byla na začátku epidemie nejdostupnější. Jsou to studie z konce února, kdy ještě data z Evropy neexistovala.

Když nyní vyšlo najevo, že čínská data nejsou důvěryhodná, odklonili jste se od původního modelu?

Od modelu ne. Byl postaven na čínských datech, ale publikovali jej odborníci spíše ze Západu. Třeba model z února, na který právě koukám, připravili kolegové z Londýna.

Modely nejsou úplně nově vyvinuté, odrazili jsme se od těch, které tu byly pro epidemie SARS nebo ptačí chřipky. Parametry, jak se chová konkrétní onemocnění, se mění. Srovnání aktuálního koronaviru se SARS ze začátku tisíciletí ukazuje, že dochází k posunům choroby a data musíme postupně aktualizovat podle toho, co víme o novém koronaviru.

Zdroj: ÚZIS ČR

V čem je tato choroba pro vytváření modelů zrádnější než dřívější epidemie?

Situaci komplikuje fakt, že mnoho dat ukazuje, že choroba je infekční před propuknutím příznaků. Lidé, kteří nemají příznaky, se v současném nastavení systému většinou netestují, přitom mohou nemoc roznášet. Ale míra infekce před a po vypuknutí příznaků je ještě předmětem studií.

Jak s tím tedy pracujete ve svých modelech?

Počítáme s šestidenní inkubační dobou a s tím, že zhruba od poloviny této doby je člověk infekční. Pokud bychom tuto hodnotu pozměnili, promítlo by se to do odhadu šedé zóny. Tedy lidí, kteří už jsou nakažení, ale ještě o nich nevíme. Každý neviditelný, přímo nesledovatelný parametr onemocnění se může promítnout do takových populačních charakteristik, jako je třeba počet infikovaných, ale bezpříznakových jedinců.

Kolik takových lidí podle vašich modelů a dat aktuálně v populaci máme?

To je složitá otázka, protože to není věc, kterou můžeme přímo pozorovat. Podle dat, která máme aktuálně k dispozici, to vypadá, že nezachycených případů by mohlo být přibližně 2000. Ale musíme si uvědomit, že je to něco, co dokážeme odhadnout jen s velkou neurčitostí, protože je to spjato s nepozorovatelnými charakteristikami choroby.

Zatím víme, že náš model nám poměrně slušně předpověděl odhad nakažených lidí z konce března. Takže máme za to, že klíčové parametry našeho modelu byly aspoň trochu ověřeny. Byly by ale potřeba další vědecké studie, které by ověřily podíl bezpříznakových případů, nebo zjistily, jaká je nakaženost jedinců v populaci. Modely nejsou všemocné a s tím, jak měníme parametry, se nám může také změnit odhad aktuálně neidentifikovaných nakažených lidí.

RNDr. Ondřej Májek, Ph.D. (1985)
Vystudoval Přírodovědeckou fakultu Masarykovy univerzity v Brně. Věnuje se populačním modelům v epidemiologii, hodnocení zdravotnických technologií a preventivním programům v onkologii. Je vedoucím týmu Institutu biostatistiky a analýz Lékařské fakulty Masarykovy univerzity. Působí jako vedoucí odboru zahraničních vztahů Ústavu zdravotnických informací a statistiky a vědecký šéf Národního koordinačního centra prevence vážných onemocnění.

Hojně se teď mluví o možnosti otestovat v Česku reprezentativní vzorek populace, abychom zjistili, jaká je skutečná promořenost společnosti. Jak by to pomohlo větší přesnosti modelu?

Určitě by to bylo užitečné, protože podíl případů, které mají relativně mírné nebo žádné příznaky, je předmětem předpokladů – třeba těch 10 %, které používáme po vzoru kolegů z Londýna my. Vycházejí také studie, které zatím neprošly řádným recenzním řízením, ale obsahují zajímavé informace. Jedna z nich je, že podíl bezpříznakových by mohl být větší.

Mluvím o plánu protestovat v Česku část populace, náměstek ministra zdravotnictví Roman Prymula mluvil o vzorku 5000 lidí, virolog Pavel Plevka navrhoval něco podobného. Jaký typ testování by byl pro vás vhodný?

Pokud jsme schopni tímto způsobem u lidí zjistit, kolik z nich, byť bezpříznakových, už v sobě má virus, může nám to udělat trošku jasno v některých parametrech. Ale o tom, že by něco takového vzniklo, mám informace jen z médií. My se věnujeme až analýze populačních dat.

Dokážete z modelu vyčíst, jak aktuální opatření pomohla zmírnit šíření infekce? Jak třeba pomohlo omezení volného pohybu?

Kdybychom žili v trochu jiném světě a měli čas dělat studie, které by nám to řekly přesně, mohli bychom rozdělit populaci na dvě části a u každé vyzkoušet něco jiného. Pak bychom dostali přesnější představu o efektu opatření.

Nedokážeme přesně říct, jaký je efekt toho kterého opatření, ale víme, kdy byla opatření zaváděna, a podle toho umíme říct, zda nám pomohla zpomalit rychlost šíření nemoci. To nám říká to často diskutované reprodukční číslo: tedy kolik lidí jeden nakažený člověk každý den infikuje.

Začínali jsme s reprodukčním číslem pohybujícím se mezi hodnotou 2 a 3, což odpovídá i zahraničním datům pro chorobu. Se zaváděním opatření se rychlost šíření zpomalovala tak, že jsme se dostali na hodnotu reprodukčního čísla pod 2, s nouzovým stavem na hodnotu pod 1,5.

A co se týče omezení volného pohybu lidí?

Myslíme si, že se nám podařilo se po jeho zavedení relativně přiblížit k jedničce. To je v epidemiologii reprodukčních chorob zásadní číslo. Pokud se pod něj dokážeme dostat, je možné chorobu zcela zastavit. Nám to vyšlo o něco víc než jedna, což znamená, že choroba by se zcela nezastavila, ale počet případů, které budou každý den diagnostikovány, zůstane na stabilní trajektorii.

To je situace, které se snažíme docílit, abychom explozivním nárůstem případů nepřetížili kapacitu intenzivní akutní lůžkové péče. To je teď hlavní cíl ochranných opatření.

Co nás čeká

Podle ředitele Ústavu zdravotnických informací a statistiky Ladislava Duška bude v optimistickém scénáři v polovině dubna 5600 případů nákazy a na konci měsíce 7200. V případě horšího vývoje půjde o 12 300 případů v polovině měsíce a zhruba 30 000 na konci. „I toto číslo by český zdravotní systém měl zvládnout,“ řekl Dušek.

Před týdnem statistici prezentovali, že nemocnice zvládnou 33 000 nakažených v případě, že hospitalizována bude muset být asi desetina z nich. Předseda České společnosti anesteziologie, resuscitace a intenzivní medicíny Vladimír Černý ve středu řekl, že problémy by mohly nastat na hranici kolem 45 000 nakažených.

Nyní podle Duška stráví asi 13 procent nemocných část léčby v nemocnici, dosud jich bylo zhruba 400. Čtvrtina z nich potřebuje intenzivní péči. Lékařů intenzivní péče je v Česku asi 4000, sester 15 500. Lůžek na odděleních intenzivní péče (JIP) je kolem 4450, plicních ventilací mají k dispozici 2080.
Zdroj: ČTK

Jak přesně tedy počítáte aktuální reprodukční číslo? Ohlásili jste, že je v rozsahu 0,87 až 1,32. Proč je rozptyl tak široký?

To ještě není tak široké rozpětí. Pan profesor Dušek přirovnával to základní reprodukční číslo svou popularitou k aritmetickému průměru, ale problém je, že když dostanete data, je mnohem jednodušší spočítat aritmetický průměr než základní reprodukční číslo. Protože to číslo je jen jedním z parametrů relativně složitého modelu, který v sobě zahrnuje všechny vstupy, výstupy, vztahy, jak choroba postupuje.

Je to jen odhad. Není možné si myslet, že z dat, která máme, to vypočítáme úplně přesně. Povšimněte si ale, že zatímco na první pohled neurčitost R je v relativně rozumných mezích, neurčitost výsledku je poměrně výrazná.

Epidemiolog Ondřej Májek. Foto: ÚZIS

Co to znamená?

Když zvedneme reprodukční číslo z 1,1 na 1,3, počet očekávaných diagnostikovaných případů na konci dubna nám stoupne ze 14 tisíc na 30 tisíc. Protože se model nechová lineárně. Bavíme se tady o matematickém modelu, který nám může pomoci pochopit, jak choroba funguje a jak se šíří v populaci. Ale výhledy je třeba brát s rezervou. To jsme se snažili zdůraznit i odhadem, jak se může neurčitost v reprodukčním čísle projevit na výsledcích.

Platí, že jste k číslu 1,1 došli tím, že jste model upravili podle aktuálních dat?

Ano, říká se tomu rekalibrace modelu na nová data. To znamená, že se snažíme maximálně využít dat, která máme k dispozici, a může dojít k částečným posunům v hodnotách parametrů. Cílem je mít data co nejlépe popsaná, abychom je s jistou rezervou mohli použít i pro predikce.

Takže snížení na aktuálně odhadované číslo souvisí s daty, která přicházejí z testování?

Přesně tak. Když se podíváte na portál Onemocnění aktuálně, vidíte, jak se vyvíjí časová řada potvrzených případů. To jsou data, ze kterých vycházíme při odhadování parametrů modelu. R je funkce vstupních dat, zejména z posledních dní. Reprodukční číslo se může projevit na datech až se zpožděním. To je dáno hlavně inkubační dobou, která není zanedbatelná, i nástup symptomů trvá pár dní.

Šestnáctého března byl zaveden omezený pohyb obyvatel a trvá víc než týden, než začnou přicházet data ovlivněná tímto opatřením. A dalších pár dní trvá, než můžeme potvrdit, že to bylo způsobeno opatřením a nejedná se o šum, kterého v systému může být také hodně.

Ve středu na tiskové konferenci zaznělo, že v mezinárodním srovnání máme velkou míru testování. Jenže pro ilustraci použil ministr zdravotnictví Adam Vojtěch graf, kde srovnával počet testů ke 30. 3. s daty o počtech provedených testů v ostatních státech ke 20. 2. Proč se s ostatními státy nesrovnáváme ke stejnému datu?

Máte pravdu, ten obrázek byl spíš pro demonstraci obecného vztahu, že počet prokázaných případů má souvislost s počtem provedených testů, což se na mezinárodních datech ukazuje. Ale problém je v dostupnosti mezinárodních dat.

V naší prezentaci byl citovaný poměrně zajímavý datový zdroj – Our World in Data. Ten ale není v reálném čase aktualizovaný a v současnosti obsahuje informace k 20. 3, my jsme tam doplnili aktuální data pouze za Česko. Nicméně v prezentaci byl ještě další obrázek (viz níže), kde jsou data pro vybrané státy, kde kolegové aktualizují výsledky z průběžných zpráv, které zveřejňují jednotlivé země.

Z toho vyplývá, že pozitivita v Česku je někde uprostřed. Státy, kde se epidemie rozjíždí silněji, což má vliv i na to, jak rychle a široce jsou schopny testovat, mají poměr pozitivních případů vyšší než 10 % testovaných. V Česku je kumulativní poměr pozitivních případů kolem šesti procent. Na druhou stranu víme, že jsou země, které testují agresivněji, využívají testové kapacity šířeji, tam je poměr pozitivních případů o něco nižší.

Zdroj: ÚZIS

Takže kdyby se použila u všech států aktuální data, nedá se říct, že v mezinárodním srovnání testujeme skoro nejvíc.

Každá populace je jinak velká, jinak zasažena chorobou, takže je z mého pohledu potřeba koukat na vztah mezi počtem testů a počtem pozitivních případů, protože absolutní počet je dál výrazně ovlivněný tím, ve kterém datu se na údaje koukáme.

Šlo mi jen o odpověď na otázku, jestli jsme na tom v mezinárodním srovnání v počtu testů tak dobře, jak tvrdil pan ministr, nebo ne.

V odpovědi na tuto otázku nemá moc smysl koukat na absolutní počet testů. Státy jsou jinak velké, zároveň naprosto jinak zasažené i vzhledem ke své velikosti. Informativní údaj je podíl pozitivně potvrzených případů. Když vztáhneme počet testů na počet obyvatel, jsme někde uprostřed.

Ze statistik víme počet provedených testů. Kolik lidí ale bylo v Česku otestovaných? Už jen fakt, že než se člověk do statistik propíše jako vyléčený, obnáší to minimálně dva negativně vyhodnocené testy, zvyšuje rozdíl mezi počtem provedených testů a otestovaných lidí.

Opakovaných testů pro ověření vyléčení bylo doposud relativně málo, protože by se měly provádět až přibližně po dvou týdnech. Ale je pravda, že je potřeba statistiku zpřesnit. Proto vyvíjíme doplňující systém, který by nám toto říkal přesněji.

Takže pro přesnost skutečného stavu i předpovědí potřebujete vědět, kolik lidí prošlo testy, a ne celkový počet testů?

Je to důležitý ukazatel, abychom viděli, jestli máme setrvalý trend udržení testové kapacity a pozitivní trend v podílu potvrzených případů.

O kolik je počet testovaných lidí menší než počet testů? Máme počet testů dělit třemi, abychom se dostali k počtu testovaných?

Myslím že ne. Zejména u retrospektivních dat nám proměnná říká pravý stav, u dat zaměřených na budoucnost musíme myslet na opakované testy. Proto systém ve spolupráci s laboratořemi upřesňujeme.

Kdy bude počet testovaných lidí známý?

Funkční systém by měl být hotov během jednoho až dvou týdnů. Měl by umožnit získání velmi podrobných dat bez zbytečné administrativní zátěže pro laboratoře.

A jaký je tedy váš odhad počtu otestovaných lidí? Náměstek ministra zdravotnictví Roman Prymula jej odhadl na 45 000 lidí. Sedí to podle vašich údajů?

Více než 10 % provedených testů na koronavirus je opakovaných. Číslo se ale dennodenně vyvíjí.

Jaký vývoj nemoci nás tedy nejpravděpodobněji čeká? Kolik lidí se v Česku koronavirem nakazí?

Snažili jsme se prezentovat opatrný scénář (viz níže). Nebrali jsme doslova poslední data, která ukazovala pohyb denního nárůstu nakažených směrem dolů. Jinak by predikce mohla být ještě pozitivnější. Připravili jsme realistický scénář, který předvídá pokračování nemoci, ale s kontrolovaným nárůstem.

Zdroj: ÚZIS ČR

Co bude pro vývoj nemoci rozhodující?

Jestli se podaří udržet sníženou infekčnost. Je důležité co nejvíc ztížit přenos viru z člověka na člověka. Toho lze docílit minimalizací kontaktu mezi lidmi. Tím že budou pokračovat v nošení roušek a ochranných pomůcek, budou používat dezinfekci, dodržovat další hygienická pravidla, budou co nejrychleji po projevu příznaků izolováni, kontakty nemocných lidí budou dodržovat karanténu.

Způsoby, jak vylepšit karanténu nebo otestovat co nejvíc lidí, kteří by mohli být nemocní, mohou být také důležité. S každým dalším dnem, v němž se nemoc nemůže šířit dál, se teoreticky snižuje reprodukční číslo a zpomaluje vývoj epidemie. Důležité je pokračovat v opatřeních a co nejdřív izolovat ty, kteří jsou potenciálně nakažení.

Ale v lepším a širším testování nám brání řada věcí, například nedostatek obyčejných štětiček ke stěrům z nosohltanu a krku.

Bohužel je to součást příběhu. Testová kapacita je důležitým faktorem a země, u kterých se podařilo křivku zploštit, jako třeba Jižní Korea, prováděly testování relativně masivně.

Líbí se vám článek Deníku N? Pokud nechcete přijít o ty další, objednejte si do mailu některý z našich přehledů, které pravidelně posíláme. Vybrat si můžete na této stránce.

Plánujete model vylepšit tak, že by například zkoumal vliv různých opatření? Že byste se ho mohli například zeptat, co by se stalo, kdyby se otevřely školy, kdyby se zrušilo povinné nošení roušek, otevřely se hranice?

To je poměrně obtížné. Můžeme se ptát, co by se stalo, kdyby hodnota reprodukčního čísla byla trošku jiná, ale lepší odhad známe jen ze sekvence opatření, která byla aplikována u nás. Možná poté, co se kolegům ze zahraničí podaří otestovat efekty intervencí, můžeme to samé zkusit aplikovat do našeho modelu.

Spíš ale budeme schopni analyzovat efekt opatření zpětně a do budoucna klást hypotetické scénáře, co by se stalo, kdyby se o něco snížil nebo zvýšil nějaký parametr včetně reprodukčního čísla.

S přispěním Hany Mazancové.

Zůstaňte v obraze a sledujte nejčerstvější informace kolem koronaviru na jednom místě.

Koronavirus

Odemčeno o koronaviru

Rozhovory

Česko

V tomto okamžiku nejčtenější