0:00
Prawa autorskie: Jakub Wlodek / Agencja GazetaJakub Wlodek / Agenc...
11 października 2020

Statystycy pomagają walczyć z COVID-19. Co można wyczytać z dotychczasowych danych?

Każdy z nas może w kilka sekund sprawdzić, jakie jest szacunkowe prawdopodobieństwo, że w razie zakażenia koronawirusem trafi do szpitala albo umrze. Statystycy z grupy MOCOS przygotowali kalkulator ryzyka dla mieszkańców Polski. Czy przekona lekceważących niebezpieczeństwo?

Wydrukuj

MOCOS [MOdeling COronavirus Spread] to grupa skupiająca naukowców różnych uczelni, a nawet krajów, założona przez prof. Tylla Krugera z Politechniki Wrocławskiej.

O ocenie indywidualnego ryzyka COVID-19, które można łatwo sprawdzić na stronach grupy MOCOS, opowiada OKO.press dr hab. Przemysław Biecek, profesor Uniwersytetu Warszawskiego i Politechniki Warszawskiej. Wystarczy wejść na stronę grupy MOCOS i kliknąć w zakładkę Ocena Ryzyka Indywidualnego.

Statystycy przygotowując aplikację wykorzystali szczegółowe dane MOCOS-u dotyczące 30 tys. osób z Polski, u których potwierdzono zakażenie wirusem SARS-CoV-2. W czasie pracy nad aplikacją była to mniej więcej jedna trzecia wszystkich osób zdiagnozowanych z koronawirusem w naszym kraju.

Naukowcy użyli algorytmów uczenia maszynowego, przy pomocy których na podstawie morza liczb, jakimi dysponowali, dało się wskazać najważniejsze czynniki potrzebne, by oszacować indywidualne ryzyko ciężkiego przejścia choroby.

„W modelowaniu wykorzystaliśmy dodatkowo algorytmy wyjaśnianego uczenia maszynowego, które pozwalają na uzupełnianie predykcji modelu przez szczegółowe wyjaśnienia głównych przyczyn stojących za predykcjami” – tłumaczy dr hab. Przemysław Biecek. „Obszar wyjaśnianego uczenia maszynowego to szybko rozwijająca się i ważna gałąź analizy danych” – dodaje naukowiec.

Aplikacja pyta nas tylko o trzy dane: wiek, płeć i obecność lub brak chorób towarzyszących. Do chorób tych należą przede wszystkim nadciśnienie, cukrzyca, choroba nowotworowa i przewlekłe choroby płuc.

Naukowcy przygotowujący narzędzie nie dysponowali wystarczająco szczegółowymi danymi na temat konkretnych schorzeń, na jakie cierpieli polscy pacjenci. Dlatego zdecydowali się uwzględnić wyłącznie obecność lub brak dowolnej z wymienionych wyżej chorób. Jeśli ktoś z nas choruje np. na astmę oskrzelową, a więc schorzenie dotyczące bezpośrednio układu oddechowego, lepiej jednak wybrać odpowiedź „tak” w rubryce „choroby towarzyszące”.

Jak nietrudno przewidzieć, obecność jednej z chorób jest mniej groźnym predyktorem niż dwóch czy trzech naraz (cukrzyca występuje często w parze z nadciśnieniem), aplikacja jednak tego nie uwzględnia.

Moje własne ryzyko

Mam prawie 65 lat i od dziecka choruję na astmę. Dlatego też w moim przypadku prawdopodobieństwo hospitalizacji w razie zdiagnozowanego zakażenia wynosi aż 59,3 proc., a ryzyko zgonu 14,1 proc.

Prawdę mówiąc nie sądziłem, że te wartości będą aż tak wysokie. Od początku pandemii staram się bardzo uważać, ale odwiedziny na stronie MOCOS uświadomiły mi dobitnie, że w moim przypadku to nie przelewki.

Sprawdziłem jeszcze wynik dla Donalda Trumpa i jego żony. Trump liczy 74 lata i cierpi na nadciśnienie, zatem płeć męska, 74 lata i choroby towarzyszące dają wynik: prawdopodobieństwo hospitalizacji 72,1 proc., zgonu 22,2 proc.

Zupełnie inaczej wygląda to w przypadku jego żony, która liczy 50 lat i zakładamy, że nie ma chorób towarzyszących. Ryzyko trafienia do szpitala 13,7 proc., zgonu 0,2 proc.

„Na stronie MOCOSU widać z prawej strony dwie krzywe obrazujące zależność oszacowanej śmiertelności od wieku (w pomarańczowej obwódce) i warunkowej hospitalizacji od wieku (obwódka zielona)” – mówi dr hab. Przemysław Biecek.

„Widać wyraźnie, że wśród osób do 50 roku życia ryzyko zgonu jest bardzo niskie. Zdarzają się wprawdzie pojedyncze zgony, ale procent umierających na COVID poniżej pięćdziesiątki jest bardzo, bardzo niski. Ryzyko to szybko rośnie po 60 roku życia., a po 75 jest już naprawdę wysokie.”

Podobnie jest z hospitalizacją – do pięćdziesiątki ryzyko, że trafimy do szpitala jest nieznaczne, ale spośród starszych osób już blisko połowa trafia do szpitala. Uwaga – na wykresach uwzględniona jest tylko jedna zmienna, tj. wiek. Płeć męska, a zwłaszcza obecność chorób towarzyszących wyraźnie podnoszą wartości ryzyka.

Analiza zgonów w Europie

Inna ciekawa analiza, jaką wykonał zespół dr hab. Biecka dotyczy tego, do jakiego stopnia zgony z powodu COVID-19 zmieniły w tym roku statystyki umieralności w kilkunastu wybranych krajach na świecie. W tym celu naukowcy porównali dane z lat 2000-2020 (szare nakładające się krzywe) z tegorocznymi zgonami w ujęciu tygodniowym przypisane i nieprzypisane COVID-owi.

„Czerwona linia na tych wykresach to linia zgonów w ciągu tygodnia w roku, zaś bladoczerwony pasek to zgony raportowane jako te, wywołane przez COVID” – tłumaczy dr hab. Biecek.

Uwaga - na wykresie pokazano tylko wybrane kraje.

W niektórych krajach takich jak Belgia, Holandia, Włochy, Francja, Hiszpania widać wyraźny pik zwiększonej umieralności na wiosnę 2020. W innych takich jak Polska, Dania, Węgry, Estonia, Słowenia tegoroczny wykres nie odbiega od tego, co działo się w poprzednich 20 latach. Co ciekawe, we Włoszech zgony przypisane COVID-owi to tylko pewna część piku śmiertelności. Jego dolna część pozostaje biała, a to oznacza, że wiele dodatkowych zgonów w tym okresie nie było bezpośrednio związanych z zakażeniem koronawirusem.

Podobny efekt zaobserwowano w Hiszpanii i Holandii. Być może chodzi tu o brak dostępu do łóżek szpitalnych lub zmniejszony dostęp do procedur medycznych lub większy strach przed udaniem się na planowany zabieg. Statystyk nie chce tych danych interpretować, pozostawia to znawcom systemów opieki zdrowotnej w poszczególnych krajach.

Ciekawy wykres dotyczy Francji. Widać na nim wyraźny szary pik zwiększonej śmiertelności z 2003 roku, związany z falą upałów, która zebrała w tym kraju okrutne żniwo.

„W Polsce na razie nie widać w ogóle tego paska zgonów wywołanych przez COVID” – podkreśla dr hab. Biecek. „Co prawda powoli zbliżamy się do takich lokalnych maksimów z lat ubiegłych, ale wciąż nie są to takie skoki jak w innych krajach i oby tak było dalej” – dodaje naukowiec.

„Dane dotyczące Polski w bazie mortality.org, z której korzystamy, niestety urywają się znacznie wcześniej niż w innych krajach, ale do czerwca sytuacja w naszym kraju była dobra.”

Obecnego wzrostu ilości zgonów dr hab. Biecek nie chce komentować. „Interpretacje wyników pozostawiam specjalistom zajmującym się służbą zdrowia. Ja jestem tylko prostym statystykiem, który opracowuje pozyskane dane.”

Gdzie zdarzają się zachorowania?

„Sprawdziliśmy, gdzie mieszkają osoby, u których wykryto zakażenie” – opowiada autor badania. „Warto zwrócić szczególnie uwagę na dwa obrazki: duże miasto (powyżej 100 tys. mieszkańców) i wieś.”

Okazuje się, że są one komplementarne. Na początku epidemii stosunkowo wielu zakażonych stanowili mieszkańcy dużych miast (ok. 30 proc.). Teraz ich liczba spadła do 10 procent. Tymczasem na wsiach jest odwrotnie.

„Choroba początkowo obejmowała duże aglomeracje, gdzie oczywiście jest znacznie więcej kontaktów, ale teraz rozlała się już po całym kraju i struktura zakażeń przypomina strukturę, gdzie ludzie po prostu mieszkają.”

Innymi słowy zakażenia nie skupiają się w kilku dużych centrach, tylko rozprzestrzeniły się na bardzo wiele miejsc.

Czy katar to COVID?

Statystycy zajęli się również kwestią symptomów, jakie towarzyszą chorobie COVID-19. No bo np. czy katar jest objawem zakażenia koronawirusem, czy nie? Powszechnie uważa się, że nie. Że COVID to kaszel, a katar to przeziębienie.

Sprawdzono też czy częstość występowania poszczególnych symptomów zmienia się z wiekiem i uzyskano tu bardzo ciekawe zależności.

objawy COVID-19

Okazuje się np., że utrata smaku, dość rzadki (stwierdza się go u ok. 4 proc. zdiagnozowanych), ale istotny objaw, występuje zazwyczaj u ludzi młodszych, w wieku 25-50 lat. Dlatego taka właśnie reakcja na zakażenie SARS-CoV-2 zmniejsza ryzyko śmiertelności na COVID.

„W naszej bazie nie znaleźliśmy nikogo, kto zgłaszałby symptomy utraty smaku a później by umarł” – mówi dr hab. Biecek.

Również katar, ból gardła, a także bóle mięśni są znacznie częściej raportowane przez osoby stosunkowo młodsze. Z kolei duszność to typowy objaw w przebiegu COVID-19 u osób starszych.

Mapa objawów COVID-19

Analizując symptomy choroby wywoływanej przez koronawirusa naukowcy doszli specjalnych map obrazujących ich związek ze śmiertelnością i hospitalizacją.

„Cechy, które obserwujemy wśród osób zakażonych przedstawione są tu na dwóch osiach - częstość i dotkliwość” – tłumaczy dr hab. Biecek. „Dotkliwość oznacza jak bardzo zwiększa się ryzyko śmierci, a częstość jak częsta jest konkretna cecha/objaw” - dodaje.

Bycie mężczyzną to częsta cecha, ponieważ połowa chorych to mężczyźni. Gorączka, kaszel też występują często (widać je z prawej strony rysunku), ale mają małą dotkliwość (leżą niewysoko ponad linią poziomą). Podobnie ryzyko zgonu w przypadku biegunki czy dreszczy jest relatywnie niskie, a utrata smaku – wręcz go obniża (jest położone wyraźnie poniżej linii poziomej).

„Trzy cechy, która nas najbardziej niepokoją, to obecność chorób współistniejących, bo jest dosyć częsta i bardzo dotkliwa, wiek powyżej 65 lat, bo to też bardzo częsta i dotkliwa cecha, wreszcie duszność – częsta i dotkliwa.

Są też cechy dotkliwe, ale rzadkie (np. zmiany w RTG) i w końcu częste, ale niedotkliwe jak ogólne osłabienie.”

„Uwaga - choroby współistniejące i starszy wiek zwiększają bardzo wyraźnie ryzyko zgonu. – I tu nie chodzi o zwiększenie dwu- czy trzykrotne, ale 20-sto, a nawet 30-stokrotne” – ostrzega naukowiec.

„Młody mężczyzna, młoda kobieta nie mają powodu by obawiać się szybkiej śmierci, choć oczywiście nie powinny tej choroby lekceważyć, ponieważ jest bardzo podstępna i wciąż ryzykują poważnymi powikłaniami. Ale osoby starsze powinny naprawdę na siebie uważać.”

Naukowcy stworzyli też podobną mapę dla hospitalizacji. Jest ona bardzo podobna do poprzedniej – decydujące znaczenie mają tu również wiek, duszność i obecność innych chorób.

Wciąż nie mamy danych

Mapy te szef zespołu MOCOS - prof. Tyll Krueger wysłał do Ministerstwa Zdrowia z nadzieją, że przydadzą się zarówno osobom, które organizują opiekę nad chorymi na COVID w Polsce, jak i samym lekarzom.

Dr hab. Przemysław Biecek zwraca uwagę na inny, społeczny wymiar epidemii koronawirusa. Nagłe zagrożenie zwiększyło nasze zapotrzebowanie na analizy oparte o twarde dane. Społeczeństwo zaczęło się interesować się danymi i hurtowo zaczęło wnioskować na ich podstawie.

„Bo do tej pory mówienie o danych, o potrzebie odpowiedzialnych analiz i dobrych wizualizacji, nie trafiało do szerokiego odbiorcy. Poza wąskimi grupami specjalistów nie było widać zapotrzebowania na analizę danych. Królowało wnioskowanie oparte o intuicje, opinie lub wiedzę domenową” – uważa naukowiec.

„Szeroko rozumiany zwykły obywatel wcześniej nie miał potrzeby ilościowej analizy czegokolwiek. A tymczasem nagle w mainstreamowych mediach zaczęły pojawiać się wykresy, tabele, duże liczby. Była więc wielka szansa, że zaczniemy, także w Polsce, ilościowo patrzeć na różne sprawy. Niestety, wydaje się, że ta szansa nie została wykorzystana.”

„To, że Ministerstwo Zdrowia informuje o liczbie zachorowań poprzez Twittera a potem hobbyści muszą spisywać te dane do rozproszonych, nieoficjalnych i często nie weryfikowanych bazy danych, w XXI wieku to jest strasznie dziwne” – mówi dr hab. Biecek. „Nie mamy jeszcze rozwiniętej dojrzałości cyfrowej, żeby te dane zbierać i udostępniać w sposób pozwalający na szerokie wykorzystanie i automatyczne przetwarzanie. W obszarze cyfrowej dostępności danych sytuacja w Polsce nie jest zbyt dobra” – ubolewa.

„Im więcej wiedzielibyśmy o strukturze zakażeń, w domostwach czy w innych kontaktach, tym więcej moglibyśmy powiedzieć o tej epidemii. Staram się to powtarzać przy każdej okazji. Chciałbym publicznie krzyknąć: Aby efektywnie walczyć z tym kryzysem potrzebujemy zbierać możliwie dużo danych oraz ułatwiać badaczom dostęp do tych baz. Od początku pandemii w Polsce minęło sześć miesięcy, a przez ten czas wciąż nie mamy szeroko dostępnych, szczegółowych, spójnych i walidowanych repozytoriów danych. To powinno się zmienić” – apeluje statystyk.

„Ciemna liczba” zakażeń

Często zastanawiamy się nad tym, jaka jest prawdziwa liczba osób zakażonych koronawirusem w Polsce. Naukowcy z MOCOSy pokusili się o statystyczną ocenę owej „ciemnej liczby” niewyłowionych przez testy przypadków. Brali pod uwagę między innymi wielkość domostw, liczbę zakażeń w rodzinie mieszkającej pod jednym dachem, ilość osób, które się ciężko rozchorowały, itd. Analizy prowadzili na podstawie danych z połowy lipca, gdy w kraju mieliśmy ok. 41 tys. przypadków potwierdzonych badaniem PCR.

Z uwagi na dostępność danych udało im się opracować dosyć szeroki przedział – oficjalną liczbę zakażonych trzeba przemnożyć minimalnie przez 2, maksymalnie przez 10.

Jeśli więc w Polsce od początku epidemii stwierdzono łącznie 111,5 tys. zakażeń [według danych z 9 października], oznacza to, że według najbardziej optymistycznego scenariusza zakaziło się 1,115 mln obywateli. To nadal zdecydowanie za mało, by jako społeczeństwo osiągnąć odporność zbiorową.

Wszystkie omówione w artykule analizy zostały wykonane na podstawie danych dostępnych dla grupy MOCOS.

Udostępnij:

Sławomir Zagórski

Biolog, dziennikarz. Zrobił doktorat na UW, uczył biologii studentów w Algierii. 20 lat spędził w „Gazecie Wyborczej”. Założył tam dział nauki i wypromował wielu dziennikarzy naukowych. Pracował też m.in. w Ambasadzie RP w Waszyngtonie, zajmując się współpracą naukową i kulturalną między Stanami a Polską. W OKO.press pisze głównie o systemie ochrony zdrowia.

Komentarze

Komentarze będą wkrótce dostępne