0:00
24 sierpnia 2020

Ogarniam całą Polskę, Sanepid ma kłopot z powiatem - mówi maturzysta, twórca bazy danych o epidemii

Michał Rogalski właśnie zdał maturę, ale znają go wszyscy, którzy zawodowo lub nie zajmują się epidemią koronawirusa. Jego arkusz „COVID-19 w Polsce" jest najbardziej kompletnym zbiorem danych o epidemii – od poziomu krajowego do rozbicia na powiaty. Wraz z zebranym w sieci zespołem wolontariuszy aktualizuje go na bieżąco.

Wydrukuj

Z arkusza „COVID-19 w Polsce" korzystają politycy, eksperci i Twitterowicze, z których już ponad 8,6 tys. śledzi konto @micalrg.

Michał Rogalski opowiada OKO.press:

  • dlaczego fascynuje się danymi;
  • do czego jego dane mogą się przydać zwykłemu Kowalskiemu;
  • jak pań[restrict_content paragrafy="3"]stwo okazało się zupełnie nieprzygotowane do codziennego raportowania danych o epidemii;
  • które wykresy są w tym wielkim zbiorze najważniejsze;
  • czy czuje się już epidemiologiem-amatorem;
  • i co zamierza robić po maturze.

Miłada Jędrysik, OKO.press: Jak poszła matura?

Michał Rogalski: Dobrze, nawet trochę powyżej oczekiwań.

Gratulacje. I jakie dalsze plany?

Gap year. Potrzebuję tego. Jest mnóstwo rzeczy, do których mnie ciągnie, różne możliwości rozwoju. A studia mi nie uciekną.

Skąd się wzięła u Ciebie taka miłość do danych?

Dane mnie fascynują. Dają mi możliwość w miarę racjonalnego postrzegania rzeczywistości. Impulsem, który zdecydował, że zacząłem tworzyć bazę danych na temat COVID-19 było zdenerwowanie chaosem informacyjnym na początku pandemii. Pojawiało się tyle sprzecznych informacji, że nie było możliwości uzyskania rzetelnej wiedzy na temat tego, co tak naprawdę się dzieje.

Dzięki tej frustracji zacząłem zbierać i publikować dane o epidemii, czyste liczby pozbawione otoczki emocjonalnej. I okazało się, że nie tylko ja, ale bardzo wiele osób potrzebuje czegoś takiego. Więc impuls to jedno, teraz sam fakt, że zaczęła się tworzyć wokół mojej bazy danych społeczność napędza mnie, żeby to kontynuować.

Jak się budowała ta społeczność?

Miejscem, dzięki któremu wszystko zaczęło mieć rozmach i zyskało rozpoznawalność, był Twitter. Jak moje wykresy powoli dotarły do pierwszych dziennikarzy i polityków, to później nic nie musiałem robić, szło samo. Po 2-3 miesiącach miałem już na TT 8 tys. obserwujących, którzy podawali dalej i komentowali, że to jest najlepsze źródło informacji. Społeczność, która się wytworzyła wokół tych arkuszy to ludzie, których kompletnie nie znam, spotkani w wirtualnej rzeczywistości. Dyskutują nad tymi danymi, rozwiązują problemy, tłumaczą, co przedstawiają dane tym, którzy mają trudności z ich zrozumieniem.

Uaktualnianie arkuszy to wielka praca, której teraz już nie robisz sam.

Są też wolontariusze, których zebrałem za pośrednictwem Twittera – od czterech miesięcy dzień w dzień uzupełniają dane powiatowe. Zebranie tych ludzi zajęło mi chyba 15 min. Dzień w dzień, nieodpłatnie, po pracy, siadają do uzupełniania arkuszy ze swoich województw.

Niesamowita jest też ilość analityków, dziennikarzy, czy polityków, którzy korzystają z naszych wykresów.

A także ekspertów od epidemii, widzę, że bardzo szanują to, co robisz.

Wczoraj rozmawiałem z zespołem z Uniwersytetu Mikołaja Kopernika, który chce prowadzić analizy na podstawie moich danych. Dzieje się dużo, trochę mi się to w głowie nie mieści. W pewnym momencie w marcu, kwietniu miałem skrzynki mailowe zapchane podziękowaniami. Pisali do mnie ludzie, którzy nie spodziewali się, że tak młoda osoba jest w stanie zrobić coś tak dużego.

Kto najbardziej manipuluje danymi o epidemii?

Mówiłeś o otoczce emocjonalnej – pod tekstami o pandemii w OKO.press też bardzo widać ludzkie emocje. Ludzie zarzucają nam, że straszymy, że żadnej pandemii nie ma. Czy i do ciebie trafiają takie krytyczne głosy pod adresem waszej działalności?

Jeśli ktoś się pojawia i zaczyna głosić tezy antypandemiczne – bo pod wpływem emocji dużo ludzi stosuje metodę wyparcia rzeczywistości – społeczność to koryguje. Oczywiście jeśli ktoś jest bardzo zradykalizowany w swoich przekonaniach, nie da się nic mu wytłumaczyć. Ale jeśli chodzi o nadinterpretowanie danych, to głównie robią tak politycy z jednej i drugiej strony barykady. W zależności od teorii – a) jest bardzo dobrze, b) jest bardzo źle – biorą moje dane i dopasowują do swoich potrzeb.

Zawsze zaznaczam, że trzeba patrzeć szerzej, że jeden wykres nie daje żadnej wiedzy. Dlatego wykresów jest dużo, i dużo jest porównań pomiędzy danymi. Tylko spojrzenie na całość może dać odpowiedź, czy jest dobrze, czy źle. O ile w ogóle da się uzyskać taką odpowiedź. Ludzie piszą do mnie, że dzięki tym danym podejmują podstawowe życiowe decyzje, np. czy jechać na wesele, czy robić zakupy częściej czy rzadziej. Mogą wyrobić sobie opinię na ten temat, bo widzą, że przykładowo w ich powiecie od kilku dni nie było żadnego przypadku, albo w ciągu ostatniego tygodnia było ich 100 lub 200.

Regularnie podaje dalej i komentuje moje tweety znany ekspert dr Paweł Grzesiowski. Zapamiętałem mocno jego słowa, że dane nie powodują, iż ludzie wpadają w panikę, ale pozwalają im na chłodno i racjonalnie podchodzić do tej trudnej sytuacji.

Z tym do końca się nie zgodzę, bo emocje dyktują ludziom odrzucenie danych, z którymi się nie zgadzają.

Oczywiście nie jest tak, że każdy, który zajrzy do tego arkusza, zostanie niesamowicie oświecony. Ale kiedy docierają do niego ludzie zagubieni w chaosie informacyjnym, to mam wrażenie, że – nawet jeśli te dane są tragiczne – ich umysł zaczyna nad nimi panować. Przedtem wszystko się dookoła ich pali i wali, media biją na alarm, ale oni nie wiedzą, jaka naprawdę jest sytuacja. Czy epidemia jest blisko ich domu, czy gdzieś daleko Warszawie.

Poczucie kontroli nad własnym życiem – każdy z nas tego potrzebuje. A czy często ci się zdarzało z danych i trendów na twoich wykresach wyczytać coś, o czym jeszcze nie mówiły, albo nie chciały powiedzieć władze?

To tak naprawdę zdarza się ciągle. Widzimy, że jest źle, sytuacja bardzo się pogarsza, a słyszymy, że jest świetnie.

Bo na przykład zbliżają się wybory i trzeba przekonać seniorów, żeby poszli głosować.

Ludzie słuchali potem briefingów w resorcie zdrowia i mówili sobie – no, chyba trochę tam przesadzacie. A osoby, które w ogóle nie miały styczności z danymi, uznawały, że to, co mówi minister, jest OK. Bo to autorytet, on się zna. Jednak od polityków albo słyszymy, że jest tragicznie i zaraz wszyscy umrzemy, albo że jest świetnie, możemy iść do sklepu, na wybory i wycałować babcię.

Zapewne przyczyniło się to również do tego, że wielu ludzi nie wierzy w to, iż rząd publikuje prawdziwe dane o pandemii.

Ja posługuję się faktami. W żadnym momencie nie znalazłem dowodu na to, że coś jest tragicznie nie tak. Jakby ktoś chciał robić jakieś grube przekręty na danych, to by to raczej szybko wypłynęło. Ale jednak ten brak zaufania jest ogromny – jak są spadki, to znaczy, że podają za mało. Jak są wzrosty – to też podają za mało, powinno być więcej. Jakie by te dane nie były, to ludzie powiedzą, że to i tak nie ma znaczenia. Bo jest tak, jak oni uważają, że jest.

Dlaczego w danych o epidemii jest taki chaos?

Mówisz, że nie da się manipulować danymi, ale jednak mamy tajemniczą historię z tysiącem dodatkowych przypadków w województwie śląskim. Raportowały je powiatowe stacje sanitarno-epidemiologiczne, ale wojewódzkie już nie. Do dziś nikt nie potrafi wyjaśnić, skąd to się wzięło.

Tysiąc przypadków na jedno województwo to ogromna liczba.

Ale kiedy się obserwuje i na bieżąco spisuje dane z wielu źródeł, to widać, że nasze państwo kompletnie nie było przygotowane na codziennie raportowanie. Wojewódzkie stacje Sanepidu nie miały narzędzi, żeby wykonać takie zadanie, nie mówiąc już o infrastrukturze pozwalającej zbierać te dane.

Pracownicy są niewyszkoleni – te 230 tys. niewykonanych testów w Świętokrzyskiem wzięło się stąd, że ktoś nie potrafił obsługiwać programu.

Ta sytuacja obciąża przede wszystkim władze centralne: Sanepid jest od lat niedofinansowany, a w ciągu ostatnich miesięcy też nie dostał jakiegoś szczególnego wsparcia.

Udało mi się nawiązać przyjazną współpracę z zespołem BIQdata „Gazety Wyborczej". Oni, będąc sporym medium, są w stanie wyciągnąć jakieś dane od urzędów. Tymczasem odbijali się tam od pani z sekretariatu, która mówiła, że nie jest w stanie, nie może, nie potrafi. Albo, że oni nie zbierają takich danych. Było kilka takich kompletnie abstrakcyjnych sytuacji.

Skoro ja jestem w stanie ogarnąć cały kraj, to wyobrażałem sobie, że każda stacja, czy powiatowa, czy wojewódzka będzie w stanie ogarnąć swoje podwórko.

Jak dajecie sobie radę w sytuacji, kiedy nie sposób zdobyć potrzebnych informacji?

Musimy wtedy zbierać dane z konferencji prasowych i lokalnych mediów. Niestety mają one niską wiarygodność. Szukamy w kilku źródłach i jeśli to się potwierdza, to prawdopodobnie się zgadza.

To wszystko pokazuje kompletny brak przygotowania. Z biegiem czasu sytuacja tylko trochę się poprawiła. To ewidentnie przerosło nasze możliwości urzędowe i administracyjne.

Które dane o epidemii są najważniejsze?

Mówisz, że wszystkie wykresy w twoim arkuszu są ważne. A czy są takie, na które przede wszystkim trzeba zwracać uwagę?

Ludzie koncentrują się na tym, ile zostało zrobionych testów. Jak jest mało przypadków, to dlatego, że robią mało testów. A jak dużo – a, bo zrobili rekordowo dużą ilość testów.

Dla mnie ważnym wskaźnikiem jest procent wyników pozytywnych w danej puli testów. To pokazuje realny zasięg epidemii. Ten odsetek rośnie, kiedy sytuacja się realnie pogarsza. Teraz możemy zaobserwować właśnie taką dynamikę i jest to bardzo niepokojące.

Ale pamiętajmy też, że ta reguła została zakłócona w czerwcu przez badania przesiewowe w województwie śląskim. Wtedy odsetek dodatnich wyników zmalał, bo badano wszystkich, nie tylko osoby z objawami i z kontaktu. Jakie jeszcze dane są ważne?

Zwracam jeszcze uwagę na przyrost nowych przypadków do liczby aktywnych przypadków, ale to wskaźnik trochę bardziej mylący, bo nie uwzględnia właśnie testowania.

Twardą daną jest jeszcze liczba hospitalizacji i osób pod respiratorami.

No i liczba zgonów. Ten wskaźnik akurat od dłuższego czasu jest mniej więcej na tym samym poziomie.

Zaczął już jednak znowu wzrastać.

Wzrósł minimalnie, ale jak mieliśmy 400 przypadków dziennie, to było 40 zgonów w ciągu doby, a teraz jest 800-900 na dobę, a najwięcej zgonów w ostatnim czasie to 15. Teraz prawdopodobnie zarażają się coraz młodsi.

Albo wirus mutuje.

Na początku epidemii często trafiał też do zakładów zamkniętych, do nieprzygotowanych na to szpitali, gdzie ludzie byli bardzo narażeni i tam zbierał bardzo tragiczne żniwo.

Szukałeś ostatnio kolejnych wolontariuszy. Jakieś szersze plany?

Brakuje nam danych o wyzdrowieniach i zgonach na poziomie powiatów. Nasi wolontariusze i tak są już mocno zawaleni pracą, ale udało mi się jeszcze dozbierać kilka osób. Jak policzyłem, jest ponad 140 tys. komórek do uzupełnienia. Zgony już się powoli domykają, niedługo będą kompletne. Z wyzdrowieniami może być gorzej. Jeśli już z publikacją danych o przypadkach były problemy, to sto razy większe będą z wyzdrowieniami. Ale na pewno już niedługo będzie można zobaczyć, ile jest aktywnych przypadków w danym powiecie.

Dopiero zdałeś maturę, ale to, co się działo przez ostatnie pół roku, to niezły uniwersytet. Dowiedziałeś się wiele o funkcjonowaniu państwa, o psychologii społecznej. Czy masz wrażenie, że jesteś już też epidemiologiem-amatorem?

Na pewno z czasem patrząc na dane byłem w stanie wyciągać coraz bardziej trafne wnioski i przewidywać, co będzie dalej. Czasem słuchając opinii epidemiologów odkrywałem, że moje intuicje są całkowicie zgodne z tym, co mówili eksperci. Ale to były takie podstawowe wnioski. Od początku zakładałem, że będę sumiennie zbierać jak najszersze dane. Nie jestem jednak matematykiem, statystykiem ani epidemiologiem. Od tego są ludzie, którzy się na tym znają.

Na pewno jednak polepszyły się moje umiejętności analizowania danych. Myślę, że jakby zaprosili do mnie do telewizji, to coś sensownego bym powiedział.

Najpierw gap year, potem pewnie studia. Matematyka czy psychologia?

PR i marketing.

Zaskoczyłeś mnie, muszę przyznać.

Pracuję już jako grafik komputerowy dla Lewicy. Odpowiada mi taka ścieżka zawodowa – grafik i osoba zajmująca się PR i marketingiem. W dodatku marketing, szczególnie polityczny, opiera się i na psychologii, i na analizie danych. Więc to wszystko trzyma się kupy.

Udostępnij:

Miłada Jędrysik

Miłada Jędrysik – dziennikarka, publicystka. Przez prawie 20 lat związana z „Gazetą Wyborczą". Była korespondentką podczas konfliktu na Bałkanach (Bośnia, Serbia i Kosowo) i w Iraku. Publikowała też m.in. w „Tygodniku Powszechnym", kwartalniku „Książki. Magazyn do Czytania". Była szefową bazy wiedzy w serwisie Culture.pl. Od listopada 2018 roku do marca 2020 roku pełniła funkcję redaktorki naczelnej kwartalnika „Przekrój".

Komentarze

Komentarze będą wkrótce dostępne