26 listopada 2020

Czy rząd zaniża zakażenia? Okiem eksperta o kontrowersjach wokół oficjalnych danych o epidemii

W zasadzie należałoby się cieszyć, że powstała centralna baza danych o epidemii. Odciążyli nastolatka, który pokazał im, jak to robić. A dochodzimy do takiej paranoi, że chcemy szukać sygnalistów wśród laborantów – mówi Alek Tarkowski, prezes Fundacji Centrum Cyfrowe.

Podczas gdy spada liczba osób hospitalizowanych z powodu COVID-19 i wszystkie znaki na niebie i ziemi wskazują, że nie będzie potrzebna „narodowa kwarantanna", przez media profesjonalne i społecznościowe przetacza się debata o danych o epidemii.

Do tej pory powiatowe i wojewódzkie stacje sanitarno-epidemiologiczne publikowały na swoich stronach internetowych dane o swoim regionie – liczbę wykrytych zakażeń, zgonów, ozdrowieńców, hospitalizacji, kwarantann i osób objętych nadzorem epidemiologicznym. Robiły to, gdyż to do nich należało przygotowywanie raportów, które składały Ministerstwu Zdrowia. To do SSE laboratoria przekazywały informację o liczbie wykonanych testów i o wynikach pozytywnych. Resort zdrowia z kolei codziennie publikował dane dla całej Polski w mediach społecznościowych.

Wszystkie te informacje agregował i publikował w jednym arkuszu m.in. 19-latek Michał Rogalski. Robił to w ramach działalności społecznej. Z jego zbiorczych danych i wykresów korzystały media, a także zespoły badawcze zajmujące się epidemią.

Gdzie się podziały tysiące zakażeń?

Przed zniknięciem danych ze stron SSE Rogalski wykrył rozbieżności pomiędzy liczbą zakażeń raportowanych lokalnie na Mazowszu, a tymi podawanymi przez Ministerstwo Zdrowia. Chodziło o kilkanaście tysięcy przypadków, których nie było w ministerialnych danych. Sprawa była tym bardziej ważna, że w tym czasie premier Mateusz Morawiecki zapowiadał „narodowa kwarantannę", jeśli liczba zakażeń w Polsce wzrośnie powyżej pewnego poziomu. Gdyby doliczyć te „zgubione zakażenia", tak powinno się stać.

Morawiecki ogłosił jednak, że zakażenia spadają i lockdownu nie będzie. To wzbudziło podejrzenia wielu użytkowników mediów społecznościowych, że władze manipulują liczbami. Ministerstwo tłumaczyło się błędami i opóźnieniami w raportowaniu oraz podawaniem ich według różnych metodologii. Podejrzenia wzrosły jednak jeszcze bardziej, gdy okazało się, że dane cząstkowe znikły ze stron SSE – p.o. Głównego Inspektora Sanitarnego Krzysztof Saczka zakazał ich publikacji. Tego samego dnia wieczorem ruszył oficjalny centralny serwis z danymi. Nie uspokoiło to podejrzeń.

Centralna baza danych stała się możliwa dzięki wprowadzeniu systemu EWS, w którym laboratoria bezpośrednio zgłaszają wyniki testów, a stacje sanitarno-epidemiologiczne informacje o kwarantannach. Wcześniej Sanepid - przed pandemią najbardziej niedofinansowana i najmniej zcyfryzowana instytucja publiczna - wklepywał je do arkuszy Excela. Nowa publiczna baza jest jednak niekompletna w porównaniu z danymi, które agregowali wolontariusze. W dodatku, jak pisze serwis BIQdata, część z prywatnych laboratoriów nie dostała jeszcze kluczy do bazy EWS, w związku z czym raportowane dane są niepełne.

W OKO.press piszemy o tym, że danymi, na które przede wszystkim należy zwracać uwagę analizując przebieg epidemii są przede wszystkim te o hospitalizacjach, chorych w ciężkim stanie i zgonach. Liczby wykrytych zakażeń są mniej miarodajne, gdyż zależą od zbyt wielu czynników – przyjętej strategii testowania, odsetka wyników pozytywnych, opóźnień w raportowaniu.

A o cyfryzacji, dostępności danych publicznych, spiskach i nieufności do rządu rozmawiamy z dr. Alkiem Tarkowskim, socjologiem i prezesem Fundacji Centrum Cyfrowe, który od dekady promuje zasadę otwartego dostępu do danych i innych zasobów publicznych.

Cyfryzacja – jakoś pniemy się pod górę

Miłada Jędrysik: Poznaliśmy się 10 lat temu, kiedy byłeś w zespole doradców premiera Tuska ekspertem od cyfryzacji. Plany cyfryzacji państwa były wtedy ambitne, przyszłość rysowała się świetlanie. I trochę na planach się skończyło. Po 10 latach i 10 miesiącach epidemii Ministerstwo Zdrowia wreszcie wypluło centralną bazę danych na jej temat – jak na razie niekompletną. Przedtem najlepszą bazę danych o COVID-19 prowadził społecznie 19-latek, Michał Rogalski.

Alek Tarkowski: Z cyfryzacją ciągle jest tak sobie. Z jednej strony otwarte dane nieźle się zadomowiły. Jest strona dane.gov.pl, z której można pobrać wiele baz danych.

Pandemia przyśpieszyła też wreszcie cyfryzację ochrony zdrowia – jest e-recepta, upowszechnia się elektroniczne Konto Pacjenta. Ale EWS, baza osób zakażonych i podlegających kwarantannie, z której zaciągane są dane o epidemii na stronę gov.pl, praktycznie dopiero zaczęła w pełni funkcjonować.

Rzecz, która w ostatnich latach się kompletnie wyłożyła, to udział obywateli w procesie legislacyjnym – z politycznych powodów. Umówmy się, że i poprzednie rządy miały z tym kłopot, ale sprawy szły w dobrym kierunku. Powstawały kolejne platformy do konsultacji społecznych. Przez ostatnie pięć lat ten proces kompletnie padł. Wiadomo czemu – jak nawet parlament nie proceduje ustaw prawidłowo, to gdzie ma być miejsce na zgłaszanie jakichś uwag przez obywateli?

Mimo to w dość obiektywnych rankingach otwartych danych jakoś pniemy się w górę, choć nadal dostępność tych danych jest przeciętna. W byłym resorcie cyfryzacji, który teraz został wcielony do KPRM, jest jednak duża świadomość problemu. Nie dotarła ona jeszcze do innych instytucji, ale proces trwa.

Hasło otwartych danych zawsze było moim zdaniem niepolityczne, jeśli już, to chodziło o politykę urzędów – Instytut Meteorologii i Gospodarki Wodnej na przykład żył z prognoz i odmawiał upublicznienia swoich danych. Ale to nie była „duża" polityka, tylko pewna kultura organizacji.

Dane nagle newralgiczne

A potem przyszła pandemia koronawirusa.

I stworzyła sytuację, w której dostępność do danych epidemiologicznych stała się czymś newralgicznym. I mamy Michała Rogalskiego, 19-latka, który wykonywał bardzo użyteczną społecznie pracę agregując te dane. Po prostu robił tabelkę, której z jakiegoś powodu nie umiało– lub nie chciało – zrobić Ministerstwo Zdrowia. Michał razem z innymi wolontariuszami mozolnie odwiedzał codziennie kilkaset stron. Podejrzewam, że gdyby się dało napisać skrypt ściągający dane, to ktoś by go już napisał. Wyszło na to, że łatwiej spisywać dane ręcznie, z poszczególnych stron.

W logice nie sporu politycznego, ale dla budowania e-administracji to świetnie, że w Ministerstwie Zdrowia wreszcie się obudzili i postanowili sami zbierać i agregować dane. Nie ma powodu, żeby musiał je zbierać nieopłacany 19-latek.

Tak samo, jak lekarze nie powinni siedzieć na telefonie i sprawdzać, czy są wolne łóżka w szpitalach. Do tego wystarczy prosta, wygodna aplikacja, którą przez wakacje mogłoby napisać kilku studentów.

Jest rejestr bazy łóżkowej, problem był w tym, że nie zawsze na bieżąco aktualizowany, bo w epidemii nie było na to czasu. Stąd słynny pomysł z żołnierzami, którzy mieli pomagać szpitalom w jego aktualizacji, co dyrektorzy szpitali przyjęli z oburzeniem, jako niedopuszczalną ingerencję. Ale wróćmy do awantury o dane o pandemii.

Wspieram bardzo obywatelskie działania Michała Rogalskiego. I rozumiem jego oburzenie, choć przeszkadza mi podgrzewanie emocji wokół tego tematu. Rozumiem je, bo to Michał wykrył, że powiatowe stacje sanitarno-epidemiologiczne wykazują o 17 tysięcy więcej zakażeń niż oficjalne statystyki Ministerstwa Zdrowia. Podejrzewam, że w tym całym bałaganie te liczby po prostu się nie dodały. Choć wiele osób uważa, że mogą to być świadome działania.

Ten pierwszy scenariusz by mnie nie zdziwił, bo przy ręcznej obsłudze danych przez wychodzący w bólach z analogowych pieluch Sanepid często zdarzały się błędy i wpadki.

Narracja, którą słyszymy w mediach społecznościowych od wczoraj jest taka: odcinamy obywatelom możliwość weryfikacji danych. Tylko że przy dotychczasowym modelu ufaliśmy danym z powiatowych SSE, ale ministerstwu już nie.

A co się zmieniło? Te stacje, zamiast publikować dane na swojej stronie i wysyłać raport do centrali, dostaną dostęp do jakiejś końcówki bazy danych, do której będą wklepywać dane.

One ten dostęp mają już od jakiegoś czasu i wklepują dane o nałożonych kwarantannach. Ale dane o wynikach testów przekazują teraz do systemu EWS bezpośrednio laboratoria.

Ale centralna baza danych, według deklaracji Ministerstwa Zdrowia, ma nadal pokazywać dane także na poziomie powiatu. To gdzie tracimy możliwość obywatelskiej weryfikacji?

Po pierwsze nie ma wszystkich danych – o hospitalizacjach, kwarantannach czy ozdrowieńcach na poziomie powiatu. Brakuje też danych historycznych, choć ministerstwo zapowiada, że będzie to sukcesywnie uzupełniane. Nie mówię już o tym, że przydałyby się dane o wieku chorych i zmarłych, 0 podziale na płeć i rodzajach chorób współistniejących.

Jak rozumiem, ta obywatelska weryfikacja polegała na porównywaniu danych zbiorczych z niezbiorczymi. Ale obydwa te typy danych będą dostępne. Jak zacząłem zadawać na Twitterze pytania, o co w tym chodzi, jedyna odpowiedź, która była dla mnie zrozumiała, ale spiskowa, brzmiała: nie możemy ufać systemowi. Z jakiegoś powodu nie ufamy danym na poziomie powiatowym w momencie, gdy już znajdą się w systemie.

Teoria polega na tym, że rząd manipuluje liczbami zakażeń, zaniżając ich liczbę.

Ale dlaczego nie robią tego stacje powiatowe? Przecież są podległe Głównemu Inspektoratowi Sanitarnemu, który jest agendą rządową. Jeśli nie mamy wątpliwości co do danych powiatowych, to jak sobie wyobrażamy te manipulacje? W systemie działa algorytm „odejmij 5"?

Inna sprawa, że ministerstwo swoimi działaniami nie pomaga sprawie. Stacje sanitarne już dostały zakaz publikowania danych – zresztą dla mnie niezrozumiały, bo każda instytucja powinna móc publikować dane publiczne. Tymczasem dane opublikowane na gov.pl są niekompletne.

Więc jak na razie, w newralgicznym momencie pandemii, publicznych statystyk nie otrzymujemy ani od rządu, ani od Michała, któremu uniemożliwiono obywatelskie działania.

Czy weryfikacja obywatelska będzie dalej możliwa?

Ale jestem w tym wszystkim zmęczony brakiem rzeczowej rozmowy. Jest taka atmosfera, że nikt nie ufa systemom. Ludzie nie chcą, żeby rząd agregował dane, bo myślą – nie wiem, może i słusznie – że na każdym niemal etapie można dodać albo odjąć ten umowny przecinek. Ale jeśli już tak zaczniemy myśleć, to właściwie jest obojętne, gdzie te dane się znajdują.

No dobrze, ale jak obywatele mogą weryfikować takie centralnie agregowane dane?

Jedyna odpowiedź, jaką potrafię sobie udzielić, wychodzi trochę poza logikę otwartych danych: w obronie prawdy staje rozproszenie źródeł. Ktoś, kto by chciał je skrzywić, nie ogarnie kilkudziesięciu laboratoriów i kilkuset stacji powiatowych dostarczających je do systemu. Więc to rozproszenie daje „przestrzeń prawdy".

Jest niesamowicie ważne, żeby ten system sprawnie działał. Kiedy byłem w kwarantannie, założyłem sobie w minutę konto na pacjent.gov.pl i tam znalazłem informację, że jestem nią objęty. Mnie jako obywatela to cieszy. Jeśli mamy nie zwariować, to musimy mieć wiarygodne dane. Kraje sąsiedzkie, na przykład Czechy, mają od wiosny dobrze działający system ze szczegółowymi danymi. Dlaczego my nie możemy takiego mieć?

Ale jest też inny problem. Dlaczego stacje powiatowe nie mogą publikować sobie cząstkowych raportów, niezależnie od centralnego serwisu gov.pl?

Też chciałabym wiedzieć. Teraz nie robią ich same, ale mogłyby je sobie raz, dwa zaciągać z EWS. Ludzie chcą wiedzieć, co się dzieje w ich powiecie, niekoniecznie w całym kraju.

To zakaz zupełnie niezgodny z zasadą dostępu do informacji publicznej. To, że dane są agregowane centralnie nie znaczy, że nie mogą być też dostępne gdzie indziej. Ale to jest kwestia poboczna. Jest jeszcze szansa, by naprawić sytuację i przynajmniej teraz, na jesieni stworzyć nowoczesny, przejrzysty i budzący zaufanie system z danymi epidemiologicznymi.

Czyli sam pomysł centralnej bazy jest dobry, diabeł tkwi w szczegółach.

Także przy okazji tworzenia aplikacji ProteGo Safe ówczesne Ministerstwo Cyfryzacji zachowało się bardzo odważnie, wrzucając jej kod na serwis Github, gdzie każdy mógł go przeanalizować. Dostali obywatelski nadzór, uwagi, momentami bardzo krytyczne i przeszli przez to. Poprawili apkę. Trzeba to oddać administracji publicznej. Wcześniej postulaty otwarcia kodu nie znajdowały tam zrozumienia. W przeszłości aktywiści usiłowali sądowo wyciągać kody i im się to nie udawało.

Potrzeba takiej samej odwagi teraz. Pierwszym krokiem powinno być zaproszenie Michała Rogalskiego i innych ekspertów pracujących z danymi do wspólnego zdefiniowania specyfikacji systemu.

Wiem, że to brzmi utopijnie, bo bardziej prawdopodobny scenariusz zakłada dalsze gubienie danych i ograniczanie dostępu.

Może przestaną się gubić, kiedy nie będzie ich pół ręcznie agregował Sanepid. Ale kluczem jest chyba tutaj brak zaufania. Jesteśmy społeczeństwem, któremu tego dramatycznie brakuje. Mało kto ściąga sobie aplikację ProtegoGo Safe, bo ludzie się boją, że rząd wykradnie ich wrażliwe dane. Nie wierzymy lekarzom – jako jedyni w Europie podczas tej pandemii mamy więcej zaufania do rad od znajomych i z internetu niż do tego, co mówią medycy. Ale też trudno ufać rządowi, który w lecie ci mówi: nie bójcie się tego wirusa, on jest w odwrocie, idźcie głosować.

Ja to całkowicie rozumiem. Model otwartych danych niestety nie radzi sobie z brakiem zaufania. Gdyby odłożyć na bok emocje polityczne i ten brak zaufania, to reakcja na bazę danych o epidemii powinna być taka: jak dobrze, wreszcie to zrobili. Odciążyli Rogalskiego, który pokazał im, jak to robić. A tu dochodzimy do takiej paranoi, że kolejnym obywatelskim działaniem wydaje się być szukanie sygnalistów wśród laborantów, by móc tropić skrzywienia danych. Ale ja wierzę w ideę otwartych danych i mam nadzieję, że ktoś w administracji publicznej zdecyduje się tę sytuację naprawić.

Udostępnij:

Miłada Jędrysik

Miłada Jędrysik – dziennikarka, publicystka. Przez prawie 20 lat związana z „Gazetą Wyborczą". Była korespondentką podczas konfliktu na Bałkanach (Bośnia, Serbia i Kosowo) i w Iraku. Publikowała też m.in. w „Tygodniku Powszechnym", kwartalniku „Książki. Magazyn do Czytania". Była szefową bazy wiedzy w serwisie Culture.pl. Od listopada 2018 roku do marca 2020 roku pełniła funkcję redaktorki naczelnej kwartalnika „Przekrój".

Komentarze

Komentarze będą wkrótce dostępne