Analiza internetu przypomina przysłuchiwanie się tysiącom rozmów jednocześnie. Ale tylko przy założeniu, że słuchający jest w stanie usłyszeć każdą z dyskusji i odnotować jej przebieg. W realu to niemożliwe, w sieci owszem. Właśnie tam najszybciej można wychwycić nastroje społeczne.
Nie ma wzorca w Sevres ani żadnej ogólnie przyjętej procedury, która określałaby jak przeprowadzać analizę internetu, aby adekwatnie odzwierciedlała nastroje użytkowników sieci. A jednak wszyscy chcą wiedzieć, co się dzieje w mediach społecznościowych i jak internauci reagują na pojawiające się newsy.
To prawdziwe wyzwanie dla analityków: pokazać istotne opinie społeczne, nie gubiąc się przy tym w gąszczu fałszywych kont, trolli, botów i serwowanych przez nich manipulacji. Skąd więc wiemy, co myślą internauci?
Kiedy 16 maja OKO.press opublikowało moją analizę sieci o niekorzystnych reakcjach internautów na obietnicę prezesa Kaczyńskiego o waloryzacji świadczenia 500 plus do 800 zł, zawrzało po prawej stronie sceny politycznej. Przedstawione wyniki tak bardzo nie pasowały Zjednoczonej Prawicy, że natychmiast je podważono. Najczęstszy stawiany mi zarzut (poza tymi czysto personalnymi) brzmiał: „To analiza emotikonek, a z tego nie można wyciągać wniosków!”.
Sprowadzanie materiału do „analizy emotikonek” miało na celu unieważnienie niekorzystnych dla PiS wniosków, to oczywiste. Tyle że w następnych dniach pojawiły się sondaże opinii publicznej, przygotowane przez trzy niezależne ośrodki badawcze. Wszystkie przyniosły podobne wyniki – pomysł 800 plus więcej osób oceniało negatywnie niż pozytywnie. Potwierdziło się to, co wcześniej zaobserwowałam w mediach społecznościowych.
Cykl „SOBOTA PRAWDĘ CI POWIE” to propozycja OKO.press na pierwszy dzień weekendu. Znajdziecie tu fact-checkingi (z OKO-wym fałszometrem) zarówno z polityki polskiej, jak i ze świata, bo nie tylko u nas politycy i polityczki kłamią, kręcą, konfabulują. Cofniemy się też w przeszłość, bo kłamstwo towarzyszyło całym dziejom. Rozbrajamy mity i popularne złudzenia krążące po sieci i ludzkich umysłach. I piszemy o błędach poznawczych, które sprawiają, że jesteśmy bezbronni wobec kłamstw. Tylko czy naprawdę jesteśmy? Nad tym też się zastanowimy.
Co prawda europoseł Tomasz Poręba, szef sztabu wyborczego PiS, w radiowych Sygnałach Dnia próbował ratować sytuację, przekonując: „W Polsce łatwo jest kupić sondaż. Przecież to jest chyba powszechną wiedzą, że jeżeli jakaś partia czy jeżeli jakaś redakcja, czy jakieś środowisko polityczne chce troszeczkę podkręcić sondaż, to zawsze jest to możliwe”.
Ale pomińmy na chwilę teorie spiskowe, snute przez europosła PiS, i przyjrzyjmy się na poważnie temu, jak można ocenić nastroje użytkowników internetu. I czy naprawdę jest to tak wyśmiewane przez prawicę „analizowanie emotikonek”?
Od razu uprzedzam – dalsza część tekstu będzie zawierała dużo informacji metodologicznych i technicznych. Wszystko dlatego, że analiza sieci ma niewiele wspólnego ze zwyczajnym odczytywaniem emotikonek, choć reakcje pod wpisami mają w niej swoje znaczenie.
Najważniejsze jest jednak monitorowanie oraz interpretowanie danych ilościowych i jakościowych, pobieranych z internetu. Służą do tego konkretne narzędzia i programy. Choć są coraz dokładniejsze, nic nie zastąpi wprawnego oka specjalisty, który z olbrzymiej ilości liczb i zestawień będzie w stanie wyłowić to, co najistotniejsze. A potem sprawdzić dane w innych źródłach, upewnić się, czy wnioski mają potwierdzenie w innych metodach badawczych, a dopiero na koniec przedstawić wyniki.
Analizę sieci zaczyna się najczęściej od sprawdzania, jakie zainteresowanie budzi konkretny temat. Służą do tego narzędzia monitorujące internet na podstawie słów kluczowych, choćby popularnych hashtagów czy słów charakterystycznych dla danego tematu, np. „800 plus”.
Przeszukują sieć, gdzie, kiedy i kto opublikował artykuł czy wpis, w którym dane słowo zostało użyte, i pokazują to w liczbowych zestawieniach. Obliczają od razu wskaźniki typowe dla monitoringu internetu, na przykład zasięg czy ekwiwalent reklamowy.
Zasięg inaczej nazywany jest potencjałem wpływu. Jest to potencjalna liczba odsłon konkretnego wpisu lub słowa kluczowego. Aby go wyliczyć, analizowana jest wielkość profili publikujących wzmianki ze wskazanymi wyrazami, reakcje na wpisy, sposób ich rozchodzenia się. Robią to specjalne algorytmy, czyli programy, w których precyzyjnie określa się setki zmiennych, niezbędnych do obliczenia każdego wskaźnika.
W przypadku sieciowego zasięgu zawsze podawany jest zasięg potencjalny, szacowany. Nie wiadomo dokładnie, do ilu osób dotarła konkretna informacja, algorytm szacuje jedynie, do ilu osób mogła dotrzeć.
Przy popularnych tematach dane zasięgowe są bardzo duże, w Polsce – na poziomie kilkudziesięciu czy kilkuset milionów. Ale jeszcze raz: nie oznacza to, że jakiś hashtag realnie dotarł do kilkuset milionów Polaków (to byłoby fizycznie niemożliwe). Oznacza, że do tylu osób mógł dotrzeć. Przy czym część użytkowników zliczana jest wielokrotnie.
Na przykład: jeśli 20 twoich znajomych użyje w swoich wpisach tego samego hashtagu, to ty sam zostaniesz policzony przez algorytm 20 razy jako potencjalny odbiorca hashtagu. Dane zasięgowe tez więc trzeba rozumieć, by wyciągać z nich właściwe wnioski.
Na tym etapie pracy z narzędziem do monitoringu internetu wiemy już, czy temat jest popularny i jak dużo wzmianek powstało. Oczywiście i tu są pewne pułapki, o których analitycy powinni wiedzieć. Narzędzia mają swoje ograniczenia. Na przykład nie pobierają danych ze wszystkich platform społecznościowych ze względu na blokady dostępu wprowadzane przez niektóre platformy.
A kiedy ktoś napisze post na temat, który monitorujemy, ale nie użyje wskazanego przez nas słowa kluczowego, nie zobaczymy jego wzmianki w zestawieniu. A może być bardzo popularny. Dlatego ja nigdy nie kończę analizy ilościowej na danych z jednego programu. Korzystam między innymi z wyszukiwarek dostępnych na platformach społecznościowych, by weryfikować wzmianki bezpośrednio w miejscach ich powstawania.
Są także narzędzia, które pozwalają sprawdzać bieżący ruch w internecie i wyłapywać tak zwane trendy. Dzięki nim widać, jaki temat budzi zainteresowanie, gdzie dyskusja sieciowa rośnie, a gdzie temat nie chwyta.
Jest także możliwość analizowania pojedynczych kont na platformach społecznościowych. Wówczas dzięki specjalnemu oprogramowaniu widać dane dotyczące liczby reakcji pod wpisami zamieszczanymi na konkretnym koncie. Powstają wykresy aktywności konta i osób reagujących, określany jest poziom zaangażowania odbiorców.
Można porównywać, które konto jest popularniejsze czy jakie wpisy budzą większe zainteresowanie. Przy czym też oczywiście trzeba dobrze rozumieć dane. Twórcy oprogramowania zazwyczaj tworzą kolejne wskaźniki, które pozwalają przełożyć reakcje pod wpisami (a więc na przykład tak obśmiewane przez prawicę emotikonki) na porównywalne dla wszystkich kont dane liczbowe, wartościując w określony sposób zarówno lajki, jak i komentarze czy udostępnienia.
Podobnym wartościowaniem posługują się również algorytmy używane przez platformy społecznościowe, wyliczając popularność każdego wpisu i na tej podstawie decydując, jak intensywnie pokazywać konkretną wzmiankę kolejnym użytkownikom.
Mówiąc najprościej: aktywność każdego użytkownika social media jest zamieniana na liczby, a wyniki owych wyliczeń wskazują algorytmom, co zrobić dalej z wpisem. Można się więc z analizowania emotikonek czy komentarzy w sieci wyśmiewać. A jednak emotikonki to jeden z najpopularniejszych sposobów reagowania w sieci i okazywania swojego stosunku do publikowanych treści. Dlatego mają znaczenie także podczas analizy ilościowej sieciowych danych.
Narzędziami do analizy konkretnych kont w mediach społecznościowych posługiwałam się podczas kampanii prezydenckiej w 2021 roku. Co tydzień porównywałam wówczas konta kandydatów na prezydenta, by przekonać się, który z nich cieszy się największą popularnością w sieci. Raport co tydzień publikowało OKO.press.
Także wtedy wyniki analizy internetowej w dużym stopniu pokrywały się z wynikami sondaży poparcia. Zaobserwowałam jednak dwie istotne różnice. Po pierwsze: wyniki sieciowe wyprzedzały wyniki sondażowe o około dwa tygodnie. Po drugie: w sieci jest niższa reprezentacja najstarszej wiekowo grupy Polaków. Przekładając obserwacje sieciowe na wnioski dotyczące całego społeczeństwa, trzeba to brać pod uwagę.
Z tego też powodu przedstawiając wyniki analizy internetu, nie wyciągam z niej wniosków ogólnych.
To zawsze jest monitoring odnoszący się wyłącznie do użytkowników mediów społecznościowych, a nie do całego społeczeństwa.
Ale wróćmy do słów kluczowych i szukania informacji o nastrojach w sieci. Kiedy już wiemy, jakim zainteresowaniem cieszy się dany temat, możemy – posługując się najczęściej tymi samymi narzędziami – sprawdzić, które wzmianki wygenerowały najwięcej reakcji, były najczęściej komentowane czy udostępniane.
Wpisy są porządkowane i prezentowane w rankingach, uwzględniających ich popularność. Dzięki innym funkcjom oprogramowania możemy przygotować takie zestawienia dla każdej analizowanej platformy społecznościowej oddzielnie lub sprawdzić, jaki wpis był najpopularniejszy we wszystkich mediach społecznościowych.
To prowadzi nas do analizy jakościowej – gdy przyglądamy się już nie tylko liczbom, ale też treściom. Najpopularniejsze wpisy oraz prowadzone wokół nich dyskusje pokazują, z czym identyfikują się użytkownicy sieci, co wywołuje największe dyskusje oraz przeciwko czemu protestują. Przypomina to nieco słuchanie setek offline`owych rozmów.
Czy ktokolwiek uznałby, że wyciągnięcie wniosków na podstawie najintensywniejszych dyskusji na dany temat, jakie odbyły się w różnych częściach Polski i w różnych grupach społecznych, jest błędem? Nie.
I w tym rzecz! Analiza sieci daje takie możliwości.
Z chęci słuchania bieżących opinii wzięła się socjologiczna metoda badawcza, nazywana po prostu wywiadem. Dość popularne są badania focusowe, których podstawą jest wywiad grupowy, czyli ukierunkowana rozmowa grupy ludzi. Oczywiście w socjologii metodę tę ustandaryzowano. Aby wywiad można było uznać za wiarygodny badawczo, musi on spełniać określone warunki.
Analiza jakościowa wzmianek w sieci nie została na razie ujęta w standardy. Internet to wciąż dość nowa przestrzeń, jeśli chodzi o postrzeganie jej jako swoistego lustra części społeczeństwa. Na dodatek przestrzeń zmieniająca się, także jeśli chodzi o dostęp do danych.
Platformami społecznościowymi zarządzają firmy prywatne, każda ma inne podejście do tematu dostępności danych, nawet dla naukowców pracujących na uczelniach.
Do niedawna najłatwiej było pozyskać duże zbiory danych z Twittera i właśnie dlatego najwięcej artykułów naukowych, odnoszących się do zachowań w sieci, opiera się na badaniach tweetów. Ale ostatnio sytuacja się zmieniła. 30 marca 2023 Twitter wprowadził nowy cennik płatności za dostęp do danych. Wprowadzono zaporowe stawki za najszerszy dostęp.
Dopiero kilka dni temu pojawiły się dodatkowe opcje, które unormowały sytuację. Jednak przez ten czas część narzędzi pobierała z Twittera jedynie fragmentaryczne informacje, co utrudniało właściwą analizę sieci.
Problemy z dostępem do danych pojawiają się także, jeśli chodzi o Facebook i Instagram. Nie rozpisując się o szczegółach – platformy deklarują, że w ten sposób chronią informacje o użytkownikach sieci.
Z jednej strony – to dobra wiadomość. Ale z drugiej – często chodzi nie tyle o ochronę, ile o monopolizację dostępu. Zarządzający platformami mają bowiem świadomość, że ich najcenniejszym zasobem biznesowym są właśnie dane – o zachowaniach i preferencjach użytkowników. I robią wiele, by ten zasób przełożyć na pieniądze.
Takie podejście utrudnia analizę niezależnym badaczom. Aby wyniki badań były wiarygodne, trzeba dziś sprawdzać dane w kilku źródłach, porównywać ze sobą zestawienia pochodzące z narzędzi do monitoringu internetu z wynikami pochodzącymi bezpośrednio z platform, analizować treści i reakcje na różne sposoby.
Tylko wtedy jest szansa, że analiza pokaże prawdziwy obraz nastrojów wśród internautów. Ale kiedy wyniki potwierdzają później inne badania, choćby sondaże opinii publicznej – pojawia się prawdziwa satysfakcja. Jak w przypadku mojej analizy na temat 800 plus, opublikowanej przez OKO.press.
Analizuje funkcjonowanie polityki w sieci. Specjalistka marketingu sektora publicznego, pracuje dla instytucji publicznych, uczelni wyższych i organizacji pozarządowych. Stała współpracowniczka OKO.press
Analizuje funkcjonowanie polityki w sieci. Specjalistka marketingu sektora publicznego, pracuje dla instytucji publicznych, uczelni wyższych i organizacji pozarządowych. Stała współpracowniczka OKO.press
Komentarze