InfoCoV

Istraživački znanstveni projekt: Infodemija u pandemiji pokazuje da društveni mediji imaju važnu ulogu u globalnim krizama

Mirjana Grce

Sanda Martinčić - Ipšić, Karlo Babić, Milan Petrović, Marko Pranjić, Ana Meštrović, Mihaela Matešić i Slobodan Beliga

Sanda Martinčić - Ipšić, Karlo Babić, Milan Petrović, Marko Pranjić, Ana Meštrović, Mihaela Matešić i Slobodan Beliga

U znanosti je poznato da društvene mreže mogu imati snažan utjecaj na formiranje stavova i mišljenja dijela javnosti te da njihov učinak može pridonositi polarizaciji društva, i nije bilo teško pretpostaviti da će one imati važnu ulogu i u vrijeme pandemije.



Samo četiri mjeseca nakon prvih slučajeva zaraze koronavirusom u Hrvatskoj, izv. prof. dr. sc. Ana Meštrović s Odjela za informatiku Sveučilišta u Rijeci – dobitnica Godišnje nagrade Grada Rijeke u protekloj godini za istaknuti doprinos istraživanjima u području informacijskih znanosti usmjerenima na dobrobit zajednice – pokrenula je istraživački projekt InfoCoV: Višeslojni okvir za karakterizaciju širenja informacija putem društvenih medija tijekom krize COVID-19.


Sada izgleda kao da je sa svojim suradnicima već tada pretpostavila da će doći do poplave informacija i što će se događati u virtualnom svijetu, te da će se to moguće i na loše načine odraziti na mnoge pojedince, pa i na društvo. Dakle, da će se dogoditi infodemija, kako to nazivaju stručnjaci. U nošenju s krizama mogu pomoći i znanstvena istraživanja, poput ovoga usmjerenog unapređenju javne komunikacije. Pitanja na tom tragu postavili smo voditeljici projekta prof. Meštrović i nekolicini njezinih suradnika – prof. dr. sc. Sandi Martinčić-Ipšić, izv. prof. dr. sc. Mihaeli Matešić i dr. sc. Slobodanu Beligi.


Ana Meštrović


Ana MEŠTROVIĆ: Čim je započela pandemija, bilo je jasno da će biti popraćena intenzivnom komunikacijom na društvenim mrežama. Imali smo prethodno iskustvo u istraživanju društvenih mreža i analizi velikih količina tekstualnih podataka primjenom metoda iz područja obrade prirodnog jezika (engl. natural language processing, NLP). U znanosti je poznato da društvene mreže mogu imati snažan utjecaj na formiranje stavova i mišljenja dijela javnosti te da njihov učinak može pridonositi polarizaciji društva, i nije bilo teško pretpostaviti da će one imati važnu ulogu i u vrijeme pandemije. Stoga smo bili vrlo motivirani i entuzijastični da znanja koja smo imali o istraživanju društvenih mreža i algoritmima iz područja NLP-a primijenimo i na komunikaciju u kriznoj situaciji te na taj način damo svoj doprinos društvu i zajednici. Na početku COVID-19 krize Hrvatska zaklada za znanost promptno je reagirala i već početkom travnja 2020. godine, u jeku zatvaranja u Hrvatskoj, objavila je natječaj za znanstvene projekte. Iako su u prvom pandemijskom valu fakulteti i sveučilišni odjeli bili zatvoreni, našli smo alternativne načine povezivanja i izradili projektni prijedlog. Naš je projekt u konkurenciji od gotovo stotinu prijavljenih bio jedan od 11 projekata koji su prihvaćeni na natječaju, a posebno ističem da je tom prilikom Sveučilištu u Rijeci odobreno čak pet projekata.


Interdisciplinarno istraživanje


Koji su znanstvenici, kojih znanstvenih disciplina angažirani na projektu?




Ana MEŠTROVIĆ: Na projektu surađuje petero istraživača s Odjela za informatiku Sveučilišta u Rijeci. Prof. dr. sc. Sanda Martinčić-Ipšić, dr. sc. Slobodan Beliga i ja imamo više od deset godina iskustva u području NLP-a i analize kompleksnih mreža. Suradnici su i dvojica doktoranada, Karlo Babić koji se bavi razvojem jezičnih modela, neuronskim mrežama i općenito područjem dubokog učenja i Milan Petrović koji se bavi kompleksnim mrežama i analizom društvenih mreža. Dodatno, na projekt su uključena tri konzultanta koji pokrivaju različita područja: izv. prof. dr. sc. Mihaela Matešić s Filozofskoga fakulteta u Rijeci, lingvistica s iskustvom u korpusnolingvističkim istraživanjima, izv. prof. dr. sc. Zoran Levnajić s Fakulteta za informacijske študije Novo Mesto, stručnjak za kompleksne mreže i Marko Pranjić, doktorand pri Institutu Jožef Štefan, koji se bavi područjem dubokog učenja. Ovo je interdisciplinarno istraživanje te za potrebe interpretacije rezultata planiramo uključiti znanstvenike iz područja sociologije, psihologije i eventualno drugih područja.


Slobodan BELIGA
Analize infodemije mogu pomoći da ju se stavi pod nadzor i ublaži

Infodemija se može opisati kao prisutnost ogromne količine informacija od kojih je dio točan, a dio je netočan, djelomično točan ili neprovjeren, nažalost, ponekad i zlonamjeran. Problem s infodemijom u tome je što se pojedinci ne snalaze u tako velikoj količini informacija i mogu donositi pogrešne odluke te na taj način ugroziti sebe i druge. Pandemija bolesti COVID-19 prouzročila je najveću globalnu infodemiju do sada uz prisutnost velike količine dezinformacija (lažnih informacija koje se namjerno plasiraju kao činjenice s namjerom obmane) i misinformacija (pogrešnih informacija koje se plasiraju slučajno, iz neznanja). U analizi podataka i informacija veliki izazovi koje infodemija uzrokuje prvenstveno su sama količina tekstova kojima smo obasipani, potom obuhvaćenost tema iz različitih domena, ne samo iz medicine već i ekonomije, gospodarstva, politike, obrazovanja, kulture, znanosti i brojnih drugih. Nova terminologija (vezana za lijekove, nova cjepiva, mjere civilne zaštite), ali i velik broj korisnika uključenih u rasprave u društvenim medijima dodatni su izazovi koji analizu informacija čine kompleksnijom.
Situacija u kojoj smo iz dana u dan preplavljeni informacijama, a pritom se osjećamo da nam »nije jasno«, nije bezazlena. Znanstvena istraživanja u toj domeni važna su za dovođenje situacije u normalne okvire. U prvom naletu virusa SARS-CoV-2 infodemija se rasplamsala u rekordno kratkom vremenu, a njezinom analizom dolazimo do nekih spoznaja koje mogu društvenim medijima, novinskim kućama, uredništvima, upravljačkim i drugim mjerodavnim tijelima ukazati što se može korigirati kako bi se u nastavku epidemije infodemija stavila pod nadzor i ublažila.
Naše znanstvene spoznaje objavili smo u renomiranom američkom časopisu Public Health and Surveillance izdavačke kuće Journal of Medical Internet Research. Vrijednost spoznaja o infodemiji koje su vezane za Republiku Hrvatsku prepoznao je Gunther Eysenbach, glavni urednik toga časopisa, prvi svjetski infodemiolog i otac područja koje se naziva infodemiologijom. Proveli smo jednogodišnju, longitudinalnu studiju u kojoj smo pratili najposjećenije novinske portale u Hrvatskoj tijekom cijele 2020. godine. Rezultati studije ukazuju na snagu infodemije koja je prožela internetski medijski prostor hrvatskih novinskih portala, otkrivaju obrasce novinskih objava u vrijeme pandemije, glavne aktere u pandemiji (osobe, organizacije i lokacije o kojima se najčešće piše u vijestima i objavama), rasvjetljuju vokabular zastupljen u objavama vezanima za COVID-19, tumače koreliranost broja objava vijesti vezanih za COVID-19 i broj zaraženih osoba u Hrvatskoj i slično.

Kako ste pristupili istraživanju aktualne infodemije, prikupljanju i analizi »mora« podataka?


Ana MEŠTROVIĆ: Projekt se bavi istraživanjem i analizom tekstualnih sadržaja vezanih za koronavirus koji se objavljuju u društvenim medijima, a primjenjujemo metode iz područja obrade prirodnog jezika, strojnog učenja i analize društvenih mreža. Algoritmi strojnog učenja, a posebno dubokog učenja, omogućavaju automatizirane postupke u analizi velikih količina tekstova, što bi inače jako dugo trajalo kada bi to radili ljudi. Primjenom dubokog učenja moguće je npr. postići da algoritam automatski prepoznaje kakav je stav izrazio autor tekstualne poruke. Pored toga, razvijali smo i primjenjivali postupke za automatsko prepoznavanje tema u tekstovima, automatsku ekstrakciju ključnih pojmova, prepoznavanje entiteta, tj. osoba, lokacija, institucija spomenutih u tekstovima te postupke za klasifikaciju tweetova ovisno o tome koliko se oni šire, u smislu retweetanja.
Slobodan BELIGA: Istraživali smo objave vodećih i brojnih lokalnih, hrvatskih novinskih portala, korisničke komentare na portalima i objave na društvenim mrežama. Budući da se radi o velikim količinama podataka, potrebna su računala jake procesorske snage. Danas se za postupke dubokog učenja koriste moćne grafičke kartice. Za ova istraživanja koristimo računalo nabavljeno sredstvima Hrvatske zaklade za znanost, koja financira ovaj projekt, a koje sadrži tri NVIDIA Quadro RTX 6000 grafičke kartice i koje nam omogućava učinkovito procesiranje velikih količina podataka.


Velika količina negativnih stavova


Što se može zaključiti iz analize tema, zatim mišljenja i stavova, tzv. sentimenta, iznesenih na društvenim mrežama?


Ana MEŠTROVIĆ: U znanstvenom radu koji smo nedavno objavili u časopisu Applied Sciences izdavačke kuće MDPI predstavili smo rezultate analize više od 200.000 tweetova na hrvatskom jeziku vezanih za COVID-19 i objavljenih tijekom prvih triju pandemijskih valova. Iz tih rezultata evidentna je velika količina negativnih stavova. Također, u vrijeme vrhunaca pandemijskih valova količina je negativnih objava najveća. Pored toga primijenili smo algoritme za grupiranje tweetova u 10 tematskih klasa. Tematska klasa vezana za »mjere i cijepljenje« obuhvaća najveći broj tweetova, gotovo 30% i to je druga po redu najnegativnija klasa, dok prva najnegativnija klasa objedinjuje poruke u kojima se iskazuje revolt prema mjerama stožera, ali i revolt prema nepoštovanju mjera. Kao jedna od klasa s najmanjom količinom negativnih stavova ističe se klasa »kako se nositi s pandemijom«. Ona obuhvaća gotovo 20% tweetova i bila je najzastupljenija na početku pandemije. Analiza sentimenta kroz vrijeme pokazala je da većina klasa ima ili konstantno negativan ili konstantno pozitivan sentiment. Međutim, pokazalo se i da je klasa tweetova s temama iz ekonomije najviše podložna promjenama. U toj klasi negativan sentiment prati vrhunce triju pandemijskih valova, a tijekom ljeta količina se negativnih komentara smanjuje.


Sanda MARTINČIĆ-IPŠIĆ
Problem lažnih vijesti ostaje izazov

Jedno istraživanje širenja lažnih vijesti, objavljeno 2018. godine u časopisu Science, pokazalo je da se lažne vijesti šire značajno brže, dublje i šire u mreži od istinitih vijesti. Međutim, istraživanja vezana za lažne vijesti o bolesti COVID-19 dovela su i do nekih drugih zaključaka. Jedno takvo istraživanje širenja lažnih vijesti na različitim društvenim mrežama (Twitter, YouTube, Instagram, Reddit i Gab) pokazalo je da nema statistički značajne razlike između širenja lažnih i istinitih vijesti. Jedno drugo istraživanje pokazalo je da se u kontekstu koronavirusa istinite vijesti vezane za znanstvena istraživanja šire dublje u mreži od lažnih vijesti.
Što se tiče našega istraživanja, preliminarno smo pokazali da su twitter-poruke koje se odnose na COVID-19 podložnije širenju nego poruke koje nisu vezane za COVID-19. U nastavku naših istraživanja, osim mehanizama širenja, planiramo istražiti i područje lažnih vijesti. U takvu istraživanju jedan je od osnovnih problema utvrditi točnost činjenice temeljem koje se dalje definira je li vijest točna, lažna ili djelomično točna. Razvoj postupaka koji automatski utvrđuju točnost činjenica osnova je za tovrsne postupke, ali još uvijek predstavlja izazov čak i za velike kompanije poput Facebooka, koje se poprilično teško nose s uvođenjem automatiziranog određivanja netočnih činjenica te njihova uklanjanja s društvenih mreža. Posebice je to primjetno u situacijama kad imamo infodemiju, kao što je slučaj u medijskom praćenju pandemije. Problem lažnih vijesti ostaje velik izazov ne samo za hrvatsku, nego i za svjetsku istraživačku zajednicu.

Istražiti stavove i mišljenja sigurno je iznimno zahtjevan posao.


Mihaela MATEŠIĆ: Analiza stavova i mišljenja promatra se kroz suprotstavljene pojmove pozitivan/negativan te mogućnost neutralnosti. Istraživanje stavova zanimljivo je svim dionicima u procesima odlučivanja kad se radi o temama koje su važne u svakodnevici građana. U novoj, kriznoj situaciji koju je donijela ova epidemija bilo je važno utvrditi kako se o krizi razgovara na društvenim mrežama jer su one u suvremeno doba postale najdinamičniji prostor u kojem korisnici razmjenjuju informacije, vijesti, praktične savjete i stavove.


Kako smo istraživanje provodili na velikoj količini podataka, poslužili smo se metodom strojnoga učenja. Ponajprije, bilo je potrebno ručno označiti 10.000 poruka na društvenim mrežama i zatim na tome korpusu »naučiti« stroj da prepoznaje stavove na novim primjerima tekstualnih upisa. Dugotrajan rad na analizi sadržaja uključivao je i rad anotatora – osoba osposobljenih za klasificiranje upisa prema utvrđenoj metodologiji. Rezultati do kojih smo došli usporedivi su s rezultatima i drugih znanstvenika u svijetu. O ovoj kriznoj situaciji razgovaralo se na društvenim mrežama polarizirano: podjednako je bilo i neutralnih i negativnih stavova, a izrazito malo pozitivnih. Neutralni su napisi dolazili od institucija koje objavljuju savjete kako se nositi s novom situacijom, kako npr. objasniti djeci nagle promjene u svakodnevnom životu i školovanju, kako poštovati protuepidemijske mjere pri dolasku u zdravstvene ustanove i slično. Negativni stavovi obuhvaćaju strah od zaraze, nezadovoljstvo zbog pada kvalitete života (ograničenja kretanja, sužavanja dostupnih sadržaja za zabavu i sl.), pa i ljutnju, npr. prema sugrađanima koji nisu shvatili ozbiljnost situacije i ne poštuju zaštitne mjere.


Pritom se počesto negativan stav izražava sarkazmom. S druge strane, pozitivnim upisima korisnici žele oraspoložiti jedni druge razmjenjujući savjete o zabavnim sadržajima poput filmova, predstava ili koncerata dostupnih na mreži ili šalju ohrabrujuće poruke kao što je ova: »Ljubav ne mogu pobijediti kilometri, a kamoli metri!«.


Društvene mreže i informiranje


Vjerujem da je jedan od vaših zaključaka da i za medije trebamo biti obrazovani i odgajani.


Mihaela MATEŠIĆ: I ovo istraživanje potvrdilo je da se građani sve više utječu društvenim mrežama kad je riječ o informiranju. Poznato je i da takav način informiranja počinje zauzimati primat nad informiranjem putem novina, televizije i radija. Ako znamo da za točnost objavljene vijesti u tim medijima odgovaraju novinari i urednici svojom stručnošću, etikom, pa i radnim mjestom, lako je uočiti kako takva pozadina izostaje pri pokušaju informiranja putem društvenih mreža – na njima su upisi nerijetko privatni, anonimni, svode se na iskazivanje osobnoga stava i ne teže prethodnoj provjeri. Stoga je vrlo važno poznavati narav pojedine vrste medija kako bismo osvijestili problem pouzdanosti informacije. Mogućnosti informiranja koje su donijele društvene mreže dragocjene su ako se znaju upotrijebiti na pravi način. Uz pravilnu procjenu o njihovu dosegu, one mogu biti vrlo korisne za pojedinca i zato je ključno obrazovati ne samo mlađe naraštaje, nego i sve dobne skupine o tome kako se služiti suvremenim oblicima informiranja.


Rezultati dostupni javnosti

Rezultati InfoCoV-a već su objavljeni u dva ugledna međunarodna znanstvena časopisa i gotovo desetak zbornika s konferencija. Dio podataka prikupljenih istraživanjem i svi rezultati projekta bit će javno dostupni za slobodno korištenje za daljnja istraživanja na mrežnim stranicama projekta www.infocov.hr, a svi dosad objavljeni rezultati već se nalaze na toj stranici.
Članovi projektog tima izrađuju i web-aplikaciju koja će zainteresiranima omogućiti interaktivni pregled i razne vizualizacije podataka s Twittera i online-novinskih portala. Ona će korisniku omogućavati da sam odabere razdoblje ili teme koje ga zanimaju i preuzme prikaz podataka o npr. temama, stavovima, tendenciji retwitanja poruka i sl. u odabranome razdoblju odvijanja pandemije.

Istražujete li i četvrti val pandemije, probleme s cijepljenjem, s COVID-potvrdama?


Ana MEŠTROVIĆ: Trenutno prikupljamo podatke o četvrtome pandemijskom valu i planiramo opsežno usporedno istraživanje svih četiriju valova. U zadnjih godinu i pol intenzivnog istraživanja puno smo naučili i planiramo nastaviti u tome smjeru. Društveni mediji imaju važnu ulogu u globalnim krizama, kakva je i ova pandemijska. Oni, naime, mogu na određeni način i utjecati na tijek krize. Postoje primjerice znanstveni radovi koji istražuju modele širenja epidemije na način da kao varijable uključe i neke značajke društvenih medija. Stoga, bolje razumijevanje društvenih medija u pandemiji može pomoći u smislu unapređivanja kvalitete komuniciranja u javnosti. Također, ova istraživanja mogu pomoći i da se bolje pripremimo za neku drugu globalnu krizu koja se može dogoditi u budućnosti.


Analiza podataka


Jeste li tijekom istraživanja medijskog prostora nailazili na neke prepreke?


Sanda MARTINČIĆ-IPŠIĆ: Istraživanja medijskog prostora pored tehničkih, donose i brojne pravne izazove koji su se odnosili na prikupljanje i analiziranje podataka iz online-izvora. Međutim, donošenjem novoga zakona o autorskom pravu i srodnim pravima u 2021. godini regulirano je područje tzv. rudarenja teksta i podataka u svrhe znanstvenoga istraživanja, čime će ovakva istraživanja u budućnosti biti olakšana. U 2021. godini procjenjuje se da je u Hrvatskoj bilo oko 2.8 milijuna korisnika društvenih mreža, pri čemu broj korisnika i dalje raste (oko 4,5% u 2021). Udio korisnika najveći je za Facebook (između 80% i 90%), dok ostale mreže, poput Twittera, Instagrama, YouTubea, Reddita, ukupno zauzimaju preostali udio. Međutim, Facebook je od 2018. godine jako ograničio mogućnosti prikupljanja i analize svojih podataka zbog skandala s tvrtkom Cambridge Analytica. Stoga smo u našim istraživanjima orijentirani na analizu podataka s Twittera, Reddita te komentara čitatelja ispod objava u online-medijima (portalima).