Sanda Martinčić - Ipšić, Karlo Babić, Milan Petrović, Marko Pranjić, Ana Meštrović, Mihaela Matešić i Slobodan Beliga
U znanosti je poznato da društvene mreže mogu imati snažan utjecaj na formiranje stavova i mišljenja dijela javnosti te da njihov učinak može pridonositi polarizaciji društva, i nije bilo teško pretpostaviti da će one imati važnu ulogu i u vrijeme pandemije.
povezane vijesti
Samo četiri mjeseca nakon prvih slučajeva zaraze koronavirusom u Hrvatskoj, izv. prof. dr. sc. Ana Meštrović s Odjela za informatiku Sveučilišta u Rijeci – dobitnica Godišnje nagrade Grada Rijeke u protekloj godini za istaknuti doprinos istraživanjima u području informacijskih znanosti usmjerenima na dobrobit zajednice – pokrenula je istraživački projekt InfoCoV: Višeslojni okvir za karakterizaciju širenja informacija putem društvenih medija tijekom krize COVID-19.
Sada izgleda kao da je sa svojim suradnicima već tada pretpostavila da će doći do poplave informacija i što će se događati u virtualnom svijetu, te da će se to moguće i na loše načine odraziti na mnoge pojedince, pa i na društvo. Dakle, da će se dogoditi infodemija, kako to nazivaju stručnjaci. U nošenju s krizama mogu pomoći i znanstvena istraživanja, poput ovoga usmjerenog unapređenju javne komunikacije. Pitanja na tom tragu postavili smo voditeljici projekta prof. Meštrović i nekolicini njezinih suradnika – prof. dr. sc. Sandi Martinčić-Ipšić, izv. prof. dr. sc. Mihaeli Matešić i dr. sc. Slobodanu Beligi.
Ana MEŠTROVIĆ: Čim je započela pandemija, bilo je jasno da će biti popraćena intenzivnom komunikacijom na društvenim mrežama. Imali smo prethodno iskustvo u istraživanju društvenih mreža i analizi velikih količina tekstualnih podataka primjenom metoda iz područja obrade prirodnog jezika (engl. natural language processing, NLP). U znanosti je poznato da društvene mreže mogu imati snažan utjecaj na formiranje stavova i mišljenja dijela javnosti te da njihov učinak može pridonositi polarizaciji društva, i nije bilo teško pretpostaviti da će one imati važnu ulogu i u vrijeme pandemije. Stoga smo bili vrlo motivirani i entuzijastični da znanja koja smo imali o istraživanju društvenih mreža i algoritmima iz područja NLP-a primijenimo i na komunikaciju u kriznoj situaciji te na taj način damo svoj doprinos društvu i zajednici. Na početku COVID-19 krize Hrvatska zaklada za znanost promptno je reagirala i već početkom travnja 2020. godine, u jeku zatvaranja u Hrvatskoj, objavila je natječaj za znanstvene projekte. Iako su u prvom pandemijskom valu fakulteti i sveučilišni odjeli bili zatvoreni, našli smo alternativne načine povezivanja i izradili projektni prijedlog. Naš je projekt u konkurenciji od gotovo stotinu prijavljenih bio jedan od 11 projekata koji su prihvaćeni na natječaju, a posebno ističem da je tom prilikom Sveučilištu u Rijeci odobreno čak pet projekata.
Interdisciplinarno istraživanje
Koji su znanstvenici, kojih znanstvenih disciplina angažirani na projektu?
Ana MEŠTROVIĆ: Na projektu surađuje petero istraživača s Odjela za informatiku Sveučilišta u Rijeci. Prof. dr. sc. Sanda Martinčić-Ipšić, dr. sc. Slobodan Beliga i ja imamo više od deset godina iskustva u području NLP-a i analize kompleksnih mreža. Suradnici su i dvojica doktoranada, Karlo Babić koji se bavi razvojem jezičnih modela, neuronskim mrežama i općenito područjem dubokog učenja i Milan Petrović koji se bavi kompleksnim mrežama i analizom društvenih mreža. Dodatno, na projekt su uključena tri konzultanta koji pokrivaju različita područja: izv. prof. dr. sc. Mihaela Matešić s Filozofskoga fakulteta u Rijeci, lingvistica s iskustvom u korpusnolingvističkim istraživanjima, izv. prof. dr. sc. Zoran Levnajić s Fakulteta za informacijske študije Novo Mesto, stručnjak za kompleksne mreže i Marko Pranjić, doktorand pri Institutu Jožef Štefan, koji se bavi područjem dubokog učenja. Ovo je interdisciplinarno istraživanje te za potrebe interpretacije rezultata planiramo uključiti znanstvenike iz područja sociologije, psihologije i eventualno drugih područja.
Slobodan BELIGA
|
Kako ste pristupili istraživanju aktualne infodemije, prikupljanju i analizi »mora« podataka?
Ana MEŠTROVIĆ: Projekt se bavi istraživanjem i analizom tekstualnih sadržaja vezanih za koronavirus koji se objavljuju u društvenim medijima, a primjenjujemo metode iz područja obrade prirodnog jezika, strojnog učenja i analize društvenih mreža. Algoritmi strojnog učenja, a posebno dubokog učenja, omogućavaju automatizirane postupke u analizi velikih količina tekstova, što bi inače jako dugo trajalo kada bi to radili ljudi. Primjenom dubokog učenja moguće je npr. postići da algoritam automatski prepoznaje kakav je stav izrazio autor tekstualne poruke. Pored toga, razvijali smo i primjenjivali postupke za automatsko prepoznavanje tema u tekstovima, automatsku ekstrakciju ključnih pojmova, prepoznavanje entiteta, tj. osoba, lokacija, institucija spomenutih u tekstovima te postupke za klasifikaciju tweetova ovisno o tome koliko se oni šire, u smislu retweetanja.
Slobodan BELIGA: Istraživali smo objave vodećih i brojnih lokalnih, hrvatskih novinskih portala, korisničke komentare na portalima i objave na društvenim mrežama. Budući da se radi o velikim količinama podataka, potrebna su računala jake procesorske snage. Danas se za postupke dubokog učenja koriste moćne grafičke kartice. Za ova istraživanja koristimo računalo nabavljeno sredstvima Hrvatske zaklade za znanost, koja financira ovaj projekt, a koje sadrži tri NVIDIA Quadro RTX 6000 grafičke kartice i koje nam omogućava učinkovito procesiranje velikih količina podataka.
Velika količina negativnih stavova
Što se može zaključiti iz analize tema, zatim mišljenja i stavova, tzv. sentimenta, iznesenih na društvenim mrežama?
Ana MEŠTROVIĆ: U znanstvenom radu koji smo nedavno objavili u časopisu Applied Sciences izdavačke kuće MDPI predstavili smo rezultate analize više od 200.000 tweetova na hrvatskom jeziku vezanih za COVID-19 i objavljenih tijekom prvih triju pandemijskih valova. Iz tih rezultata evidentna je velika količina negativnih stavova. Također, u vrijeme vrhunaca pandemijskih valova količina je negativnih objava najveća. Pored toga primijenili smo algoritme za grupiranje tweetova u 10 tematskih klasa. Tematska klasa vezana za »mjere i cijepljenje« obuhvaća najveći broj tweetova, gotovo 30% i to je druga po redu najnegativnija klasa, dok prva najnegativnija klasa objedinjuje poruke u kojima se iskazuje revolt prema mjerama stožera, ali i revolt prema nepoštovanju mjera. Kao jedna od klasa s najmanjom količinom negativnih stavova ističe se klasa »kako se nositi s pandemijom«. Ona obuhvaća gotovo 20% tweetova i bila je najzastupljenija na početku pandemije. Analiza sentimenta kroz vrijeme pokazala je da većina klasa ima ili konstantno negativan ili konstantno pozitivan sentiment. Međutim, pokazalo se i da je klasa tweetova s temama iz ekonomije najviše podložna promjenama. U toj klasi negativan sentiment prati vrhunce triju pandemijskih valova, a tijekom ljeta količina se negativnih komentara smanjuje.
Sanda MARTINČIĆ-IPŠIĆ
|
Istražiti stavove i mišljenja sigurno je iznimno zahtjevan posao.
Mihaela MATEŠIĆ: Analiza stavova i mišljenja promatra se kroz suprotstavljene pojmove pozitivan/negativan te mogućnost neutralnosti. Istraživanje stavova zanimljivo je svim dionicima u procesima odlučivanja kad se radi o temama koje su važne u svakodnevici građana. U novoj, kriznoj situaciji koju je donijela ova epidemija bilo je važno utvrditi kako se o krizi razgovara na društvenim mrežama jer su one u suvremeno doba postale najdinamičniji prostor u kojem korisnici razmjenjuju informacije, vijesti, praktične savjete i stavove.
Kako smo istraživanje provodili na velikoj količini podataka, poslužili smo se metodom strojnoga učenja. Ponajprije, bilo je potrebno ručno označiti 10.000 poruka na društvenim mrežama i zatim na tome korpusu »naučiti« stroj da prepoznaje stavove na novim primjerima tekstualnih upisa. Dugotrajan rad na analizi sadržaja uključivao je i rad anotatora – osoba osposobljenih za klasificiranje upisa prema utvrđenoj metodologiji. Rezultati do kojih smo došli usporedivi su s rezultatima i drugih znanstvenika u svijetu. O ovoj kriznoj situaciji razgovaralo se na društvenim mrežama polarizirano: podjednako je bilo i neutralnih i negativnih stavova, a izrazito malo pozitivnih. Neutralni su napisi dolazili od institucija koje objavljuju savjete kako se nositi s novom situacijom, kako npr. objasniti djeci nagle promjene u svakodnevnom životu i školovanju, kako poštovati protuepidemijske mjere pri dolasku u zdravstvene ustanove i slično. Negativni stavovi obuhvaćaju strah od zaraze, nezadovoljstvo zbog pada kvalitete života (ograničenja kretanja, sužavanja dostupnih sadržaja za zabavu i sl.), pa i ljutnju, npr. prema sugrađanima koji nisu shvatili ozbiljnost situacije i ne poštuju zaštitne mjere.
Pritom se počesto negativan stav izražava sarkazmom. S druge strane, pozitivnim upisima korisnici žele oraspoložiti jedni druge razmjenjujući savjete o zabavnim sadržajima poput filmova, predstava ili koncerata dostupnih na mreži ili šalju ohrabrujuće poruke kao što je ova: »Ljubav ne mogu pobijediti kilometri, a kamoli metri!«.
Društvene mreže i informiranje
Vjerujem da je jedan od vaših zaključaka da i za medije trebamo biti obrazovani i odgajani.
Mihaela MATEŠIĆ: I ovo istraživanje potvrdilo je da se građani sve više utječu društvenim mrežama kad je riječ o informiranju. Poznato je i da takav način informiranja počinje zauzimati primat nad informiranjem putem novina, televizije i radija. Ako znamo da za točnost objavljene vijesti u tim medijima odgovaraju novinari i urednici svojom stručnošću, etikom, pa i radnim mjestom, lako je uočiti kako takva pozadina izostaje pri pokušaju informiranja putem društvenih mreža – na njima su upisi nerijetko privatni, anonimni, svode se na iskazivanje osobnoga stava i ne teže prethodnoj provjeri. Stoga je vrlo važno poznavati narav pojedine vrste medija kako bismo osvijestili problem pouzdanosti informacije. Mogućnosti informiranja koje su donijele društvene mreže dragocjene su ako se znaju upotrijebiti na pravi način. Uz pravilnu procjenu o njihovu dosegu, one mogu biti vrlo korisne za pojedinca i zato je ključno obrazovati ne samo mlađe naraštaje, nego i sve dobne skupine o tome kako se služiti suvremenim oblicima informiranja.
Rezultati dostupni javnostiRezultati InfoCoV-a već su objavljeni u dva ugledna međunarodna znanstvena časopisa i gotovo desetak zbornika s konferencija. Dio podataka prikupljenih istraživanjem i svi rezultati projekta bit će javno dostupni za slobodno korištenje za daljnja istraživanja na mrežnim stranicama projekta www.infocov.hr, a svi dosad objavljeni rezultati već se nalaze na toj stranici. |
Istražujete li i četvrti val pandemije, probleme s cijepljenjem, s COVID-potvrdama?
Ana MEŠTROVIĆ: Trenutno prikupljamo podatke o četvrtome pandemijskom valu i planiramo opsežno usporedno istraživanje svih četiriju valova. U zadnjih godinu i pol intenzivnog istraživanja puno smo naučili i planiramo nastaviti u tome smjeru. Društveni mediji imaju važnu ulogu u globalnim krizama, kakva je i ova pandemijska. Oni, naime, mogu na određeni način i utjecati na tijek krize. Postoje primjerice znanstveni radovi koji istražuju modele širenja epidemije na način da kao varijable uključe i neke značajke društvenih medija. Stoga, bolje razumijevanje društvenih medija u pandemiji može pomoći u smislu unapređivanja kvalitete komuniciranja u javnosti. Također, ova istraživanja mogu pomoći i da se bolje pripremimo za neku drugu globalnu krizu koja se može dogoditi u budućnosti.
Analiza podataka
Jeste li tijekom istraživanja medijskog prostora nailazili na neke prepreke?
Sanda MARTINČIĆ-IPŠIĆ: Istraživanja medijskog prostora pored tehničkih, donose i brojne pravne izazove koji su se odnosili na prikupljanje i analiziranje podataka iz online-izvora. Međutim, donošenjem novoga zakona o autorskom pravu i srodnim pravima u 2021. godini regulirano je područje tzv. rudarenja teksta i podataka u svrhe znanstvenoga istraživanja, čime će ovakva istraživanja u budućnosti biti olakšana. U 2021. godini procjenjuje se da je u Hrvatskoj bilo oko 2.8 milijuna korisnika društvenih mreža, pri čemu broj korisnika i dalje raste (oko 4,5% u 2021). Udio korisnika najveći je za Facebook (između 80% i 90%), dok ostale mreže, poput Twittera, Instagrama, YouTubea, Reddita, ukupno zauzimaju preostali udio. Međutim, Facebook je od 2018. godine jako ograničio mogućnosti prikupljanja i analize svojih podataka zbog skandala s tvrtkom Cambridge Analytica. Stoga smo u našim istraživanjima orijentirani na analizu podataka s Twittera, Reddita te komentara čitatelja ispod objava u online-medijima (portalima).