Može li nam znanost o podacima pomoći u borbi protiv epidemija?

Kada govorimo o znanosti o podatcima kao o nečemu što nam potencijalno može pomoći u borbi protiv epidemija, prije svega moramo razlikovati dvije skupine mjera — kratkoročne i dugoročne.

Što se kratkoročnih mjera tiče, osnovne mjere prevencije i borbe protiv epidemije su uglavnom iste već barem stotinu godina, primjerice iz doba epidemije španjolske gripe 1918. — društvena distanca, osobna higijena i briga za osobno zdravlje. Pitanje je koliko nam moderna tehnologija, pa tako i znanost o podacima, može pomoći u boljoj prevenciji. Pozitivan primjer je Tajvan koji je, iako geografski blizak Kini, uspio održati nisku stopu slučajeva zaraze koronavirusom, između ostalog i uz efikasnu analizu podataka o svojim stanovnicima — objedinjavanjem podataka nacionalnog zdravstvenog osiguranja i imigracijske službe kako bi dobili podatke o putovanjima u inozemstvo, praćenjem samoizolacije preko mobitela, rzvojem mobilnih aplikacija s informacijama o trgovinama koje prodaju maske i koje označavaju rizična mjesta. Zaista impresivan skup mjera potpomognutih modernom tehnologijom, no pritom treba napomenuti da Tajvan ima i ministricu za digitalnu tehnologiju.

Kod srednjoročnih i dugoročnih mjera borbe protiv virusa prije svega mislimo na povećane napore usmjerene u znanstvena istraživanja i razvoj infrastrukture za borbu protiv budućih epidemija kao i smanjivanja potencijalnih negativnih ekonomskih i društvenih posljedica. Pri tome znanost o podacima može imati ključnu ulogu jer pruža potporu mobiliziranoj znanstvenoj zajednici na svjetskoj razini.

Ovo se dogodilo na nekoliko razina. Za početak, većina znanstvene literature o koronavirusu, koja je do sad bila dostupna samo uz pretplatu na odgovarajuće baze podataka i znanstvene časopise, od nedavno je slobodno dostupna online cijeloj istraživačkoj zajednici. Ovo je bitno jer je ukazalo na problem koji postoji već duže vrijeme, a taj je da se svaki znanstveni članak (kao glavni oblik diseminacije znanstvenih rezultata) plaća uglavnom javnim novcem i to višestruko — porezni obveznici financiraju znanstveni rad i rad recenzenata i urednika u časopisima, a potom i troškove objave samog članka ako se želi da takav članak bude u otvorenom pristupu, znači slobodno dostupan javnosti. Ova epidemija i brzi odgovor znanstvene zajednice koji je uslijedio ukazuje na činjenicu da znanost ne može vršiti svoju funkciju ako je samo privilegija onih koji si to mogu priuštiti. Nadam se da ćemo nakon ove situacije kao znanstvena zajednica ali i kao odgovorni građani postati više senzibilizirani za pitanje dostupnosti znanstvenih informacija.

Količina novoproducirane znanstvene literature o koronavirusu otvara pitanje može li se to znanje uopće uspješno evaluirati i primijeniti u tako kratkom roku, s obzirom da se broj objavljenih znanstvenih članaka mjeri u stotinama dnevno. A pri tome uglavnom govorimo samo o člancima na engleskom jeziku, zanemarujući činjenicu da je dobar dio znanstvene literature i na drugim svjetskim jezicima, primjerice kineskom, što je i razumljivo jer je to zemlja u kojoj je potvrđen prvi slučaj zaraze i koja je napravila prve istraživačke korake (izolacija virusa i sekvencioniranje njegovog genoma)! Poseban problem je što je većina objavljenih znanstvenih članaka u formi preprintova koji nisu prošli recenziju neovisnih stručnjaka, no kako je recenziranje proces koji traje mjesecima, nekako su se morali pomiriti kriteriji znanstvene rigoroznosti i potrebe za brzom objavom potencijalno značajnih otkrića. Način objavljivanja znanstvenih članaka, koji uključuje i obaveznu recenziju od strane neovisnih stručnjaka, praktički se nije mijenjao više od sto godina, bez obzira na brojne tehnološke promjene (primjerice, gotovo potpuno prebacivanje na sustav online objave), tako da će ovaj period služiti kao dobar test koliko on uopće doprinosi kvaliteti znanstvenih članaka, a koliko samo koči cijeli sustav objave znanstvenih rezultata.

Image for post
* Podaci s bioRxiv

U međuvremenu je pokrenuto nekoliko data mining izazova, primjerice na na web stranici Kaggle gdje je zadatak odgovoriti na nekoliko općenitih pitanja o koronavirusu koristeći tehnike analize teksta i obrade prirodnog jezika na 45 tisuća znanstvenih članaka. Drugi primjer je Epidemic Datathon na ETH Zurich gdje je zadatak predvidjeti tijek pandemije koristeći raznovrsne podatke kao što su broj slučajeva zaraze, demografski podaci i podaci o mobilnosti. Osim “data mining challengea” i institucije koje financiraju znanstvena istraživanja su pokrenule pozive za projekte s tematikom COVID-19, primjerice Hrvatska Zaklada za Znanost.

Što se podataka tiče, njih općenito možemo podijeliti na epidemiološke podatke koji prate tijek epidemije i broja zaraženih i biološko-farmaceutske podatke o samom virusu i potencijalnim lijekovima koji bi pomogli u liječenju.

Za epidemiološke podatke nažalost ne postoji centralni repozitorij na svjetskoj razini. Najažurnije podatke drži nekoliko nezavisnih institucija, primjerice John Hopkins University. Na razini pojedinih država takve podatke obično prikupljaju državne zdravstvene agencije, kao što je slučaj u Hrvatskoj, iako postoje i privatne inicijative koje se orijentiraju prije svega na prezentaciju i vizualizaciju podataka.

Image for post
* Podaci s John Hopkins University

Obično su dostupni samo uprosječeni podaci, a rijetko kad na razini pojedinca, pa čak i u anonimiziranom obliku. Razlozi su razni, od logističkih poteškoća u prikupljanju i objedinjavanju takvih podataka do bojazni oko privatnosti. Kina, Indija i Singapur su rijetke iznimke gdje su takvi podaci barem dijelom dostupni. Naime, epidemiološke mjere se uglavnom zasnivaju na podacima o pojedincima i njihovim kontaktima preko kojih su mogli doći u doticaj s bolešću. Uostalom, i jedna od prvih modernih epidemioloških intervencija koju je 1854. proveo britanski liječnik John Snow tijekom epidemije kolere u Londonu, oslanjala se na individualne podatke o lokacijama zaraženih.

Vjerojatno najdetaljnije podatke o mobilnosti i potencijalnim kontaktima danas možemo dobiti preko naših mobitela, no problem je što su ti podaci uglavnom u vlasništvu privatnih kompanija, prije svega mobilnih operatera i kompanija koje razvijaju popularne mobilne aplikacije. Neki od tih podataka su djelomice objavljeni u obliku pogodnom za analize, primjerice od strane Facebooka koji je objavio podatke visoke rezolucije o gustoći stanovništva i društvenoj povezanosti između geografskih regija.

No veliku ulogu igraju i biološki i farmaceutski podaci. Za razliku od epidemije kolere u Londonu 1854. i pandemije španjolske gripe 1918. danas znamo puno više o uzročnicima bolesti. Primjerice, 1854. još nije bilo poznato ni da mikroorganizmi uzrokuju koleru, dok 1918. još nisu bili poznate ni DNK ni RNK molekule kao nosioci genske informacije. Danas smo imali RNK sekvencu koronavirusa unutar mjesec dana od početka epidemije. Strukture proteina koji sačinjavaju koronavirus su potom nađene računalnim metodama, puno prije nego je došla eksperimentalna potvrda (ovo je napravio Deep Mind, kompanija u vlasništvu Googlea) što može pomoći u razvoju cjepiva ili antiviralnih lijekova koji djeluju na aktivnost virusa. Razvoj cjepiva je i dalje dugotrajan proces do kojeg će doći tek za više od godinu dana. Prije toga se možda razviju antiviralni lijekovi koji usporavaju razvoj bolesti i smanjuju smrtnost, također pomoću računalnih metoda. Ako imamo sreće to će biti jedan od lijekova koji je već poznat i u upotrebi ali za neku drugu bolest, što znatno olakšava i ubrzava proces odobravanja lijeka i stavljanja na tržiše.

Znanost o podacima, kao i epidemiologija i medicina, samo je jedan od alata koji možemo koristiti za suzbijanje epidemija zaraznih bolesti. Bez obzira na veliki napredak u znanosti i medicini u zadnjih stotinu godina, trenutna epidemija nas uči da znanje i tehnologija sami po sebi nisu dovoljni. Konačni rezultat u borbi protiv epidemija ovisi o efikasnoj i pravovremenoj primjeni odgovarajućih mjera, a to je više pitanje društvenog konsenzusa nego znanosti same.

Matija Piškorec
https://matijapiskorec.github.io/

Leave a Reply

Your email address will not be published. Required fields are marked *