Kolumna

Računala danas mogu proučavati kulturu, ideje i slavu

Foto: Thinkstock
Računala danas mogu proučavati kulturu, ideje i slavu
14.10.2017.
u 18:55
Michel i Aiden otkrili su primjere cenzure kada bi popularnost neke riječi rasla pa naglo nestala iz svih knjiga
Pogledaj originalni članak

Objavljujući u posljednjim godinama 20. stoljeća svoje prve znanstvene radove, nisam mogao ni zamisliti koliko će se poziv znanstvenika fundamentalno promijeniti već unutar iduća dva desetljeća. Zahvaljujući svojoj golemoj snazi, današnja super-računala omogućuju istraživanja temeljena na milijunima puta većim količinama precizno izmjerenih informacija, no što smo ih ikada imali na raspolaganju u prošlosti. Stoga sam optimističan razmišljajući o spoznajama koje ćemo doseći novim, tzv. “big data” istraživanjima. Testirajući tisuće hipoteza u djeliću sekunde koristeći sve dostupne podatke, moderna računala pripisuju svakoj od mogućih hipoteza precizno izračunatu vjerojatnost. Time ostvaruju postignuća za koja bi timovima znanstvenika iz prošlog stoljeća trebale tisuće godina.

“Big data” analize u biomedicini često se označuju neologizmom “omika”, nastavkom koji označuje da se radi o istraživanjima svih mogućih informacija o nekom predmetu istraživanja – primjerice, svim genima (“genomika”) ili proteinima (“proteomika”). Naša osjetila nisu u stanju mjeriti te podatke, već to za nas iz uzoraka krvi čine iznimno sofisticirani mjerni uređaji.

Također, ljudski mozak nije u stanju pohraniti ni analizirati niti približno tolike količine informacija. Stoga nam računala omogućuju uvide u procese unutar naših organizama koje mi sami, bez njihove pomoći, ni na koji način ne bismo mogli spoznati. Međutim, u cijelom tom napretku u 21. stoljeću, moj omiljeni primjer prodora je “kulturomika”. Radi se o iznimno inovativnoj primjeni ovog istog načela - dakle, prikupljanja goleme količine podataka, a zatim sustavne računalne analize i obrade. No, u slučaju “kulturomike”, ne istražuju se pojave u prirodi niti živi organizmi, već naše kulturno nasljeđe.

Ovaj napredak povezuje se s radom znanstvenika Jean-Baptiste Michela i Ereza Aidena sa Sveučilišta Harvard.

Doznavši da kompanija Google radi na digitalizaciji svih knjiga koje su ikada objavljene, uvidjeli su da računalo knjige prepoznaje tek kao nakupine vrlo velikog broja riječi. Nakon što je Google omogućio pretraživanje i analizu svake od tih riječi u svakoj od knjiga, Michel i Aiden shvatili su da, zapravo, nema razlike istražuju li sljedove dušičnih baza u molekulama DNK raznih organizama, sljedove aminokiselina u proteinima čovjeka, ili pak sljedove riječi zapisane u knjigama. Na isti način kao što sustavno istražujemo gene i proteine, oni su odlučili istražiti tekst zapisan u milijunima knjiga iz 19. i 20. stoljeća, ne bi li dokazali da na ovaj način možemo “mjeriti” vlastito kulturno nasljeđe.

Ono što me posebno inspirira u njihovu radu jest koliko bi takvu ideju bilo nemoguće provesti prije samo dvadesetak godina. Niti jedan vrlo načitan čovjek ne bi mogao zapamtiti svaku riječ u svakoj knjizi, a još manje analizirati popularnost svake od tih riječi kroz razdoblje od dva stoljeća.

No, Michel i Aiden učinili su baš to: konstruirali su bazu digitaliziranih tekstova više od pet milijuna knjiga, što je oko 4% svih ikada tiskanih knjiga, u kojima je otisnuto 500 milijardi riječi. To im je omogućilo da izračunaju da je 1900. godine engleski jezik imao oko 500.000 riječi, a da ih danas već ima oko milijun.

Zatim su analizirali koliko se često svaka od njih pojavljivala kroz vrijeme u odnosu na sve ostale riječi, i kako je “popularnost” nekih riječi, a time i raznih ljudskih ideja i tema rasprave, rasla i padala.

Analizama su primijetili kako bi se inačice pojedinih riječi pojavljivale i postupno zamjenjivale prethodnu varijantu, doprinoseći time razumijevanju razvoja gramatike.

Također, otkrili su primjere cenzure, kada bi popularnost neke riječi rasla iz godine u godinu, a zatim bi naglo nestala iz svih knjiga. Mogli su čak i pratiti pojavljivanje imena povijesnih osoba, te “izmjeriti” koliki je doista bilo njihov utjecaj, međusobno ih uspoređujući po broju navoda u knjigama, kao i izmjeriti koliko je prosječno godina bilo potrebno da se prestanu spominjati. Zaključili su, primjerice, da američki predsjednici iz prošlog stoljeća polako padaju u zaborav, no Marylin Monroe, Sigmund Freud i Mickey Mouse se još uvijek iznenađujuće dobro drže.

 

*Autor je sveučilišni profesor i direktor Centra za globalno zdravlje na Sveučilištu u Edinburghu i redoviti član Kraljevskog društva Britanske akademije 
znanosti.

Pogledajte na vecernji.hr

Komentari 5

VA
valval
10:10 15.10.2017.

hm, dal to znaci da ce se u nekoj doglednoj buducnosti moci raskrinkravat demagoge i muljatore u stvarnom vremenu. Ono tipa dok prica na televiziji odma ide fact check i dobije veliki debeli crveni X

Avatar mdoresic
mdoresic
09:11 21.10.2017.

Trivijalno infantilni tekstovi Pročitavši posljednja dva subotnja teksta u rubrici Komentari-analize (Večernji list od 7. i 14. listopada 2017.) ne mogu a ne reagirati iz nekoliko razloga. Stekao sam dojam da je gospodin Igor Rudan vaš novi kolumnist ili tako nekako. Svakom profesoru mora načelno biti drago ako ga u stručnom ili znanstvenom pogledu nadmaši njegov učenik. Imam bivših učenika od pred tridesetak godina koji su svoje mjesto pod suncem našli na jednom od sveučilišta kao što su Berkley ili MIT i s njima se itekako ponosim, a oni sami ostali su skromni i samozatajni. S obzirom da je i gospodin Rudan također moj bivši učenik iz tog razdoblja, a predavao sam mu fiziku u prvom i drugom razredu gimnazije (u ono vrijeme MIOC) imam posebnu obvezu reagirati na njegove nastupe u medijima, a naročito nakon analitičkog teksta jedne vaše čitateljice u rubrici Reagiranja (pod naslovom ''Hrvatska znanost ili kako nadmašiti Arsenea Lupina''), a koji nije ni približno u skladu s onim kako se gospodin Rudan predstavlja. Njegovi tekstovi pak koje sam pročitao više su primjereni časopisu ''Modra lasta'' koji je davnih šezdesetih godina izlazio za osnovno školsku učeničku populaciju i što se tiče sadržaja i što se tiče razine, jednostavno rečeno infantilno trivijalni. Da bih bio potpuno jasan ovakvo moje reagiranje nije ni u tragovima iz nekih osobnih razloga, sačuvaj Bože, ono je prvenstveno s ciljem da se ''zaštite'' od nerealnog 'PR nasilja' oni koji im

Avatar mdoresic
mdoresic
09:13 21.10.2017.

Da bih bio potpuno jasan ovakvo moje reagiranje nije ni u tragovima iz nekih osobnih razloga, sačuvaj Bože, ono je prvenstveno s ciljem da se ''zaštite'' od nerealnog 'PR nasilja' oni koji imaju relevantan uspjeh u svojoj struci i u znanosti, s relevantnim znanstvenim radovima, a ne s radovima na kojima je cijela plejada koautora, pa se više ne zna što je čije. (Dovoljno je pogledati internetsku bazu Web of Science). Gospodin Igor Rudan nije ničim pokazao koji mu je temeljni znanstveni doprinos osim što govori o 'globalnom zdravstvu', pojmu kojeg je dosta teško definirati. S obzirom da mi je poznato da je on ponikao iz institucije 'Andrija Štampar' tu njegovu priču čak mogu i razumjeti. Naime, tridesetih godina prošlog stoljeća ta institucija 'Narodnog zdravlja' imala je važnu ulogu pa čak i u odgoju i školovanju učitelja na preparandijama koji su imali zadaću prosvjećivati narod u zdravstvenom smislu u mjestima gdje su radili. O tempora, o mores! Moj dragi bivši učenik samo kasni u fazi, tek nekih cca 90 godina! Miroslav Dorešić, zamjenik ministra prosvjete 1998./1999.