Tim hrvatskih podatkovnih znanstvenika pobijedio je na prvom europskom Big Data Hackathonu. Oni su dr. sc. Leo Mršić, voditelj katedre za analizu podataka i predavač na MBA programu na Visokom učilištu Algebra te direktor tvrtke IN2data, mr. sc. Igor Kaluđer, direktor operacija u tvrtki IN2data i doc. dr. sc. Robert Kopal, posebni savjetnik premijera za nacionalnu sigurnost i prodekan za istraživanje i razvoj na Visokom učilištu Algebra. Izvanredan uspjeh ostvarili su u konkurenciji 22 europska tima ili, da se poslužimo sportskim rječnikom, doista su pomeli konkurenciju. Na drugom mjestu ostavili su Francuze, dok je na trećem mjestu bio tim iz Estonije. Europsko natjecanje Big Data Hackathon prvi put je organizirala Europska komisija u suradnji s Eurostatom, s ciljem prikupljanja ideja koje sjedinjuju različite izvore podataka kao moguće podloge u rješavanju specifičnih društvenih izazova.
Članovi hrvatskog tima i profesionalno se bave razvojem Big Data rješenja za primjenu u različitim industrijama te je ovo natjecanje bilo i izvrsna prilika da svoja znanja i vještine odmjere s najboljim europskim podatkovnim znanstvenicima. Kada je riječ o stručnosti koju imamo na polju primjene modernih tehnologija, u ovom slučaju podatkovne znanosti, pokazali smo da pripadamo samom europskom vrhu. I da, time se treba hvaliti iako ovaj trojac radije razgovara o mogućnostima primjene podatkovne znanosti u svakodnevnom životu ili kako vještine i znanja koje imaju mogu pridonijeti razvoju digitalne ekonomije i biti korisne za napredak društva.
Smisao podataka
– Smisao podataka nije da budu sami sebi svrha, važno je ono što s njima možemo učiniti. Tehnologija se brzo razvija u smislu prikupljanja i pohrane te općenito digitalizacije svih oblika podataka... No ono što ide malo sporije i na čemu treba malo više poraditi jesu metode iskoristivosti podataka za boljitak pojedinca i društva – ističe Robert Kopal dodajući da se mnogi stavovi i prosudbe sada temelje na mišljenju pa to zna prerasti i u sukob mišljenja, dok bi, posvetimo li se na pravi način podatkovnoj znanosti i pravim metodama analize, mogli doći do pouzdanih pokazatelja koji bi upravo mogućnost sukoba minimalizirali.
– Statistički podaci, primjerice, nisu dovoljni da omoguće potpuno razumijevanje i kreiranje politika od socioekonomskih do demografskih, no podatkovna znanost o kojoj se danas priča, jest alat koji može vidjeti dublje i šire jer stavlja u odnos niz parametara koje statistika sama ne može. Radi se o doista moćnom i učinkovitom alatu, odnosno pristupu koji brže otkriva konkretne probleme i samim time upućuje kreatore politika na smjer u kojem bi bilo poželjno da se kreću – dodaje Igor Kaluđer, direktor operacija u tvrtki IN2data. Upravo se prošlomjesečno natjecanje može ilustrirati primjerom o čemu je riječ i čemu služe podaci. Hrvatski stručnjaci oduševili su oba ocjenjivačka tima – statistički i tehnološki – softverskim rješenjem koje uporabom rezultata statističkih istraživanja te javno dostupnih podataka pruža uvid u karakteristike tržišta rada, odnosno prikazuje regionalni raskorak u trenutačnim vještinama osoba u potrazi za zaposlenjem i potrebama pojedinih radnih mjesta diljem EU. Projektni zadatak za koji su timovi predlagali rješenja bio je orijentiran na tržišta rada Europske unije, gdje se za određene vrste radnih mjesta traže specifične vještine, a analizira se raskorak između trenutačnih vještina osoba u potrazi za zaposlenjem i vještina koje se traže za otvorena radna mjesta.
– Tim se natjecao na temu osmišljavanja načina kako kombinirati i vizualizirati iznimno velike setove podataka u svrhu upravljanja regulativama na tržištu rada – ukratko objašnjava Leo Mršić te napominje da su rješenje pripremili u samo dva dana (i tri noći) koliko je natjecanje trajalo te da su prototip rješenja učinili dostupnim za pregledavanje u realnom vremenu Dakle, softversko rješenje nastalo u sklopu europskog Big Data Hackathona nazvano je “EU Jobs & Skills Explorer”. Rješenje hrvatskog tima u prikazima se oslanja na inteligentnu vizualizaciju podataka koja se u podlozi koristi pripremljenim setovima podataka, a zanimljivo je spomenuti da su naši predstavnici kroz pripreme i samo natjecanje koristili znatne tehničke resurse.
Korištenje baza
Naime, od 20-tak tablica koje se koriste u konačnoj verziji, pojedine tablice s podacima obuhvaćale su i više od 245 gigabajta podataka i sadržavale više od milijardu zapisa. Posebna je zanimljivost što je naš tim ovo softversko rješenje stavio na raspolaganje sudionicima konferencije. Samostalno su mogli koristiti se alatom upotrijebivši lozinku koju su dobili tijekom procesa evaluacije. U pripremi ovog rješenja korišteni su podaci iz nekoliko milijuna oglasa za posao preuzeti od Europskog centra za razvoj strukovnog obrazovanja (CEDEFOP). Uz navedene oglase, korišteni su i oglasi za posao objavljeni na Europskom portalu za radnu mobilnost (EURES). Iz istog izvora korišteni su podaci dobiveni iz 4,7 milijuna životopisa tražitelja posla. Uz oglase i životopise, hrvatski tim koristio je i istraživanja poput Ankete o radnoj snazi (LFS), Ankete o znanjima i vještinama odraslih (PIAAC) i drugo. Također su korišteni i Eurostatovi podatkovni setovi na razini statističkih regija. Razvijeni sustav omogućava duboke uvide u ponudu i potražnju vještina na tržištu rada te raskorak između istih s glavnim ciljem podrške odlučivanju u politikama zapošljavanja i obrazovnog sustava.
Zanimljivo je i da su korištenjem serija podataka članovi našeg tima pokazali da je moguće razviti i projekcije vještina koje će u budućnosti biti tražene na pojedinim geografskim područjima. Korištenjem Europskog registra vještina, kompetencija i zanimanja (ESCO), osigurana je standardiziranost i mogućnost integracije podataka te njihove usporedivosti na nivou zemalja EU. Također, korišteni su i rezultati istraživanja “European Skills & Jobs Survey”, koje u kombinaciji s drugim makroekonomskim podacima omogućavaju uspoređivanje karakteristika na nižim teritorijalnim razinama EU zemalja. Upravo korištenjem regionalnih podataka omogućen je uvid u sve specifičnosti EU tržišta rada što je bio jedan od glavnih ciljeva koji objedinjuje odrednice projektnog zadataka. Posebnost koja je zasigurno pridonijela pobjedi, jest sinergija između javnog, privatnog i obrazovnog sektora, odnosno odlična suradnja Državnog zavoda za statistiku s tvrtkom IN2data i Visokim učilištem Algebra u pripremi natjecatelja i infrastrukturi. Europska komisija će naknadno donijeti odluku o primjenjivosti najboljih koncepata i predloženih aplikativnih rješenja u službenoj statistici te na taj način olakšati donošenje odluka vezanih za izazove s kojima se Unija trenutno suočava na području obrazovanja i tržišta rada, što znači da bi se aplikacija koju je razvio hrvatski tim lako mogla naći i u stvarnoj primjeni.
>> HT: STEM nije trend, nego odluka