Hrvatski web težio je 7 terabajta ili bilo je 96.671 .hr domena prema zadnjem mjerenju koje su odradili u Srcu, Sveučilišnom računalnom centru. Valja napomenuti da je 80.000 .hr domena bilo aktivno i pogodno za 'pobiranje' ili harvestiranje, laički rečeno, ispravno za pohranu u digitalnu arhivu. Za prvog mjerenja, prije 15 godina, veličina hrvatskog weba iznosila je 4509 .hr. domena i 14.000 poslužitelja.
Inače, uzorak izmjeren 2002. godine obuhvatio je 4667.920 resursa (objekata dostupnih webom). Veličina uzorka procijenjena je na preko 300 gigabajta podataka. Najveći broj resursa čak 67 posto otpadao je na HTML dok je na slikovne formate otpadalo 23 posto resursa. Nedavno dovršenim harvestiranjem za 2016. godinu uspješno je preuzeto 77 milijuna resursa s weba, ukupne veličine 7 terabajta. Najzastupljenije vrste sadržaja su tekst u HTML formatu 51, 3 posto i slike u jpeg formatu, njih 33,8 posto.
S obzirom na mjerenja od 2011. do danas, kada se radi o tekstualnim formatima, najzastupljeniji je pdf, dok jpeg pokazuje trend rasta i apsolutni je car slikovnih formata, rečeno je u Srcu. Kada se radi o ostalim formatima Gif, je u padu (s 4,7 2011. godine na 1,5 posto 2016)., kao i flash (s 0,5 na 01 posto) , dok je JavaScript u porastu (s 1, na 1,8 posto u pet godina mjerenja).
Stručni tim Srca, dakle, već 15 godina marljivo mjeri veličinu hrvatskog web prostora, pri čemu valja znati, da ono što se mjeri, uglavnom se odnosi na površinski dio interneta, kazuje mr. sc. Miroslav Milinović. Pomoćnik ravnatelja za informacijsku i posredničku strukturu.
Naime, složenost i dinamičnost informacijskog prostora weba predstavljala je prije 15 godina izazov kao i danas. Web su već tada uspoređivali sa santom leda kojoj je vidljiv, površinski i jednostavno dohvatljivi dio, bitno manji od nevidljivog i tehnički teško dostupnog dijela.
Kada se govori o harvestiranju, to znači prikupljanje i arhiviranje javno dostupnog sadržaja s hrvatskog prostora weba, a harvestiraju se aktivna sjedišta weba na nacionalnoj internetskoj domeni .hr u pravilu krajem kalendarske godine.
Što se tiče hrvatskog arhiva web prostora na adresi http://haw.nsk.hr moguće je pronaći gotovo sve publikacije s interneta kao dijela hrvatske kulturne baštine, koji, tvrde u Srcu jedinstven u svijetu.
>> Pogodite kakav je ovo superstroj i gdje se nalazi?