Pojam veliki podaci (big data) skovali su i počeli se njime spontano služiti znanstvenici iz područja astronomije i genomike početkom 2000-ih godina. Vrlo brzo termin počinje označavati novu tehnologiju poznatu kao tehnologija velike količine podataka. Taj spoznajni alat danas se koristi ne samo u znanosti, već i u brojnim drugim područjima ljudske djelatnosti. Tehnologija big data komplementarna je sa strojnim učenjem, odnosno umjetnom inteligencijom i ostalim relevantnim visokim tehnologijama.
Nova tehnologija
Za tehnologiju velike količine podataka do sada nije artikulirana precizna i sveobuhvatna definicija, ali su jasna načela njenog funkcioniranja. Jedan od bitnih preduvjeta djelotvornog funkcioniranja tehnologije big data jest akumuliranje ogromne količine kvalitetnih podataka, koji će biti uključeni u procesuiranje. Taj proces mora obavljati i nadgledati kompetentna radna snaga.
Tehnologija velike količine podataka vezana je za senzore i računalne sustave, koji su stvorili pretpostavke za sustavnu afirmaciju podataka. Treba napomenuti kako su za te procese potrebna moćna računala. Do njihovog pojavljivanja, informacije su zauzimale početnu odnosno temeljnu poziciju u spoznajnim procesima. Pri tome su podaci bili na njezinim marginama.
Valja upozoriti kako ni informacija nije jednoznačno definirana, te se koristi za određivanje različitih sadržaja ovisno o kontekstu. U tom pogledu Boris Bosančić u knjizi Informacija u teoriji ustvrđuje :“Kao jedan od najeksponiranijih termina današnjice, pojam informacija uzrok je brojnih nesporazuma : za jedne još jedan buzzword u nizu, trendovski izraz koji se rabi u marketinške svrhe, za druge kulturni izum koji je došao do izražaja u određenom trenutku vremena, za treće temelj „nove znanosti“ (i nove fizike) koja će počivati na informaciji, a ne na materiji i energiji.“
Pojam big data nastao je zbog potrebe označavanja nove spoznajne realnosti s kojom su se suočili znanstvenici. Naime, ogromne količine podataka počele su nadilaziti memorijske i procesne mogućnosti računala, što je ponukalo znanstvenike i razvojne inženjere da poboljšaju alate odnosno metode kojima su se služili pri njihovoj analizi. Tako su nastale nove tehnologije procesuiranja kao što su, primjerice, Googleov MapReduce i njegov open source ekvivalent Hadoop, koji je razvio Yahoo.
Kao što je svojevremeno teleskop stvorio pretpostavke za drastično bolje poznavanje svemira, a mikroskop omogućio puno bolji uvid u svijet mikroba, nove tehnike prikupljanja i analiziranja golemih količina podataka pripomogle su u sagledavanju naše društvene i ekonomske zbilje na posve novi način. Digitalizacija je u tome nedvojbeno ključni proces, koji je kapilarno integriran u sve segmente ljudskog djelovanja. Interesantno je spomenuti kako je već 2007. godine svega sedam posto podataka bilo analogno (knjige, različite druge tiskovine, fotografije i ostalo), dok je ostatak bio digitalan.
Ekspanzija digitalnih podataka iznimno je brza. Njihova količina se udvostručava svakih, nešto manje od tri godine. Tako je 2013. godine u svijetu prikupljeno oko 1.200 eksabajta podataka (jedan eksabajt = 1.000 petabajta odnosno jedan eksabajt = 1.000.000.000.000.000.000 bajtova, to jest jedan eksabajt sadrži milijun trilijuna bajtova). U ukupnoj količini akumuliranih podataka 2013. godine analogni podaci sudjelovali su sa manje od dva posto. Digitalizacija je u svjetskim razmjerima asimetrična, to jest, u najvećoj mjeri koncentrirana je u razvijenim zemljama.
Zanimljivo je spomenuti kako je u trećem stoljeću prije Krista, staroegipatski matematičar i astronom Ptolomej nastojao pohraniti sve pisane uratke njegova doba u veliku knjižnicu u Aleksandriji, a koji su predstavljali sveukupno svjetsko znanje. Danas je takva misija neizvodiva, premda se od mnoštva generiranih podataka tek manja količina odnosi na znanje. Nove spoznaje nastaju u desetinama tisuća različitih institucija razasutih diljem svijeta, a obuhvaćaju, primjerice, istraživačke institute, sveučilišta, korporativne jedinice za istraživanje i razvoj, medije, javne administracije, stručna udruženja, samostalne intelektualce, trustove mozgova i dr.
Spoznajne sposobnosti
Kao što je internetska tehnologija, ne tako davno, umrežavanjem računala radikalno promijenila komunikacijske procese, tako je i tehnologija big data temeljito preinačila naše spoznajne sposobnosti. Računala, umjetna inteligencija i senzori integrirali su se u sve segmente života i rada. Ta ekspanzija odnosno porast računalnih uređaja, te integracija umjetne inteligencije u sve veći broj proizvoda i usluga kao i njihovo umrežavanje odvija se munjevitom brzinom.
Spomenuti procesi ukazuju na poznatu zakonitost koja kaže kako rast kvantitete u jednom trenutku rezultira kvalitativnim razvojem. Tu zakonitost možemo uočiti u prirodnim, ali i društvenim procesima. Stoga smo okruženi planiranim, neplaniranim odnosno spontanim promjenama. Općenito govoreći, promjene mogu biti linearne i predvidive, ali i eksponencijalne i nepredvidljive. Neke od njih su teško zamjetljive ili praktično neprimjetne, a mogu u značajnoj mjeri utjecati na društvenu zbilju.
Živimo u vrijeme nastanka većeg broja novih visokih tehnologija koje potiču kvantitativne i kvalitativne promjene, čije su posljedice teško sagledive. U tom kontekstu treba promišljati tehnologiju big data koja drastično povećava spoznajne kapacitete ljudi, što uključuje i predviđanje neposredne budućnosti.
Svojevremeno su znanstvenici i razvojni inženjeri tehnološkog giganta Googlea objavili zapaženi članak u prestižnom znanstvenom časopisu Nature o principima širenja epidemije gripe u Sjedinjenim Američkim Državama. Autori su u tekstu objasnili kako uz pomoć tehnologije big data Google može predvidjeti širenje gripe u SAD-u, ne samo na razini čitave države, već i na razini pojedinih regija, pa i pojedinih saveznih država. Za razliku od stručnjaka američkog Centra za kontrolu i sprečavanje zaraznih bolesti, čije su se procjene širenje gripe odnosile na budući tjedan ili dva, Google je te prognoze izdavao u realnom vremenu. Konkretnije govoreći, u sezoni gripe 2007/2008. stručnjaci Googlea predviđali su kretanje epidemije na dnevnoj bazi.
Eksperti Googlea prognoze nisu izrađivali uz pomoć kontakata s liječničkim ordinacijama, već na temelju procesuiranja mnoštva podataka na novi način. To je uključivalo korištenje algoritama dizajniranih za te potrebe, što je rezultiralo specifičnim uvidima vrlo velikih praktičnih vrijednosti. Javno zdravstvo samo je jedno od područja u kojima tehnologija big data može pružiti korisne spoznaje.
Takva uporaba podataka korjenito je preinačila tretman odnosno shvaćanje podataka kod znanstvenika, poslovnih ljudi, a sve više i kod šire javnosti. Podaci se više ne tretiraju na statičan i reduciran način, čija korisnost prestaje onog trenutka kada su upotrijebljeni, kao što je to slučaj, primjerice, s podatkom o tome kada je sletio zrakoplov. Nasuprot tome, podatak poprima polivalentnu svrhu odnosno postaje resurs koji se može višekratno koristiti za različite namjene i u brojnim analizama. Na taj način podaci postaju sastavni element kontinuiranog generiranja vrijednosti. To je jedna od inovacija, to jest, novi princip djelovanja u postmodernom društvu i gospodarstvu.
U pojedinim slučajevima tehnologija big data potpomognuta srodnim naprednim tehnologijama, prvenstveno senzorskim, omogućava prikupljanje i obradu svih činjenica odnosno elemenata vezanih za pojedini događaj. Prije pojave tih tehnologija takva sveobuhvatna-totalna analiza nije bila moguća, Za potrebe propitivanja pojedinih zbivanja koristile su se statističke metode uzorkovanja i prosječnih vrijednosti. Istraživači nikada nisu raspolagali svim potrebnim podacima i informacijama, pa su konačni rezultati uvijek bili približni, a gotovo nikada potpuno točni.
Hipoteze, zavisne i nezavisne varijable, kontrolne grupe i ostale istraživačke metode služile su za osiguravanje što veće preciznosti. Pri tome nisu mogle obuhvatiti sve činjenice, te su bile ograničene samo na one dostupne. Stoga je u društvenim znanostima često dolazilo do velikih odstupanja znanstvenih predviđanja od stvarnih događaja koji su kasnije uslijedili.
Tehnologija big data pruža točne prognoze za blisku, to jest, neposrednu budućnost, ali pri tome ne pruža uvid u logiku i suštinu odvijanja samih događanja koja će uslijediti. Taj hendikep do punog izražaja dolazi u fundamentalnim znanstvenim istraživanjima. O tome je nužno voditi računa kako bi se izbjegle negativne posljedice spoznajnih manjkavosti, koje ima tehnologija big data. Tehnološki spoznajni napredak nužno je oplemeniti kritičnim i kreativnim promišljanjima ljudi, koji su i dalje bitna karika u tom procesu.
Mr.sc. Marinko Kovačić
Comments