03/11/2016 Doru Bulubasa

BIG DATA - baze de date de mari dimensiuni

Image blog

BIG DATA este un concept care a inceput sa prinda contur in ultima perioada. Pe zi ce trece bazele de date cresc exponential datorita numarului din ce in ce mai mare de consumatori de internet. Fie si numai simpla accesare a celui mai banal site din lume poate fi inregistrata.

Daca utilizam un motor de cautare, vom aparea intr-o baza de date a obiceiurilor pe internet cu acele cuvinte cheie pe care l-am utilizat. Astfel putem spune ca fiecare click genereaza o inregistrare. Imaginati-va cate date sunt generate daca numai intr-o secunda se fac 40.000 de cautari (cam asa sustin cei de la Google).

BIG DATA poate fi descris de urmatoarele caracteristici:

1.    Volum – Cantitatea de date generate si stocate. Dimensiunea de date determina potentialul de valoare si de întelegere si daca acesta poate fi de fapt considerat BIG DATA.
2.    Varietate - Tipul si natura datelor. Acest lucru îi ajuta pe oameni sa-l foloseasca în mod efficient pentru a analiza si a întelege rezultatele in urma analizei.
3.    Viteza – Datele sunt generate la viteze din ce in ce mai mari. Astfel, si viteza de analiza si interpretare trebuie sa fie mare pentru a putea face fata.
4.    Varietatea – Odata cu cresterea volumului de date a crescut si numarul surselor si tipurile de date. Marea majoritate a acestor date nu au o structura, ceea ce ingreuneaza semnificativ procesul de analiza.
5.    Veridicitate - Calitatea datelor capturate poate varia foarte mult, afectând o analiza corecta.

BIG DATA a lansat o adevarata industrie de procese, personal si tehnologie pentru a exploata potentialul imens al acetui nou front. Marile companii ca Amazon, Wall-Mart, Google, Microsoft etc. utilizeaza BIG DATA in conturarea strategiilor viitoare. Dar si pentru companiile mici si mijlocii joaca un rol important pentru a se putea organiza mai bine sau pentru a-si stabili strategiile de business.

Ce este de fapt, BIG DATA?

Teoretic, nu este o notiune noua aceasta nascandu-se in 2001. Este informatia detinuta de orice companie, obtinuta si procesata prin noi tehnici pentru a aduce beneficii in cel mai efficient mod posibil.

Companiile s-au straduit timp de zeci de ani sa utilizeze informatia detinuta pentru a creste sau diversifica un business. BIG DATA este special deoarece reprezinta un volum semnificativ de informatie – ceea ce poate “deschide” oportunitati, dar si modul in care aceste informatii sunt analizate poate ajuta la aceasta “deschidere”.

Interpretarea ne poate dezvalui perspective care nu sunt imediat vizibile sau care nu ar putea fi gasite folosint metode traditionale. Intreg procesul de interpretare se focuseaza pe gasirea cailor, a trendurilor sau modelelor invizile in mod normal. Tocmai acest lucru necesita tehnologii si abilitati noi.

Asadar, zilele in care datele detinute de o companie sunt stocate in documente Office frumos organizate si impartasite intre angajati sunt aproape apuse. Daca in 2002, 50 GB spatiu de stocare de fisiere era mai mult decat suficient, azi reprezinta, cel mai probabil, volumul de date generat intr-un minut.