Què és exactament "grans dades"?

I per què és un gran repartiment?

"Grans dades" és la nova ciència de comprendre i predir la conducta humana mitjançant l'estudi de grans volums de dades no estructurades. Les grans dades també es coneixen com a "anàlisi predictiu".

L'anàlisi de les publicacions de Twitter, els canals de Facebook, les cerques d'eBay, els rastrejadors de GPS i els caixers automàtics són exemples de dades importants. L'estudi de vídeos de seguretat, dades de trànsit, patrons meteorològics, arribades de vol, registres de torres de telefonia cel·lular i seguidors de ritme cardíac són altres formes. Les grans dades són una nova ciència desordenada que canvia de manera setmanal, i només alguns experts ho entenen tot.

Quins són alguns exemples de grans dades en la vida normal?

captura de pantalla http://project.wnyc.org/transit-time

Tot i que els projectes de dades més grans són molt clars, hi ha exemples reeixits de grans dades que afecten la vida quotidiana de les persones, les empreses i els governs:

Predicció de brots de virus: mitjançant l'estudi de dades sociopolítiques, dades meteorològiques i climàtiques i dades hospitalàries / clíniques, aquests científics preveuen brots de febre de dengue amb un avís previ de 4 setmanes.

Vigilància d'homicidi: aquest gran projecte de dades perfila víctimes d'assassinat, sospitosos i criminals a Washington, DC. Tant com a forma d'honrar al difunt com a recurs de consciència per a les persones, aquest gran projecte de dades és fascinant.

Transit Travel Planning, NYC: el programador de ràdio WNYC Steve Melendez combina l'horari de metro en línia amb el programa d'itinerari de viatges. La seva creació permet als neozelandesos fer clic a la seva ubicació al mapa, i es mostrarà una predicció del temps de viatge dels trens i del metro.

Xerox va reduir la pèrdua de la força laboral: el treball del centre de trucades és extenuant emocionalment. Xerox ha estudiat resums de dades amb l'ajuda d'analistes professionals, i ara poden predir quins contactes de centres d'atenció telefònica probablement es mantindran amb l'empresa el més llarg.

Suport a la lluita contra el terrorisme: mitjançant l'estudi de mitjans socials, registres financers, reserves de vols i dades de seguretat, l'aplicació de la llei pot predir i localitzar sospitosos terroristes abans que facin els seus actes perversos.

Ajustar el màrqueting de marca en funció de les ressenyes de les xarxes socials : les persones comparteixen sense parar i ràpid les seves opinions en línia en un pub, restaurant o gimnàs. És possible estudiar aquests milions de publicacions en els mitjans de comunicació social i proporcionar comentaris a l'empresa sobre el que la gent pensa en els seus serveis.

Qui usa grans dades? Què fan amb això?

Moltes empreses monolítiques utilitzen grans dades per ajustar les seves ofertes i preus per maximitzar la satisfacció del client.

Per què hi ha una gran quantitat de dades tan gran?

4 coses fan importants dades importants:

1. Les dades són massives. No s'adaptarà a un únic disc dur , i molt menys a una memòria USB . El volum de dades supera amb escreix el que la ment humana pot percebre (pensa en un milió de milions de megabytes i, a continuació, multipliqueu-la per més de milers de milions).

2. Les dades són desordenades i no estructurades. El 50% al 80% del gran treball de dades és la conversió i la neteja de la informació, de manera que es pugui buscar i ordenar. Només uns quants mil experts del nostre planeta saben perfectament com fer aquesta neteja de dades. Aquests experts també necessiten eines molt especialitzades, com ara HPE i Hadoop, per fer el seu treball. Potser en 10 anys, els grans experts en dades es convertiran en una dotzena de centenars d'euros, però ara com ara són una espècie d'analista molt rara i el seu treball encara és molt obscur i tediós.

3. Les dades s'han convertit en una mercaderia ** que es pot vendre i comprar. Existeixen mercats de dades on empreses i particulars poden comprar terabytes de xarxes socials i altres dades. La majoria de les dades estan basades en núvol, ja que és massa gran per adaptar-se a qualsevol disc dur. Les dades de compra normalment impliquen una tarifa de subscripció en què es connecta a una granja de servidors de núvol.

** Els líders de grans eines i idees de dades són Amazon, Google, Facebook i Yahoo. Atès que aquestes empreses atén a tants milions de persones amb els seus serveis en línia, té sentit que serien el punt de recollida i els visionaris darrere de les grans analítiques de dades.

4. Les possibilitats de les grans dades són infinites. Potser els metges diran algun dia preveure atacs cardíacs i accidents cerebrovasculars per a individus setmanes abans que passin. Els accidents d'avions i automòbils es poden reduir mitjançant anàlisi predictiu de les seves dades mecàniques i el trànsit i els patrons meteorològics. Les cites en línia podrien millorar-se tenint grans predictors de dades de qui són personalitats compatibles per a vosaltres. Els músics podrien comprendre què és la composició musical més agradable per als gustos canviants del públic objectiu. Els nutricionistes podrien predir quina combinació d'aliments comprats a la botiga agreujarà o ajudarà a les condicions mèdiques d'una persona. La superfície només s'ha ratllat, i els descobriments en grans dades ocorren cada setmana.

Big Data és desordenat

Monty Rakusen / Getty

Les grans dades són analítiques predictius: la conversió de dades no estructurades massives en cerques que es poden cercar i ordenar. Es tracta d'un espai desordenat i caòtic que requereix un tipus especial de coneixement i paciència.

Prengui, per exemple, el servei de lliurament UPS monolític. Els programadors de l'UPS estudien les dades dels GPS dels seus conductors i els seus telèfons intel·ligents per analitzar les maneres més eficients d'adaptar-se a la congestió del trànsit. Aquestes dades GPS i telèfon intel·ligent són gegantanes i no estan preparades per a l'anàlisi automàticament. Aquestes dades provenen de diverses bases de dades GPS i mapes, a través de diferents dispositius de maquinari per a telèfons intel·ligents. Els analistes d'UPS han passat mesos convertint totes aquestes dades en un format que es pot buscar i ordenar fàcilment. Tanmateix, l'esforç ha valgut la pena. Avui, UPS ha estalviat més de 8 milions de galons de combustible des que van començar a utilitzar aquestes grans analítiques de dades.

A causa de que les dades importants són desordenades i requereix tant esforç per netejar-les i preparar-se per l'ús, els científics de dades s'han convertit en sobrenomenats 'consellers de dades' per tot el treball tediós que fan. El

La ciència de grans dades i anàlisi predictiu millora cada setmana. Espereu que les dades importants siguin accessibles per a tothom l'any 2025.

No es tracta d'una amenaça intrusa per privadesa de grans dades?

Feingersh / Getty

Sí, si les nostres lleis i les vostres defenses de privadesa individuals no es gestionen acuradament, les grans dades s'introdueixen en la privadesa personal. Tal com està, Google i YouTube i Facebook ja fan un seguiment dels vostres hàbits diaris . El telèfon intel·ligent i la vida informàtica deixen petjades digitals cada dia, i empreses sofisticades estudien aquestes petjades.

Les lleis que envolten grans dades estan evolucionant. La privadesa és un estat de ser que ara cal assumir la responsabilitat personal, ja que ja no podreu esperar-ho com a dret per defecte.

Què podeu fer per protegir la vostra privadesa:

El major pas únic que podeu fer és encapçalar els vostres hàbits diaris mitjançant una connexió de xarxa VPN . Un servei VPN generarà el senyal de manera que la vostra identitat i ubicació estiguin, com a mínim, parcialment enmascarades pels seguidors. Això no farà que sigui 100% anònim, però una VPN reduirà substancialment quant pot observar els vostres hàbits en línia.

On puc obtenir més informació sobre les grans dades?

Monty Raskusen / Getty

Les grans dades són una cosa fascinant per a les persones amb ments analítiques i un amor per la tecnologia. Si és així, definitivament visiteu aquesta pàgina de projectes interessants de grans dades.