Influència de seguiment amb tendències de Google Flu

No és estrany que les persones busquin informació sobre la grip quan estan malalts. Google va trobar una manera d'aprofitar aquesta tendència i utilitzar-la per calcular l'activitat de la grip per regió. Van descobrir que les dades de tendència de cerca eren en realitat al voltant de dues setmanes més ràpid que els mètodes tradicionals de seguiment de brots de grip (CDC).

Google Flu Trends us donarà una estimació del nivell de brot actual als EUA o bé descompondre'l per estat. També podeu veure les tendències dels últims anys i cercar un lloc per trobar vacunes contra la gripe a prop vostre.

Dades massives

Google Flu Trends és un exemple dels descobriments que es poden fer amb "grans dades", un terme utilitzat per descriure conjunts de dades massius estructurats o no estructurats que siguin massa grans i complexos per ser examinats utilitzant mètodes tradicionals.

L'anàlisi tradicional de les dades sol implicar-se mantenint el que heu recopilat a una mida manejable. Els investigadors van utilitzar mostres estadístiques més petites de grups molt grans per fer conjectures informades sobre el grup més gran. Per exemple, la votació política es fa cridant a un nombre relativament reduït de persones i fent-los preguntes. Si el mostreig s'assembla al grup més gran (per exemple, tots els electors de Massachusetts), els resultats de l'enquesta del petit grup es poden utilitzar per fer conjectures sobre el grup més gran. Heu de tenir un conjunt de dades molt net i saber què cerqueu.

Les grans dades, d'altra banda, utilitzen conjunts de dades el més gran possible, per exemple, totes les consultes de cerca a Google. Quan utilitzeu un conjunt de dades que sigui gran, també obtingueu dades "desordenades": entrades incompletes, entrades de cerca de gats que passen pels teclats, etc. Està bé. Una gran anàlisi de dades pot tenir-ho en compte i encara acabo extreient conclusions que d'altra manera no s'han trobat.

Un d'aquests descobriments va ser Google Flu Trends, que observa els punts més alts en les consultes de cerca dels símptomes de la grip. No sempre Google, "Hey, tinc la grip. Bé Google, on és un metge proper a mi?" Tendiu a cercar coses com "un mal de cap i febre". La lleu tendència a l'alça d'un conjunt de consultes de cerca molt desordenat i gran és el que potencia les tendències de la grip Google.

Això és més que una novetat ja que detecta punts de grip més ràpids que els CDC. El CDC es basa en proves positives de grip de metges i hospitals. Això vol dir que la gent s'ha d'emmalaltir prou per visitar un metge en números suficients per provocar un augment de la prova de la grip, i després els laboratoris han d'informar la tendència. La gent ja està malalta quan puguis mobilitzar el tractament.