Què és Google DeepMind?

by Jeremy Laukkonen

Com s'inscriu l'aprenentatge profund en els productes que utilitzeu

DeepMind pot referir-se a dues coses: la tecnologia darrere de la intel·ligència artificial de Google (AI), i l'empresa que s'encarrega de desenvolupar aquesta intel·ligència artificial. La companyia anomenada DeepMind és una filial d'Alphabet Inc., que també és la companyia matriu de Google, i la tecnologia d'intel·ligència artificial de DeepMind s'ha convertit en una sèrie de projectes i dispositius de Google .

Si utilitzeu Google Home o Google Assistant , la vostra vida ja s'ha intersecado amb Google DeepMind de manera sorprenent.

Com i per què Google va adquirir DeepMind?

DeepMind va ser fundada el 2011 amb l'objectiu de "solucionar la intel·ligència i utilitzar-la per resoldre la resta". Els fundadors van abordar el problema de l'aprenentatge automàtic amb coneixements sobre la neurociència amb l'objectiu de crear algoritmes de propòsit general poderosos que podrien per aprendre més que necessitat de ser programat.

Diversos grans jugadors del camp AI van veure la gran quantitat de talent que DeepMind va reunir, en forma d'experts en intel·ligència artificial i investigadors, i Facebook va fer una obra per adquirir la companyia el 2012.

L'acord de Facebook es va enfonsar, però Google va ingressar i va adquirir DeepMind el 2014 per uns 500 milions de dòlars. DeepMind es va convertir en una filial d'Alphabet Inc. durant la reestructuració corporativa de Google que va tenir lloc el 2015 .

La raó principal de Google per comprar DeepMind era començar a crear la seva pròpia investigació d'intel·ligència artificial. Mentre el campus principal de DeepMind es va mantenir a Londres, Anglaterra després de l'adquisició, un equip aplicat va ser enviat a la seu de Google a Mountain View, Califòrnia per treballar en la integració de DeepMind AI amb productes de Google.

Què és Google fent amb DeepMind?

L'objectiu de DeepMind de resoldre intel·ligència no va canviar quan va lliurar les claus a Google. El treball continuat en l'aprenentatge profund , que és un tipus d'aprenentatge automàtic que no és específic de tasques. Això vol dir que DeepMind no està programat per a una tasca específica, a diferència de les AI anteriors.

Per exemple, el Deep Blue d'IBM va derrotar famós al Gran Maestro d'escacs Gary Kasparov. Tanmateix, Deep Blue va ser dissenyat per realitzar aquesta funció específica i no era útil fora d'aquest propòsit. DeepMind, per contra, està dissenyat per aprendre de l'experiència, que teòricament fa que sigui útil en moltes aplicacions diferents.

La intel·ligència artificial de DeepMind ha après a jugar a jocs de vídeo primerencs, com Breakout, millor que fins i tot els millors jugadors humans, i un programa d'ordinador Go impulsat per DeepMind va aconseguir derrotar a un jugador de campió Go 5 a zero.

A més de la recerca pura, Google també integra DeepMind AI en els seus productes principals de cerca i productes de consum, com ara telèfons d'inici i Android.

Com afecta Google DeepMind a la vostra vida quotidiana?

Les eines profundes d'aprenentatge de DeepMind s'han implementat en tota l'espectre dels productes i serveis de Google, de manera que si utilitzeu Google per a qualsevol cosa, hi ha moltes possibilitats que hagueu interactuat amb DeepMind d'alguna manera.

Alguns dels llocs més destacats de DeepMind AI s'han utilitzat inclouen reconeixement de veu, reconeixement d'imatges, detecció de fraus, detecció i identificació de correu brossa, reconeixement d'escriptura a mà, traducció, Street View i fins i tot cerca local.

Reconeixement de veu sobrenatural de Google

El reconeixement de veu o la capacitat d'una computadora per interpretar comandaments parlats ha estat durant molt de temps, però els gustos de Siri , Cortana , Alexa i Google Assistant l'han aportat més i més a la nostra vida quotidiana.

En el cas de la pròpia tecnologia de reconeixement de veu de Google, s'ha aprofitat molt l'aprenentatge profund. De fet, l'aprenentatge automàtic ha permès que el reconeixement de veu de Google aconsegueixi un nivell de precisió sorprenent per a la llengua anglesa, fins al punt que és tan precís com un oient humà.

Si teniu algun dispositiu de Google, com ara un telèfon Android o Google Home, això té una aplicació directa i real a la vostra vida. Cada vegada que dius, "Bé, Google" seguit d'una pregunta, DeepMind flexiona els músculs per ajudar Google Assistant a comprendre el que estàs dient.

Aquesta aplicació de l'aprenentatge automàtic al reconeixement de veu té un impacte addicional que s'aplica específicament a Google Home. A diferència de Alexa d'Amazon, que utilitza vuit micròfons per comprendre millor les ordres de veu, el reconeixement de veu de DeepMind de Google Home només necessita dos.

Inici de Google i Assistant Voice Generation

La síntesi de parla tradicional utilitza alguna cosa anomenada concatenativa de text a veu (TTS). Quan interactueu amb un dispositiu que utilitzi aquest mètode de síntesi de veu, consulteu una base de dades plena de fragments de veu i els assembla en paraules i frases. Això resulta en paraules estranyes i flexibles, i generalment és bastant clar que no hi ha un humà darrere de la veu.

DeepMind va abordar la generació de veu amb un projecte anomenat WaveNet. Això permet que les veus generades artificialment, com el que heu escoltat quan parleu amb Google Home o Google Assistant al vostre telèfon, soni molt més natural.

WaveNet també es basa en mostres de discurs humà real, però no les utilitza per sintetitzar res directament. En lloc d'això, analitza les mostres del discurs humà per saber com funcionen les formes d'ona d'àudio en brut. Això permet que es capaciti per parlar idiomes diferents, utilitzar accents, o fins i tot estar capacitats per sonar com una persona específica.

A diferència d'altres sistemes TTS, WaveNet també genera sons no habituals, com la respiració i el smacking de llavis, que poden fer que sembli encara més realista.

Si voleu escoltar la diferència entre una veu generada a través de text a veu concatenatiu i una generada per WaveNet, DeepMind té algunes mostres de veu molt interessants que podeu escoltar.

Aprenentatge profund i Google Photo Search

Sense intel·ligència artificial, la recerca d'imatges es basa en pistes de context com etiquetes, text envoltant a llocs web i noms de fitxers. Amb les eines d'aprenentatge profundes de DeepMind, la cerca de Google Fotos va ser capaç d'aprendre coses semblants, permetent-vos cercar les vostres pròpies imatges i obtenir resultats rellevants sense haver d'etiquetar res.

Per exemple, podeu cercar "gos" i retirar imatges del vostre gos que hàgiu pres, tot i que mai no l'heu etiquetat. Això és perquè va ser capaç d'aprendre el que els gossos semblen, de la mateixa manera que els humans aprenen coses semblants. I, a diferència del somni profund obsessionat de Google, és més del 90 per cent exacte en identificar tot tipus d'imatges diferents.

DeepMind a Google Lens i a la Cerca visual

Un dels impactes més sorprenents que ha fet DeepMind és Google Lens. Aquest és bàsicament un motor de cerca visual que us permet capturar una foto d'alguna cosa al món real i, alhora, treure informació sobre això. I no funcionaria sense DeepMind.

Tot i que la implementació és diferent, això és similar a la manera com s'utilitza l'aprenentatge profund a la cerca d'imatges de Google+. Quan feu una foto, Google Lens pot mirar-lo i esbrinar què és. A partir d'això, pot realitzar diverses funcions.

Per exemple, si fa una foto d'un referent famós, us proporcionarà informació sobre el punt de referència o si feu una fotografia d'una botiga local, podeu retirar informació sobre aquesta botiga. Si la imatge inclou un número de telèfon o una adreça de correu electrònic, Google Lens també podrà reconèixer-ho i us donarà l'opció de trucar al número o enviar un correu electrònic.