Què és el reconeixement de veu?

Ús de la vostra veu com a mètode d'entrada

El reconeixement de veu és una tecnologia que permet l'entrada de parlants als sistemes. Parleu amb l'ordinador, el telèfon o el dispositiu i utilitza el que heu dit com a entrada per activar una acció. La tecnologia s'utilitza per reemplaçar altres mètodes d'entrada com escriure, fer clic o seleccionar d'altres maneres. És un mitjà per fer que els dispositius i el programari siguin més fàcils d'usar i augmentin la productivitat.

Hi ha moltes aplicacions i àrees on s'utilitza el reconeixement de veu, incloent-hi l'exèrcit, com a ajuda per a persones amb discapacitat (imagina una persona amb parany o sense mans o dits), en el camp mèdic, en la robòtica, etc. En un futur pròxim, gairebé tothom estarà exposat al reconeixement de veu a causa de la seva propagació entre dispositius comuns com ordinadors i telèfons mòbils.

Alguns telèfons intel·ligents fan un ús interessant del reconeixement de veu. Els dispositius iPhone i Android són exemples d'això. A través d'ells, podeu iniciar una trucada a un contacte amb només rebre instruccions parlades com ara "Call office". També es poden entretenir altres ordres, com ara "Activar Bluetooth".

Problemes amb el reconeixement de veu

El reconeixement de veu, en la seva versió coneguda com Speech to Text (STT), també s'ha utilitzat durant molt de temps per traduir paraules parlades al text. "Parleu, escriu", com diria ViaVoice a la seva caixa. Però hi ha un problema amb STT tal com el coneixem. Més de 10 anys enrere, he provat ViaVoice i no va durar una setmana al meu ordinador. Per què? Era molt inexacte i vaig acabar gastant més temps i energia parlant i corregint que escriure tot. ViaVoice és un dels millors de la indústria, així que imaginem la resta. La tecnologia ha madurat i millorat, però la paraula al text encara fa que les persones facin preguntes. Una de les seves principals dificultats és la immensa variació entre les persones en pronunciar paraules.

No es suposa que tots els idiomes es considerin en el reconeixement de veu i que sovint no s'admeten els que fan, com també l'anglès. Com a resultat, la majoria de dispositius que executen programari de reconeixement de veu funcionen de manera raonable només amb l'anglès.

Un conjunt de requisits de maquinari fa que el reconeixement de veu sigui difícil de desplegar en certs casos. Necessiteu un micròfon prou intel·ligent per filtrar el soroll de fons, però alhora prou potent com per capturar la veu naturalment.

Parlant de soroll de fons, pot provocar que tot el sistema falli. Com a resultat, el reconeixement de veu falla, en molts casos, a causa de sorolls que no tenen control de l'usuari.

El reconeixement de veu està demostrant estar millor com un mètode d'entrada per a telèfons nous i tecnologies de la comunicació com VoIP, que com a eina de productivitat per a l'entrada de text massiu.

Aplicacions del reconeixement de veu

La tecnologia està guanyant popularitat en moltes àrees i ha tingut èxit en el següent:

- Control del dispositiu. Només dient que "Acceptar Google" a un telèfon Android dispara un sistema que és tot a la vista en les ordres de veu.

- Sistemes de cotxe Bluetooth. Molts cotxes estan equipats amb un sistema que connecta el seu mecanisme de ràdio al telèfon intel·ligent a través de Bluetooth. A continuació, podeu fer i rebre trucades sense tocar el vostre telèfon intel·ligent, i fins i tot podeu marcar números simplement dient-les.

- Transcripció de veu. En àrees on la gent ha d'escriure molt, un programari intel·ligent captura les paraules parlades i les transcriu en text. Això és actual en un determinat programari de processament de textos. La transcripció de veu també funciona amb correu de veu visual .