El reconeixement òptic de caràcters (OCR) es refereix al programari que crea una versió digital d'un document imprès, escrit o escrit a mà que les computadores poden llegir sense necessitat d'escriure manualment o introduir el text. Normalment, l'OCR s'utilitza en documents escanejats en format PDF , però també pot crear una versió llegible per ordinador de text dins d'un fitxer d'imatge.
Què és OCR?
OCR, també conegut com a reconeixement de text, és una tecnologia de programari que transforma caràcters com ara números, lletres i signes de puntuació (també anomenats glifos) de documents impresos o escrits en forma electrònica més fàcilment reconeguts i llegits per ordinadors i altres programes informàtics. Alguns programes d'OCR fan això a mesura que es escanea o es fotografia amb una càmera digital i altres poden aplicar aquest procés a documents escanejats prèviament o fotografiats sense OCR. OCR permet als usuaris cercar documents PDF, editar text i tornar a formatear documents.
Per a què serveix l'OCR?
Per obtenir un ràpid i cada dia d'escaneig, l'OCR pot no ser un gran problema. Si feu una gran quantitat d'escaneig, podeu cercar fitxers PDF per trobar el que necessiteu i estalviar bastant temps i fer que la funcionalitat OCR en el vostre programa d'escàner sigui més important. A continuació es mostren algunes altres coses que ajuda amb OCR:
- Processament de dades automatitzat i entrada de dades (Exemple: sistemes de seguiment de sol·licitants de feina per als currículums)
- Feu cerques en llibres escanejats
- Conversió d'escaneigs escrits a text llegible per ordinador
- Fer els documents més utilitzables pels programes de lectors que ajuden als usuaris amb discapacitat visual
- Conservar documents històrics i diaris, al mateix temps, fer-los cerques
- Extracció de dades i transferència a programes comptables (Exemple: rebuts i factures)
- Indexació de documents per al seu ús per motors de cerca
- Reconeixement de plaques de conduir per càmera de velocitat i programari de càmera de llum vermella
- Els sintetitzadors de veu per a persones que no poden parlar - el físic teòric, Stephen Hawking, és potser l'usuari més conegut d'un programa de sintetitzador de veu
Per què utilitzar OCR?
Per què no fer una foto, oi? Com que no podreu editar res ni cercar el text perquè només seria una imatge. Escanejar el document i executar el programari OCR pot convertir aquest fitxer en alguna cosa que pugui editar i poder cercar.
Història de l'OCR
Tot i que l'ús molt primerenc del reconeixement de text data del 1914, el desenvolupament i l'ús general de les tecnologies relacionades amb l'OCR es va iniciar de debò en la dècada de 1950, específicament amb la creació de fonts molt simplificades que eren més fàcils de convertir en text llegible digitalment. La primera d'aquestes fonts simplificades va ser creada per David Shepard i comunament coneguda com OCR-7B. L'OCR-7B encara està en ús avui a la indústria financera per a la font estàndard utilitzada en targetes de crèdit i dèbit. A la dècada de 1960, els serveis postals de diversos països van començar a utilitzar la tecnologia OCR per accelerar ràpidament la classificació de correu, inclosos els Estats Units, Gran Bretanya, Canadà i Alemanya. OCR segueix sent la tecnologia bàsica utilitzada per ordenar correus per als serveis postals de tot el món. L'any 2000, es va utilitzar el coneixement clau dels límits i les capacitats de la tecnologia OCR per desenvolupar els programes CAPTCHA utilitzats per aturar els robots i els spammers.
A través de les dècades, l'OCR ha crescut de forma més precisa i més sofisticada a causa dels avenços en àrees tecnològiques relacionades, com ara la intel·ligència artificial , l'aprenentatge automàtic i la visió per computadora. Actualment, el programari OCR utilitza el reconeixement de patrons, la detecció de funcions i la mineria de text per transformar documents de manera més ràpida i precisa que mai.