Què és el reconeixement òptic de caràcters (OCR)?

El reconeixement òptic de caràcters (OCR) es refereix al programari que crea una versió digital d'un document imprès, escrit o escrit a mà que les computadores poden llegir sense necessitat d'escriure manualment o introduir el text. Normalment, l'OCR s'utilitza en documents escanejats en format PDF , però també pot crear una versió llegible per ordinador de text dins d'un fitxer d'imatge.

Què és OCR?

OCR, també conegut com a reconeixement de text, és una tecnologia de programari que transforma caràcters com ara números, lletres i signes de puntuació (també anomenats glifos) de documents impresos o escrits en forma electrònica més fàcilment reconeguts i llegits per ordinadors i altres programes informàtics. Alguns programes d'OCR fan això a mesura que es escanea o es fotografia amb una càmera digital i altres poden aplicar aquest procés a documents escanejats prèviament o fotografiats sense OCR. OCR permet als usuaris cercar documents PDF, editar text i tornar a formatear documents.

Per a què serveix l'OCR?

Per obtenir un ràpid i cada dia d'escaneig, l'OCR pot no ser un gran problema. Si feu una gran quantitat d'escaneig, podeu cercar fitxers PDF per trobar el que necessiteu i estalviar bastant temps i fer que la funcionalitat OCR en el vostre programa d'escàner sigui més important. A continuació es mostren algunes altres coses que ajuda amb OCR:

Per què utilitzar OCR?

Per què no fer una foto, oi? Com que no podreu editar res ni cercar el text perquè només seria una imatge. Escanejar el document i executar el programari OCR pot convertir aquest fitxer en alguna cosa que pugui editar i poder cercar.

Història de l'OCR

Tot i que l'ús molt primerenc del reconeixement de text data del 1914, el desenvolupament i l'ús general de les tecnologies relacionades amb l'OCR es va iniciar de debò en la dècada de 1950, específicament amb la creació de fonts molt simplificades que eren més fàcils de convertir en text llegible digitalment. La primera d'aquestes fonts simplificades va ser creada per David Shepard i comunament coneguda com OCR-7B. L'OCR-7B encara està en ús avui a la indústria financera per a la font estàndard utilitzada en targetes de crèdit i dèbit. A la dècada de 1960, els serveis postals de diversos països van començar a utilitzar la tecnologia OCR per accelerar ràpidament la classificació de correu, inclosos els Estats Units, Gran Bretanya, Canadà i Alemanya. OCR segueix sent la tecnologia bàsica utilitzada per ordenar correus per als serveis postals de tot el món. L'any 2000, es va utilitzar el coneixement clau dels límits i les capacitats de la tecnologia OCR per desenvolupar els programes CAPTCHA utilitzats per aturar els robots i els spammers.

A través de les dècades, l'OCR ha crescut de forma més precisa i més sofisticada a causa dels avenços en àrees tecnològiques relacionades, com ara la intel·ligència artificial , l'aprenentatge automàtic i la visió per computadora. Actualment, el programari OCR utilitza el reconeixement de patrons, la detecció de funcions i la mineria de text per transformar documents de manera més ràpida i precisa que mai.