Ce este recunoașterea optică a caracterelor (OCR)?

Cuprins:

Ce este recunoașterea optică a caracterelor (OCR)?
Ce este recunoașterea optică a caracterelor (OCR)?
Anonim

Recunoașterea optică a caracterelor (OCR) se referă la software-ul care creează o versiune digitală a unui document tipărit, dactilografiat sau scris de mână pe care computerele îl pot citi fără a fi nevoie să tastați sau să introduceți textul manual. OCR este utilizat în general pe documentele scanate în format PDF, dar poate crea și o versiune a textului care poate fi citită de computer într-un fișier imagine.

Ce este OCR

OCR, denumită și recunoașterea textului, este o tehnologie software care transformă caractere precum numere, litere și semne de punctuație (numite și glife) din documente tipărite sau scrise într-o formă electronică mai ușor de recunoscut și citit de computere și alte programe software. Unele programe OCR fac acest lucru pe măsură ce un document este scanat sau fotografiat cu o cameră digitală, iar altele pot aplica acest proces documentelor care au fost scanate sau fotografiate anterior fără OCR. OCR permite utilizatorilor să caute în documente PDF, să editeze text și să reformateze documente.

Image
Image
Scanarea unui ziar istoric cu software-ul OCR.

Getty Images

Pentru ce este folosit OCR?

Pentru nevoile de scanare rapidă și de zi cu zi, OCR poate să nu fie mare lucru. Dacă efectuați o cantitate mare de scanare, posibilitatea de a căuta în PDF-uri pentru a-l găsi pe cel exact de care aveți nevoie vă poate economisi destul de mult timp și face ca funcționalitatea OCR din programul dvs. de scanare să fie mai importantă. Iată câteva alte lucruri cu care OCR ajută:

  • Prelucrarea automată a datelor și introducerea datelor (Exemplu: sisteme de urmărire a solicitanților de locuri de muncă pentru CV-uri).
  • Se face cărțile scanate pot fi căutate.
  • Conversia scanărilor scrise de mână în text care poate fi citit de computer.
  • Fă documentele mai utilizabile de către programele de citire care ajută utilizatorii cu deficiențe de vedere.
  • Conservarea documentelor istorice și a ziarelor, făcându-le, de asemenea, posibile căutării.
  • Extragerea datelor și transferul în programe de contabilitate (Exemplu: chitanțe și facturi).
  • Indexarea documentelor pentru utilizare de către motoarele de căutare.
  • Recunoașterea plăcuțelor de înmatriculare de către o cameră de viteză și un software de cameră cu semafor roșu.
  • Sintetizatoare de vorbire pentru persoanele care nu pot vorbi – fizicianul teoretician, Stephen Hawking, este poate cel mai cunoscut utilizator al unui program de sintetizator de vorbire.

Linia de bază

De ce nu faci o poză, nu? Pentru că nu ați putea să editați nimic sau să căutați textul pentru că ar fi doar o imagine. Scanarea documentului și rularea software-ului OCR poate transforma acel fișier în ceva pe care îl puteți edita și puteți căuta.

Istoria OCR

În timp ce cea mai veche utilizare a recunoașterii textului datează din 1914, dezvoltarea și utilizarea pe scară largă a tehnologiilor legate de OCR au început cu adevărat în anii 1950, în special odată cu crearea de fonturi foarte simplificate, care erau mai ușor de convertit în format digital. text lizibil. Primul dintre aceste fonturi simplificate a fost creat de David Shepard și cunoscut sub numele de OCR-7B. OCR-7B este încă utilizat astăzi în industria financiară pentru fontul standard utilizat pe cardurile de credit și cardurile de debit. În anii 1960, serviciile poștale din mai multe țări au început să folosească tehnologia OCR pentru a accelera considerabil sortarea corespondenței, inclusiv în Statele Unite, Marea Britanie, Canada și Germania. OCR este încă tehnologia de bază folosită pentru sortarea corespondenței pentru serviciile poștale din întreaga lume. În 2000, cunoștințele cheie despre limitele și capabilitățile tehnologiei OCR au fost folosite pentru a dezvolta programele CAPTCHA utilizate pentru a opri roboții și spammerii.

De-a lungul deceniilor, OCR a devenit mai precis și mai sofisticat datorită progreselor în domenii tehnologice conexe, cum ar fi inteligența artificială, învățarea automată și viziunea computerizată. Astăzi, software-ul OCR utilizează recunoașterea modelelor, detectarea caracteristicilor și extragerea textului pentru a transforma documentele mai rapid și mai precis decât oricând.

Întrebări frecvente

    Cum scanez documente cu telefonul sau tableta mea?

    Pe iOS, deschideți aplicația Note și creați o notă nouă. Deschideți camera, apoi atingeți Scanați documente. Pe Android, deschideți Google Drive și selectați Plus (+), apoi atingeți Scanare pentru a scana document cu telefonul dvs.

    Cum folosesc OCR în Adobe Acrobat?

    Deschideți un fișier PDF care conține o imagine scanată, apoi selectați Instrumente > Editați PDF. Acrobat va aplica automat OCR, astfel încât să puteți edita textul. Doar selectați unde doriți să faceți modificări și începeți să scrieți.

    Care este diferența dintre OCR și OMR?

    Optical Mark Recognition (OMR) este un software care detectează semnele pe hârtie, de obicei o foaie cu bule. OMR este folosit pentru a procesa rezultatele examenelor, sondajelor, chestionarelor și chiar alegerilor. Spre deosebire de OCR, OMR nu poate descifra semnele de pe pagină, ci doar verifică dacă semnele sunt acolo.

Recomandat: