Mikä on optisen merkin tunnistus (OCR)?

Optinen merkki tunnistus (OCR) tarkoittaa ohjelmistoa, joka luo digitaalisen version tulostetusta, kirjoitetusta tai käsinkirjoitetusta asiakirjasta, jota tietokoneet voivat lukea ilman manuaalista kirjoittamista tai tekstin syöttämistä. OCR: ää käytetään yleensä skannatuissa asiakirjoissa PDF- muodossa, mutta se voi myös luoda tietokoneella luettavissa olevan tekstiversion kuvatiedostossa.

Mikä on OCR?

OCR, jota kutsutaan myös tekstin tunnistukseksi, on ohjelmistoteknologia, joka muuntaa merkkejä, kuten numeroita, kirjaimia ja välimerkkejä (kutsutaan myös kuvakkeiksi) painetuista tai kirjallisista asiakirjoista sähköiseen muotoon, joka tunnistetaan ja luetaan tietokoneiden ja muiden ohjelmien avulla. Jotkin OCR-ohjelmat tekevät tämän asiakirjan skannattavaksi tai valokuvaksi digitaalikameralla, ja muut voivat soveltaa tätä prosessia asiakirjoihin, jotka on aiemmin skannattu tai kuvattu ilman OCR: tä. OCR: n avulla käyttäjät voivat etsiä PDF-dokumentteja, muokata tekstiä ja muotoilla uudelleen asiakirjoja.

Mitä OCR-tekniikkaa käytetään?

Nopean, päivittäisen skannauksen tarpeisiin OCR ei ehkä ole iso juttu. Jos teet suuren määrän skannausta, pystyt etsimään PDF-tiedostoja löytääkseen tarkat tiedot, voit säästää melko vähän aikaa ja tehostaa skanneriohjelman OCR-toimintoja. Tässä on muutamia muita asioita, joita OCR auttaa:

Miksi käyttää OCR?

Miksi ei vain oteta kuvaa, eikö? Koska et voi muokata mitään tai etsiä tekstiä, koska se olisi vain kuva. Asiakirjan skannaaminen ja OCR-ohjelmiston suorittaminen voivat muuttaa tiedoston sellaiseksi, jota voit muokata ja etsiä.

OCR: n historia

Vaikka tekstin tunnistamisen varhaisin käyttöaste on vuodelta 1914, OCR-tekniikoiden laaja-alainen kehittäminen ja käyttö alkoi vilpittömästi 1950-luvulla erityisesti luomalla hyvin yksinkertaistettuja fontteja, jotka oli helpompi muuntaa digitaalisesti luettavaksi tekstiksi. Ensimmäinen näistä yksinkertaistetuista fonteista on luonut David Shepard ja tunnetaan yleisesti nimellä OCR-7B. OCR-7B on edelleen käytössä rahoitusalalla nykyään luottokorteilla ja debit-kortilla käytettävän vakiotyypin osalta. 1960-luvulla postilaitokset useissa maissa alkoivat käyttää OCR-tekniikkaa huomattavasti nopeuttamalla postiluokittelua, mukaan lukien Yhdysvallat, Iso-Britannia, Kanada ja Saksa. OCR on edelleen ydintekniikka, jota käytetään postipalvelujen lajitteluun eri puolilla maailmaa. Vuonna 2000 OCR-tekniikan rajojen ja ominaisuuksien avainosaamista käytettiin CAPTCHA-ohjelmien kehittämiseen, joita käytetään robottien ja roskapostittajien pysäyttämiseen.

Vuosikymmenien aikana OCR on kasvanut tarkempaa ja kehittyneempää johtuen edistyksistä vastaavissa teknologian aloilla, kuten tekoäly , koneen oppiminen ja tietokoneen visio. Nykyään OCR-ohjelmisto käyttää kuvioiden tunnistamista, ominaisuuksien tunnistamista ja tekstinlouhintaa asiakirjojen muokkaamiseen nopeammin ja tarkemmin kuin koskaan aiemmin.