OCR er dem med optisk tegngenkendelse eller også kendt på spansk som optisk tegngenkendelse. OCR er en software, der muliggør tekstgenkendelse, der producerer et billede af den til at omdanne den til en række tegn og derefter gemme dem i et givet format, der kan bruges i disse tekstredigeringsprogrammer. Med andre ord, takket være denne nye teknologi, kan enhver type tekst eller dokument, inklusive PDF-filer, scannede papirer eller endda billeder taget fra digitale kameraer, konverteres til data for at have mulighed for at blive redigeret.
Denne software fungerer som følger, først analyserer den hver del af billedet af det pågældende dokument; distribuere siden i stykker som f.eks. tabeller, billeder, tekstblokke; derefter fordeles linjerne i ord for senere at blive tegn; og da tegnene allerede er angivet, foretager softwaren sammenligningen med en gruppe billeder af mønsteret. Dette skrider frem i henhold til hypoteserien om, hvad hver karakter er; og baseret på disse hypoteser analyserer den de forskellige varianter af at bryde linjer i ord og ord i tegn. Og det er efter et stort antal analyser og behandling af hypoteserne, at programmet endelig præsenterer den allerede anerkendte og transformerede tekst med et nyt format.
Det skal bemærkes, at der i dag er en række programmer, som computermarkedet tilbyder baseret på OCR, såsom OmniPage, Abbyy Fine Reader eller READiris. YY, der har evnen til ikke kun at analysere og genkende en tekst som sådan, men også genkende format og stil, men med visse begrænsninger, hvilket kræver, at teksten, efter at være analyseret, redigeres for at foretage de justeringer, der er kræve.