Definition
Textigenkänning avser identifiering av texttecken i bilder eller skannade dokument. Det inkluderar igenkänning av tryckt och handskriven text.
Syfte
Syftet är att göra text i visuella format tillgänglig och sökbar.
Betydelse
- Möjliggör digitalisering av arkiv.
- Avgörande för tillgänglighet och automatisering.
- Noggrannheten beror på bildkvaliteten.
- Relaterat till OCR-tekniker.
Så fungerar det
- Spara skannade eller fotograferade dokument.
- Förbearbeta bilder för att förbättra skärpan.
- Identifiera textregioner.
- Tillämpa igenkänningsmodeller.
- Skriv ut maskinläsbar text.
Exempel (verkliga världen)
- Google Lens: känner igen text i foton.
- ABBYY FineReader: digitaliserar skannade dokument.
- Tesseract OCR: textigenkänningsmotor med öppen källkod.
Referenser / Vidare läsning
- Smith, R. “En översikt över Tesseract OCR-motorn.” ICDAR.
- ISO/IEC 15938-4-standarden.
- IEEE-transaktioner om mönsteranalys och maskinintelligens.