GNU Ocrad es un programa de OCR (Reconocimiento Óptico de Caracteres) basado en un método de extracción de características. Ocrad lee una imagen en formato bmp (mapa de bits), pgm (escala de grises) o ppm (color), y produce texto en formato byte (8-bit) o UTF-8. También incluye un analizador de composición (layout) capaz de separar las columnas o bloques de texto que forman normalmente las páginas impresas.
Abstract from DBpedia / Wikipedia · CC BY-SA
via Wikidata · CC0
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).