Como ya os hemos comentado en otra ocasión, gImageReader es una aplicación de reconocimiento óptico de caracteres basada en Tesseract, un motor de reconocimiento de caracteres que utiliza inteligencia artificial para reconocer texto en imágenes.
Tesseract es uno de los motores OCR más populares del mercado. Esta biblioteca es de código abierto.
gImageReader es un front-end que utiliza el motor Tesseract para facilitarnos la tarea de realizar el reconocimiento de texto en imágenes o archivos pdf.
En este post, vamos a ver cómo instalarlo en Ubuntu 22.04:
Para empezar, agregamos el repositorio ppa:sandromani/gimagereader:
sudo add-apt-repository ppa:sandromani/gimagereader
Una vez agregado, instalamos los paquetes gimagereader-gtk tesseract-ocr tesseract-ocr-eng tesseract-ocr-spa hunspell-es:
sudo apt -y install gimagereader tesseract-ocr tesseract-ocr-eng tesseract-ocr-spa hunspell-es
Con ésto, habremos instalado de un plumazo gimagereader junto con las librerías de tesseract en inglés, en español y el diccionario de español (hunspell-es).
Be the first to comment