Tesseract

Tesseract

O Tesseract.js é uma biblioteca javascript que obtém palavras em praticamente qualquer idioma das imagens.
O Tesseract.js é uma biblioteca javascript que obtém palavras em praticamente qualquer idioma das imagens.O mecanismo de OCR do Tesseract foi um dos três principais no teste de precisão de 1995 da UNLV.Entre 1995 e 2006, ele teve pouco trabalho, mas é provavelmente um dos mecanismos de OCR de código aberto mais precisos disponíveis.O código fonte lerá uma imagem binária, cinza ou colorida e texto de saída.Um leitor tiff é construído para ler imagens TIFF descompactadas, ou libtiff pode ser adicionado para ler imagens compactadas.Existem arquivos de idiomas para vários idiomas, mesmo para o texto definido nos tipos de letra Fraktur e blackletter ....
tesseract

Alternativas ao Tesseract para Windows

PDF OCR

PDF OCR

Editável - Edite documentos PDF digitalizados, como editar um arquivo de texto! Facilmente - OCR PDF para texto, com apenas dois cliques.
Text-R

Text-R

Reconheça e salve o texto em imagens e arquivos PDF com o ASCOMP Text-R.
OCR Text Detection Tool

OCR Text Detection Tool

Fornece detecção de texto rápida e precisa de qualquer arquivo de imagem baixado do seu dispositivo ou tirado com um instantâneo.Ele também suporta detecção de texto em PDF e detecção de manuscrito baseado em texto e tradução de texto em 114 idiomas diferentes.
Transym OCR

Transym OCR

A Transym OCR (TOCR) é uma fornecedora líder de software de reconhecimento óptico de caracteres altamente sofisticado, preciso e confiável para desenvolvedores.
Photo Scan

Photo Scan

O Photo Scan permite extrair texto de Imagens ou Fotos com muita facilidade e eficiência!