Tesseract

Tesseract

O Tesseract.js é uma biblioteca javascript que obtém palavras em praticamente qualquer idioma das imagens.
O Tesseract.js é uma biblioteca javascript que obtém palavras em praticamente qualquer idioma das imagens.O mecanismo de OCR do Tesseract foi um dos três principais no teste de precisão de 1995 da UNLV.Entre 1995 e 2006, ele teve pouco trabalho, mas é provavelmente um dos mecanismos de OCR de código aberto mais precisos disponíveis.O código fonte lerá uma imagem binária, cinza ou colorida e texto de saída.Um leitor tiff é construído para ler imagens TIFF descompactadas, ou libtiff pode ser adicionado para ler imagens compactadas.Existem arquivos de idiomas para vários idiomas, mesmo para o texto definido nos tipos de letra Fraktur e blackletter ....
tesseract

Alternativas ao Tesseract para Mac com licença comercial

ABBYY FineReader

ABBYY FineReader

O ABBYY FineReader é um software de OCR que fornece precisão inigualável de reconhecimento de texto e recursos de conversão, praticamente eliminando a redigitação e reformatação de documentos.Até 190 idiomas são suportados para reconhecimento de texto.