71
O Tesseract.js é uma biblioteca javascript que obtém palavras em praticamente qualquer idioma das imagens.O mecanismo de OCR do Tesseract foi um dos três principais no teste de precisão de 1995 da UNLV.Entre 1995 e 2006, ele teve pouco trabalho, mas é provavelmente um dos mecanismos de OCR de código aberto mais precisos disponíveis.O código fonte lerá uma imagem binária, cinza ou colorida e texto de saída.Um leitor tiff é construído para ler imagens TIFF descompactadas, ou libtiff pode ser adicionado para ler imagens compactadas.Existem arquivos de idiomas para vários idiomas, mesmo para o texto definido nos tipos de letra Fraktur e blackletter ....