Tesseract

Tesseract

O Tesseract.js é uma biblioteca javascript que obtém palavras em praticamente qualquer idioma das imagens.
O Tesseract.js é uma biblioteca javascript que obtém palavras em praticamente qualquer idioma das imagens.O mecanismo de OCR do Tesseract foi um dos três principais no teste de precisão de 1995 da UNLV.Entre 1995 e 2006, ele teve pouco trabalho, mas é provavelmente um dos mecanismos de OCR de código aberto mais precisos disponíveis.O código fonte lerá uma imagem binária, cinza ou colorida e texto de saída.Um leitor tiff é construído para ler imagens TIFF descompactadas, ou libtiff pode ser adicionado para ler imagens compactadas.Existem arquivos de idiomas para vários idiomas, mesmo para o texto definido nos tipos de letra Fraktur e blackletter ....
tesseract

Alternativas ao Tesseract para Windows Mobile

OCR Text Detection Tool

OCR Text Detection Tool

Fornece detecção de texto rápida e precisa de qualquer arquivo de imagem baixado do seu dispositivo ou tirado com um instantâneo.Ele também suporta detecção de texto em PDF e detecção de manuscrito baseado em texto e tradução de texto em 114 idiomas diferentes.