Tesseract

Tesseract

O Tesseract.js é uma biblioteca javascript que obtém palavras em praticamente qualquer idioma das imagens.
O Tesseract.js é uma biblioteca javascript que obtém palavras em praticamente qualquer idioma das imagens.O mecanismo de OCR do Tesseract foi um dos três principais no teste de precisão de 1995 da UNLV.Entre 1995 e 2006, ele teve pouco trabalho, mas é provavelmente um dos mecanismos de OCR de código aberto mais precisos disponíveis.O código fonte lerá uma imagem binária, cinza ou colorida e texto de saída.Um leitor tiff é construído para ler imagens TIFF descompactadas, ou libtiff pode ser adicionado para ler imagens compactadas.Existem arquivos de idiomas para vários idiomas, mesmo para o texto definido nos tipos de letra Fraktur e blackletter ....

Alternativas ao Tesseract para Linux

GImageReader

GImageReader

O gImageReader é um front-end simples do Gtk / Qt para o Tesseract OCR Engine.Features: - Importe documentos e imagens em PDF do disco, dispositivos de digitalização, área de transferência e capturas de tela
CuneiForm

CuneiForm

O CuneiForm (OpenOCR) é um software de reconhecimento de texto para modelos impressos.Manuscritos ou arquivos PDF, o programa não pode reconhecer, no entanto, mas estruturas de tabela.
CopyFish

CopyFish

Extraia e traduza texto de imagens / vídeos / PDF em qualquer site.
OCRFeeder

OCRFeeder

O OCRFeeder é um sistema de análise de layout de documentos e reconhecimento óptico de caracteres.
GOCR

GOCR

O GOCR é um programa de reconhecimento óptico de caracteres (OCR), desenvolvido sob a licença pública GNU.Ele converte imagens digitalizadas de texto em arquivos de texto.
OCRopus

OCRopus

O OCRopus (tm) é um sistema de análise de documentos e OCR de ponta, com análise de layout conectável, reconhecimento de caracteres conectável, modelagem estatística de linguagem natural ...
VietOCR

VietOCR

Um front-end da GUI Java / .NET para o mecanismo Tesseract OCR.Oferece suporte ao reconhecimento óptico de caracteres no idioma vietnamita.
OCRmyPDF

OCRmyPDF

O OCRmyPDF adiciona uma camada de texto OCR aos arquivos PDF digitalizados, permitindo que sejam pesquisados ​​ou colados.
WatchOCR

WatchOCR

O WatchOCR é um servidor OCR de código aberto que cria PDFs pesquisáveis ​​a partir de imagens em uma pasta monitorada.
YAGF

YAGF

O YAGF, mais um front-end gráfico para o CuneiForm, é uma interface gráfica para ...