Tesseract

O Tesseract.js é uma biblioteca javascript que obtém palavras em praticamente qualquer idioma das imagens.

Grátis
Windows
Mac
Linux

O Tesseract.js é uma biblioteca javascript que obtém palavras em praticamente qualquer idioma das imagens.O mecanismo de OCR do Tesseract foi um dos três principais no teste de precisão de 1995 da UNLV.Entre 1995 e 2006, ele teve pouco trabalho, mas é provavelmente um dos mecanismos de OCR de código aberto mais precisos disponíveis.O código fonte lerá uma imagem binária, cinza ou colorida e texto de saída.Um leitor tiff é construído para ler imagens TIFF descompactadas, ou libtiff pode ser adicionado para ler imagens compactadas.Existem arquivos de idiomas para vários idiomas, mesmo para o texto definido nos tipos de letra Fraktur e blackletter ....

Local na rede Internet:

https://github.com/tesseract-ocr/tesseract

Recursos

Categorias

Escritório e produtividade

Alternativas ao Tesseract para Linux

GImageReader

O gImageReader é um front-end simples do Gtk / Qt para o Tesseract OCR Engine.Features: - Importe documentos e imagens em PDF do disco, dispositivos de digitalização, área de transferência e capturas de tela

Grátis
Windows
Linux

CuneiForm

O CuneiForm (OpenOCR) é um software de reconhecimento de texto para modelos impressos.Manuscritos ou arquivos PDF, o programa não pode reconhecer, no entanto, mas estruturas de tabela.

Grátis
Windows
Mac
Linux

CopyFish

Extraia e traduza texto de imagens / vídeos / PDF em qualquer site.

OCRFeeder

O OCRFeeder é um sistema de análise de layout de documentos e reconhecimento óptico de caracteres.

Grátis
Linux

GOCR

O GOCR é um programa de reconhecimento óptico de caracteres (OCR), desenvolvido sob a licença pública GNU.Ele converte imagens digitalizadas de texto em arquivos de texto.

Grátis
Windows
Linux

OCRopus

O OCRopus (tm) é um sistema de análise de documentos e OCR de ponta, com análise de layout conectável, reconhecimento de caracteres conectável, modelagem estatística de linguagem natural ...

Grátis
Linux

VietOCR

Um front-end da GUI Java / .NET para o mecanismo Tesseract OCR.Oferece suporte ao reconhecimento óptico de caracteres no idioma vietnamita.

Grátis
Windows
Mac
Linux

OCRmyPDF

O OCRmyPDF adiciona uma camada de texto OCR aos arquivos PDF digitalizados, permitindo que sejam pesquisados ou colados.

Grátis
Mac
Linux

WatchOCR

O WatchOCR é um servidor OCR de código aberto que cria PDFs pesquisáveis a partir de imagens em uma pasta monitorada.

Grátis
Linux

YAGF

O YAGF, mais um front-end gráfico para o CuneiForm, é uma interface gráfica para ...

Grátis
Linux