html2text

html2text

html2text é um utilitário de linha de comando, escrito em C ++, que converte documentos HTML em texto sem formatação.
html2text é um utilitário de linha de comando, escrito em C ++, que converte documentos HTML em texto sem formatação.Cada documento HTML é carregado de um local indicado por um URI ou lido da entrada padrão e formatado em um fluxo de caracteres de texto sem formatação que é gravado na saída padrão ou em um arquivo de saída.O URI de entrada pode especificar um site remoto, a partir do qual os documentos são carregados via HTTP (Hypertext Transfer Protocol).O programa é capaz de preservar as posições originais dos campos da tabela, permite definir a largura da tela (para um determinado número de caracteres de saída) e também aceita entradas sintaticamente incorretas (tentando interpretá-las "razoavelmente").O texto em negrito e o texto sublinhado são renderizados por padrão com seqüências de backspace (que são particularmente úteis ao canalizar a saída do programa para "less" ou outro pager).Todas as propriedades de renderização podem ser amplamente realizadas através de um arquivo RC.
html2text

Local na rede Internet:

Categorias

Alternativas ao html2text para todas as plataformas com qualquer licença

HTMLAsText

HTMLAsText

Converta documentos HTML em arquivos de texto simples, removendo todas as tags HTML e formatando o texto de acordo com suas preferências.
HTMLPDF

HTMLPDF

Converta páginas da Web HTML em arquivos PDF.Sem instalação, sem registro, é gratuito e fácil de usar.