html2text

html2text

html2text é um utilitário de linha de comando, escrito em C ++, que converte documentos HTML em texto sem formatação.
html2text é um utilitário de linha de comando, escrito em C ++, que converte documentos HTML em texto sem formatação.Cada documento HTML é carregado de um local indicado por um URI ou lido da entrada padrão e formatado em um fluxo de caracteres de texto sem formatação que é gravado na saída padrão ou em um arquivo de saída.O URI de entrada pode especificar um site remoto, a partir do qual os documentos são carregados via HTTP (Hypertext Transfer Protocol).O programa é capaz de preservar as posições originais dos campos da tabela, permite definir a largura da tela (para um determinado número de caracteres de saída) e também aceita entradas sintaticamente incorretas (tentando interpretá-las "razoavelmente").O texto em negrito e o texto sublinhado são renderizados por padrão com seqüências de backspace (que são particularmente úteis ao canalizar a saída do programa para "less" ou outro pager).Todas as propriedades de renderização podem ser amplamente realizadas através de um arquivo RC.
html2text

Local na rede Internet:

Categorias

Alternativas ao html2text para Web com licença de código aberto