0
Newspaper
O Newspaper é uma extração de metadados de notícias, texto completo e artigo, criada com o Python 3. CARACTERÍSTICAS - Funciona em mais de 10 idiomas (inglês, chinês, alemão, árabe, ...) - Estrutura de download de artigos com vários threads - Identificação de URL de notícias -Extração de texto a partir de html - Extração de imagem superior a partir de html - Extração de todas as imagens a partir de html - Extração de palavras-chave a partir de texto - Extração resumida de texto - Extração de autor por texto - Extração de termos de tendências do Google
newspaper-metadata-extractor-