12
ArchiveBox
Archive O arquivo da web auto-hospedado de código aberto.Leva o histórico do navegador / favoritos / Pocket / Pinboard / etc., Salva HTML, JS, PDFs, mídia e muito mais.
- Grátis
Como os sites modernos são complicados e geralmente dependem de conteúdo dinâmico, o ArchiveBox arquiva os sites em vários formatos diferentes, além do que os serviços públicos de arquivamento, como Archive.org e Archive.is, podem salvar.O ArchiveBox importa uma lista de URLs de stdin, URL remoto ou arquivo e adiciona as páginas a uma pasta de arquivamento local usando o wget para criar um clone html navegável, o youtube-dl para extrair mídia e uma instância completa do Chrome sem cabeçalho para PDF,Captura de tela e dumps do DOM e muito mais ... O uso de vários métodos e o navegador dominante no mercado para executar JS garante que podemos salvar até os sites mais complexos e exigentes em pelo menos alguns formatos de dados de alta qualidade e longo prazo.### Pode importar links de: - Pocket, Pinboard, Instapaper - RSS, XML, JSON ou listas de texto sem formatação - Histórico do navegador ou favoritos (Chrome, Firefox, Safari, IE, Opera e mais) - Shaarli, Delicious, RedditPosts salvos, Wallabag, Unmark.it e qualquer outro texto com links!### Pode salvar estas coisas para cada site: - `favicon.ico` favicon do site -` example.com / page-name.html` wget clone do site, com .html anexado se não estiver presente - `output.pdf` PDF impresso do site usando chrome sem cabeça - `screenshot.png` 1440x900 captura de tela do site usando chrome sem cabeça -` output.html` DOM Despejo do HTML após renderização usando chrome sem cabeça - `archive.org.txt 'Um link para osite salvo em archive.org - `warc /` para o arquivo warc html + gzipped.gz - `media /` qualquer mp4, mp3, legendas e metadados encontrados usando o youtube-dl - `git /` clone de qualquer repositório para links do github, bitbucket ou gitlab - `index.html` &` index.json`Arquivos de índice HTML e JSON contendo metadados e detalhes O arquivamento é aditivo, para que você possa agendar o `. / Archive` para executar regularmente e inserir novos links no índice.Todo o conteúdo salvo é estático e indexado com arquivos JSON, portanto, ele permanece para sempre e é facilmente analisável, não requer back-end sempre em execução.
archivebox
Categorias
Alternativas ao ArchiveBox para Web com licença comercial
124
19
3
Fossilo
O Fossilo.com arquiva continuamente sites completos como PDF e vários outros formatos para serem facilmente abertos e visualizados sem nenhuma dependência no futuro.Você pode navegar pelos arquivos dentro da plataforma ou fazer o download como um pacote independente.