
4
Common Crawl
O rastreamento comum cria e mantém um repositório aberto de dados de rastreamento da web que podem ser acessados e analisados por qualquer pessoa
- Grátis
- Web
O rastreamento comum cria e mantém um repositório aberto de dados de rastreamento da web que podem ser acessados e analisados por qualquer pessoa
Local na rede Internet:
https://commoncrawl.org/Recursos
Categorias
Alternativas ao Common Crawl para Self-Hosted

136
searx
O Searx é um mecanismo de meta-pesquisa, agregando os resultados de outros mecanismos de pesquisa sem armazenar informações sobre seus usuários.Por que usar o Searx?
- Grátis
- Self-Hosted
- Web
- Linux
- Android

30
Gigablast
O Gigablast é um novo mecanismo de pesquisa poderoso, de código aberto, que faz a indexação em tempo real!
- Grátis
- Web
- Self-Hosted

0
Elite Proxies API
Proxies elite de vida curta são atualizados a cada 1 minuto. Cada solicitação cria um nome de host privado que expira após 5 minutos.
- Pago
- Self-Hosted
- Mashape