Common Crawl

Common Crawl

O rastreamento comum cria e mantém um repositório aberto de dados de rastreamento da web que podem ser acessados ​​e analisados ​​por qualquer pessoa
O rastreamento comum cria e mantém um repositório aberto de dados de rastreamento da web que podem ser acessados ​​e analisados ​​por qualquer pessoa
common-crawl

Local na rede Internet:

Alternativas ao Common Crawl para Self-Hosted

searx

searx

O Searx é um mecanismo de meta-pesquisa, agregando os resultados de outros mecanismos de pesquisa sem armazenar informações sobre seus usuários.Por que usar o Searx?
Gigablast

Gigablast

O Gigablast é um novo mecanismo de pesquisa poderoso, de código aberto, que faz a indexação em tempo real!
Elite Proxies API

Elite Proxies API

Proxies elite de vida curta são atualizados a cada 1 minuto. Cada solicitação cria um nome de host privado que expira após 5 minutos.