Apache Nutch

Apache Nutch

O Apache Nutch é um projeto de software de rastreador da Web de código aberto altamente extensível e escalável.Nutch é totalmente codificado na linguagem de programação Java, mas os dados são gravados em formatos independentes da linguagem.Possui uma arquitetura altamente modular, permitindo que os desenvolvedores criem plug-ins para análise de tipo de mídia, recuperação de dados, consulta e cluster.O buscador ("robô" ou "rastreador da web") foi criado do zero especificamente para este projeto.
apache-nutch

Local na rede Internet:

Categorias

Alternativas ao Apache Nutch para todas as plataformas com qualquer licença