Gigablast

Gigablast

O Gigablast é um novo mecanismo de pesquisa poderoso, de código aberto, que faz a indexação em tempo real!
O Gigablast é um novo mecanismo de pesquisa poderoso, de código aberto, que faz indexação em tempo real!Recursos Escalável para milhares de servidores.Escalou para mais de 12 bilhões de páginas da web em mais de 200 servidores.Um quad core duplo, com 32 GB de RAM e dois SSDs de 160 GB da Intel, executando 8 instâncias Gigablast, pode fazer cerca de 8 qps (consultas por segundo) em um índice de 10 milhões de páginas.As unidades estarão próximas da capacidade máxima de armazenamento.Dobrar o tamanho do índice reduzirá pela metade a taxa de qps.(As métricas de desempenho podem ser feitas cerca de dez vezes mais rápido, mas ainda não cheguei a isso. O uso do espaço em disco provavelmente permanecerá o mesmo porque já é bastante eficiente.) 1 milhão de páginas da Web requer 28,6 GB de espaço em disco.Isso inclui o índice, as meta informações e o HTML compactado de todas as páginas da web.A taxa de aranha é de cerca de 1 página por segundo por núcleo.Assim, um quad core duplo pode gerar e indexar 8 páginas por segundo, ou seja, 691.200 páginas por dia.São necessários 4 GB de RAM por instância Gigablast.(instância = processo) Demonstração ao vivo em Escrito em C / C ++ para desempenho ideal.Mais de 500.000 linhas de C / C ++.100% personalizado.Um único binário.O servidor web, o banco de dados e tudo o mais está contido neste código-fonte de maneira altamente eficiente.Facilita a administração e a solução de problemas.Confiável.Foi testado em produção ao vivo desde 2002 em bilhões de consultas em um índice de mais de 12 bilhões de páginas da web exclusivas, 24 bilhões espelhadas.Super rápido e eficiente.Um de um pequeno punhado de mecanismos de pesquisa que atingiram números tão grandes.O único mecanismo de pesquisa de código aberto que possui.Suporta todos os idiomas.Pode aumentar os resultados em idiomas especificados em relação aos outros no momento da consulta.Usa representação UTF-8 internamente.Histórico.Foi usado por muitos clientes.Foi usado com sucesso em software corporativo distribuído.Páginas da web em cache com destaque para o termo de consulta ....
gigablast

Local na rede Internet:

Categorias

Alternativas ao Gigablast para Self-Hosted

searx

searx

O Searx é um mecanismo de meta-pesquisa, agregando os resultados de outros mecanismos de pesquisa sem armazenar informações sobre seus usuários.Por que usar o Searx?
Seeks

Seeks

O Seeks é um aplicativo e design P2P gratuito e aberto para permitir a pesquisa na web social.
Sphider

Sphider

O Sphider é um mecanismo de busca e web spider leve, escrito em PHP, usando o MySQL como banco de dados de back-end.
Inout Search Engine

Inout Search Engine

Assim como o Google ou o Yahoo buscam resultados, você também pode criar um mecanismo de pesquisa privado com um script de clone.
SSEP - Site Search Engine PHP-Ajax

SSEP - Site Search Engine PHP-Ajax

Este é o script do mecanismo de busca do site que usa o MySQL para armazenar as páginas indexadas do seu site e adicionar a funcionalidade de pesquisa ao seu site.