30
Gigablast
O Gigablast é um novo mecanismo de pesquisa poderoso, de código aberto, que faz a indexação em tempo real!
- Grátis
- Web
- Self-Hosted
O Gigablast é um novo mecanismo de pesquisa poderoso, de código aberto, que faz indexação em tempo real!Recursos Escalável para milhares de servidores.Escalou para mais de 12 bilhões de páginas da web em mais de 200 servidores.Um quad core duplo, com 32 GB de RAM e dois SSDs de 160 GB da Intel, executando 8 instâncias Gigablast, pode fazer cerca de 8 qps (consultas por segundo) em um índice de 10 milhões de páginas.As unidades estarão próximas da capacidade máxima de armazenamento.Dobrar o tamanho do índice reduzirá pela metade a taxa de qps.(As métricas de desempenho podem ser feitas cerca de dez vezes mais rápido, mas ainda não cheguei a isso. O uso do espaço em disco provavelmente permanecerá o mesmo porque já é bastante eficiente.) 1 milhão de páginas da Web requer 28,6 GB de espaço em disco.Isso inclui o índice, as meta informações e o HTML compactado de todas as páginas da web.A taxa de aranha é de cerca de 1 página por segundo por núcleo.Assim, um quad core duplo pode gerar e indexar 8 páginas por segundo, ou seja, 691.200 páginas por dia.São necessários 4 GB de RAM por instância Gigablast.(instância = processo) Demonstração ao vivo em Escrito em C / C ++ para desempenho ideal.Mais de 500.000 linhas de C / C ++.100% personalizado.Um único binário.O servidor web, o banco de dados e tudo o mais está contido neste código-fonte de maneira altamente eficiente.Facilita a administração e a solução de problemas.Confiável.Foi testado em produção ao vivo desde 2002 em bilhões de consultas em um índice de mais de 12 bilhões de páginas da web exclusivas, 24 bilhões espelhadas.Super rápido e eficiente.Um de um pequeno punhado de mecanismos de pesquisa que atingiram números tão grandes.O único mecanismo de pesquisa de código aberto que possui.Suporta todos os idiomas.Pode aumentar os resultados em idiomas especificados em relação aos outros no momento da consulta.Usa representação UTF-8 internamente.Histórico.Foi usado por muitos clientes.Foi usado com sucesso em software corporativo distribuído.Páginas da web em cache com destaque para o termo de consulta ....
gigablast