Whoosh

Whoosh

Whoosh é uma biblioteca de classes e funções para indexar texto e depois pesquisar no índice.Ele permite que você desenvolva mecanismos de pesquisa personalizados para o seu conteúdo.
Whoosh é uma biblioteca de indexação e pesquisa de texto completo rápida e com recursos, implementada em Python puro.Os programadores podem usá-lo para adicionar facilmente a funcionalidade de pesquisa a seus aplicativos e sites.Cada parte de como o Whoosh funciona pode ser ampliada ou substituída para atender exatamente às suas necessidades.Alguns dos recursos do Whoosh incluem: API Pythonic.Pure-Python.Sem compilação ou pacotes binários necessários, sem falhas misteriosas.Indexação e pesquisa em campo.Indexação e recuperação rápidas - mais rápidas do que qualquer outra solução de pesquisa em Python puro que eu conheça.Consulte Benchmarks.Algoritmo de pontuação conectável (incluindo BM25F), análise de texto, armazenamento, formato de postagem, etc. Linguagem de consulta poderosa.Verificador ortográfico Python puro de qualidade de produção (até onde eu sei, o único).... Whoosh pode ser útil nas seguintes circunstâncias: Em qualquer lugar, é desejável uma solução em Python puro para evitar a necessidade de compilar / compilar bibliotecas nativas (ou forçar os usuários a compilar / compilar).Como plataforma de pesquisa (pelo menos para programadores que acham o Python mais fácil de ler e trabalhar com o Java;) Quando uma interface Pythonic fácil de usar é mais importante para você do que a velocidade bruta.Se seu aplicativo pode fazer bom uso de uma solução de pesquisa / pesquisa profundamente integrada, você pode confiar apenas em estar lá, em vez de ter duas soluções de pesquisa diferentes (uma integrada simples / lenta / doméstica, uma dependência binária indexada / rápida / externa como umaopção).Whoosh foi criado e é mantido por Matt Chaput.Foi originalmente criado para uso no sistema de ajuda on-line do software de animação 3D Houdini da Side Effects Software.A Side Effects Software Inc. concordou graciosamente em abrir o código-fonte.
whoosh

Alternativas ao Whoosh para Java

elasticsearch

elasticsearch

O ElasticSearch é um servidor de pesquisa distribuído, RESTful, de código aberto / gratuito baseado em Java sob a Licença Apache (Lucene).