Disco MapReduce

Disco MapReduce

O Disco é uma estrutura leve e de código aberto para computação distribuída com base no paradigma MapReduce e escrito em Python.
Disco é uma implementação de mapreduce para computação distribuída.O Disco suporta cálculos paralelos em grandes conjuntos de dados, armazenados em um cluster não confiável de computadores, como na estrutura original criada pelo Google.Isso o torna uma ferramenta perfeita para analisar e processar grandes conjuntos de dados, sem ter que se preocupar com aspectos técnicos difíceis relacionados à distribuição, como protocolos de comunicação, balanceamento de carga, bloqueio, agendamento de tarefas e tolerância a falhas, que são tratados pelo Disco.
disco-mapreduce

Local na rede Internet:

Recursos

Categorias

Alternativas ao Disco MapReduce para todas as plataformas com qualquer licença

Apache Hadoop

Apache Hadoop

O Apache Hadoop é uma estrutura de software de código aberto que suporta aplicativos distribuídos com muitos dados licenciados sob a licença Apache v2.
Apache Spark

Apache Spark

O Apache Spark ™ é um mecanismo rápido e geral para processamento de dados em grande escala. O SpeedRun programa até 100x mais rápido que o Hadoop MapReduce na memória ou 10x mais rápido no disco.
Amazon Kinesis

Amazon Kinesis

Os serviços Amazon Kinesis facilitam o trabalho com dados de streaming em tempo real na nuvem da AWS.
dispy

dispy

dispy é uma estrutura Python para execução paralela de cálculos, distribuindo-os por vários processadores em uma única máquina (SMP), entre muitas máquinas em um cluster ou ...