1
Disco é uma implementação de mapreduce para computação distribuída.O Disco suporta cálculos paralelos em grandes conjuntos de dados, armazenados em um cluster não confiável de computadores, como na estrutura original criada pelo Google.Isso o torna uma ferramenta perfeita para analisar e processar grandes conjuntos de dados, sem ter que se preocupar com aspectos técnicos difíceis relacionados à distribuição, como protocolos de comunicação, balanceamento de carga, bloqueio, agendamento de tarefas e tolerância a falhas, que são tratados pelo Disco.
Local na rede Internet:
http://discoproject.org/Recursos
Categorias
Alternativas ao Disco MapReduce para Mac
18
Apache Hadoop
O Apache Hadoop é uma estrutura de software de código aberto que suporta aplicativos distribuídos com muitos dados licenciados sob a licença Apache v2.
9
Apache Spark
O Apache Spark ™ é um mecanismo rápido e geral para processamento de dados em grande escala. O SpeedRun programa até 100x mais rápido que o Hadoop MapReduce na memória ou 10x mais rápido no disco.