dcsimg

Apache Spark

Apache Spark es un fuente abierta motor desarrollado específicamente para manejar el procesamiento y análisis de datos a gran escala. Spark ofrece la capacidad de acceder a datos en una variedad de fuentes, que incluyen Sistema de archivos distribuido Hadoop (HDFS), OpenStack Rápido, Amazon S3 y Cassandra.

¿Qué significa parámetro

Apache Spark está diseñado para acelerar los análisis en Hadoop al tiempo que proporciona un conjunto completo de herramientas complementarias que incluyen una biblioteca de aprendizaje automático con todas las funciones (MLlib), un motor de procesamiento de gráficos (GraphX) y procesamiento de flujo.



cual es el significado del viernes negro

Apache Spark se originó en AMPLab de UC Berkeley en 2009 y se donó en 2013 a la Fundación Apache Softre, donde se ha convertido en el proyecto más activo en términos de contribuciones.

cuando fue inventado oled

Una de las razones clave de la popularidad de Apache Spark, tanto entre los desarrolladores como entre las empresas, es su velocidad y eficiencia. Spark ejecuta programas en la memoria hasta 100 veces más rápido que MapReduce de Hadoop y hasta 10 veces más rápido en disco. Spark está diseñado de forma nativa para ejecutarse en memoria, lo que le permite admitir análisis iterativos y procesamiento de datos más rápido y menos costoso.