Preguntas con la etiqueta [hadoop]
Implementación de Combiner y trabajo interno.
Quiero usar un combinador en mi código MR, por ejemplo WordCount. ¿Cómo debo implementarlo? ¿Qué tipo de datos se pasan al reductor desde el combinador? Sería fantástico si alguno de
¿Es el almacenamiento en caché la única ventaja de Spark sobre Map-Reduce?
Empecé a aprender sobre Apache Spark y estoy muy impresionado con el marco. Aunque una cosa que me sigue molestando es que en todas las presentaciones de Spark hablan de
¿Cuándo utilizar Hadoop, HBase, Hive y Pig?
¿ Cuáles son los beneficios de utilizar Hadoop , HBase o Hive ? Según tengo entendido, HBase evita el uso de map-reduce y tiene un almacenamiento orientado a columnas además
¿Cómo procesa Hadoop los registros divididos entre los límites de los bloques?
De acuerdo con laHadoop - The Definitive Guide Los registros lógicos que define FileInputFormats generalmente no encajan perfectamente en los bloques HDFS. Por ejemplo, los registros lógicos de TextInputFormat son
Advertencia de Hadoop "No se puede cargar la biblioteca nativa de Hadoop para su plataforma"
Actualmente estoy configurando hadoop en un servidor que ejecuta CentOs . Cuando ejecuto start-dfs.sho stop-dfs.sh, aparece el siguiente error: ADVERTENCIA util.NativeCodeLoader: No se puede cargar la biblioteca nativa-hadoop para su