Preguntas más recientes sobre 'hadoop'

Implementación de Combiner y trabajo interno.

3

respuestas

0

votos

661

vistas

Quiero usar un combinador en mi código MR, por ejemplo WordCount. ¿Cómo debo implementarlo? ¿Qué tipo de datos se pasan al reductor desde el combinador? Sería fantástico si alguno de

Aniruddha Sinha

hadoop

mapreduce

combiners

¿Es el almacenamiento en caché la única ventaja de Spark sobre Map-Reduce?

5

respuestas

17

votos

5.3k

vistas

Empecé a aprender sobre Apache Spark y estoy muy impresionado con el marco. Aunque una cosa que me sigue molestando es que en todas las presentaciones de Spark hablan de

Knows Not Much

caching

hadoop

apache-spark

¿Cuándo utilizar Hadoop, HBase, Hive y Pig?

17

respuestas

203

votos

143.4k

vistas

¿ Cuáles son los beneficios de utilizar Hadoop , HBase o Hive ? Según tengo entendido, HBase evita el uso de map-reduce y tiene un almacenamiento orientado a columnas además

Khalefa

hadoop

hbase

hive

apache-pig

¿Cómo procesa Hadoop los registros divididos entre los límites de los bloques?

6

respuestas

125

votos

36.7k

vistas

De acuerdo con laHadoop - The Definitive Guide Los registros lógicos que define FileInputFormats generalmente no encajan perfectamente en los bloques HDFS. Por ejemplo, los registros lógicos de TextInputFormat son

Praveen Sripati

hadoop

split

mapreduce

hdfs

Advertencia de Hadoop "No se puede cargar la biblioteca nativa de Hadoop para su plataforma"

24

respuestas

321

votos

609.4k

vistas

Actualmente estoy configurando hadoop en un servidor que ejecuta CentOs . Cuando ejecuto start-dfs.sho stop-dfs.sh, aparece el siguiente error: ADVERTENCIA util.NativeCodeLoader: No se puede cargar la biblioteca nativa-hadoop para su

Olshansky

java

linux

hadoop

hadoop2

java.library.path

Preguntas con la etiqueta [hadoop]

Implementación de Combiner y trabajo interno.

¿Es el almacenamiento en caché la única ventaja de Spark sobre Map-Reduce?

¿Cuándo utilizar Hadoop, HBase, Hive y Pig?

¿Cómo procesa Hadoop los registros divididos entre los límites de los bloques?

Advertencia de Hadoop "No se puede cargar la biblioteca nativa de Hadoop para su plataforma"