Preguntas con la etiqueta [scikit-learn]
Error de sklearn ValueError: la entrada contiene NaN, infinito o un valor demasiado grande para dtype('float64')
Estoy usando sklearn y tengo un problema con la propagación por afinidad. He creado una matriz de entrada y sigo recibiendo el siguiente error. ValueError: Input contains NaN, infinity or
¿Cómo codificar en caliente desde una columna de pandas que contiene una lista?
Me gustaría dividir una columna de pandas que consta de una lista de elementos en tantas columnas como elementos únicos, es decir, one-hot-encodeellos (con el valor 1representando un elemento determinado
¿Cómo entrenar un clasificador de bosque aleatorio con un gran conjunto de datos para evitar errores de memoria en Python?
Tengo un conjunto de datos de 30 millones de filas. Tengo dos columnas: una que contiene una etiqueta 1 o 0 y la otra columna tiene una lista de 1280
Codificación de etiquetas en varias columnas en scikit-learn
Estoy intentando usar scikit-learn LabelEncoderpara codificar pandas DataFramede etiquetas de cadenas. Como el marco de datos tiene muchas (50+) columnas, quiero evitar crear un LabelEncoderobjeto para cada columna; Prefiero tener
¿Cómo dividir los datos en 3 conjuntos (entrenamiento, validación y prueba)?
Tengo un marco de datos de pandas y deseo dividirlo en 3 conjuntos separados. Sé que al usar train_test_split de sklearn.cross_validation, se pueden dividir los datos en dos conjuntos (entrenar