Preguntas con la etiqueta [scikit-learn]

Lista scikit-learn preguntas

Estoy usando sklearn y tengo un problema con la propagación por afinidad. He creado una matriz de entrada y sigo recibiendo el siguiente error. ValueError: Input contains NaN, infinity or

Me gustaría dividir una columna de pandas que consta de una lista de elementos en tantas columnas como elementos únicos, es decir, one-hot-encodeellos (con el valor 1representando un elemento determinado

Tengo un conjunto de datos de 30 millones de filas. Tengo dos columnas: una que contiene una etiqueta 1 o 0 y la otra columna tiene una lista de 1280

Estoy intentando usar scikit-learn LabelEncoderpara codificar pandas DataFramede etiquetas de cadenas. Como el marco de datos tiene muchas (50+) columnas, quiero evitar crear un LabelEncoderobjeto para cada columna; Prefiero tener

Tengo un marco de datos de pandas y deseo dividirlo en 3 conjuntos separados. Sé que al usar train_test_split de sklearn.cross_validation, se pueden dividir los datos en dos conjuntos (entrenar