Preguntas con la etiqueta [dataframe]
enumerar todos los niveles de factores de un data.frame
con str(data)obtengo los headde los niveles (1-2 valores) fac1: Factor w/ 2 levels ... : fac2: Factor w/ 5 levels ... : fac3: Factor w/ 20 levels ... : val:
Pandas read_sql con parámetros
¿Hay algún ejemplo de cómo pasar parámetros con una consulta SQL en Pandas? En particular, estoy usando un motor SQLAlchemy para conectarme a una base de datos PostgreSQL. Hasta ahora
Eliminar columnas del marco de datos donde TODOS los valores son NA
Tengo un marco de datos donde algunas de las columnas contienen valores NA. ¿ Cómo puedo eliminar columnas donde todas las filas contienen valores NA?
Para cada fila en un marco de datos R
Tengo un marco de datos y para cada fila de ese marco de datos tengo que hacer algunas búsquedas complicadas y agregar algunos datos a un archivo. El marco de
Convierta Pandas Multi-Index en una columna
Tengo un marco de datos con 2 niveles de índice: value Trial measurement 1 0 13 1 3 2 4 2 0 NaN 1 12 3 0 34 Que quiero
¿Cómo definir la partición de DataFrame?
Comencé a usar Spark SQL y DataFrames en Spark 1.4.0. Quiero definir un particionador personalizado en DataFrames, en Scala, pero no veo cómo hacerlo. Una de las tablas de datos
Convierta la hora de Unix en una fecha legible en el marco de datos de pandas
Tengo un marco de datos con tiempos y precios de Unix. Quiero convertir la columna de índice para que se muestre en fechas legibles por humanos. Entonces, por ejemplo, tengo
Spark SQL: aplica funciones agregadas a una lista de columnas
¿Hay alguna manera de aplicar una función agregada a todas (o a una lista de) columnas de un marco de datos al realizar un groupBy? En otras palabras, ¿hay alguna
cbind un marco de datos con un marco de datos vacío - cbind.fill?
Creo que estoy buscando un análogo de rbind.fill(en el paquete de Hadley plyr) para cbind. Miré, pero no hay cbind.fill. Lo que quiero hacer es lo siguiente: #set these just
¿Convertir la columna data.frame en un vector?
Tengo un marco de datos como: a1 = c(1, 2, 3, 4, 5) a2 = c(6, 7, 8, 9, 10) a3 = c(11, 12, 13, 14, 15) aframe = data.frame(a1,
Subconjunto/filtrar filas en un marco de datos según una condición en una columna
Dado un marco de datos "foo", ¿cómo puedo seleccionar solo esas filas de "foo" donde, por ejemplo foo$location = "there"? foo = data.frame(location = c("here", "there", "here", "there", "where"), x
¿Cómo puedo asignar Verdadero/Falso a 1/0 en un DataFrame de Pandas?
Tengo una columna en Python pandasDataFrame que tiene valores booleanos True/ False, pero para más cálculos necesito 1/ 0representación. ¿Existe una forma rápida pandasde numpyhacer eso?
Buscar índices de filas duplicadas [duplicar]
La función duplicada en R realiza búsqueda de filas duplicadas. Si queremos eliminar los duplicados, solo necesitamos escribir df[!duplicated(df),]y los duplicados se eliminarán del marco de datos. ¿Pero cómo encontrar
Pandas DataFrame: reemplaza todos los valores en una columna, según la condición
Tengo un DataFrame simple como el siguiente: Equipo Primera Estación Juegos totales 0 Cowboys de Dallas 1960 894 1 Osos de chicago 1920 1357 2 Empacadores de Green Bay 1921
Cree una nueva columna basada en valores de otras columnas / aplique una función de múltiples columnas, por filas en Pandas
Quiero aplicar mi función personalizada (usa una escalera if-else) a estas seis columnas ( ,,,,, ) en cada fila de mi marco de datos ERI_Hispanic.ERI_AmerInd_AKNatvERI_AsianERI_Black_Afr.AmerERI_HI_PacIslERI_White Probé diferentes métodos de otras