Preguntas con la etiqueta [dataframe]

Lista dataframe preguntas

con str(data)obtengo los headde los niveles (1-2 valores) fac1: Factor w/ 2 levels ... : fac2: Factor w/ 5 levels ... : fac3: Factor w/ 20 levels ... : val:

Pandas read_sql con parámetros

2
respuestas
92
votos
202.4k
vistas

¿Hay algún ejemplo de cómo pasar parámetros con una consulta SQL en Pandas? En particular, estoy usando un motor SQLAlchemy para conectarme a una base de datos PostgreSQL. Hasta ahora

Tengo un marco de datos donde algunas de las columnas contienen valores NA. ¿ Cómo puedo eliminar columnas donde todas las filas contienen valores NA?

Para cada fila en un marco de datos R

9
respuestas
212
votos
vistas

Tengo un marco de datos y para cada fila de ese marco de datos tengo que hacer algunas búsquedas complicadas y agregar algunos datos a un archivo. El marco de

Convierta Pandas Multi-Index en una columna

8
respuestas
265
votos
248.0k
vistas

Tengo un marco de datos con 2 niveles de índice: value Trial measurement 1 0 13 1 3 2 4 2 0 NaN 1 12 3 0 34 Que quiero

¿Cómo definir la partición de DataFrame?

5
respuestas
145
votos
204.0k
vistas

Comencé a usar Spark SQL y DataFrames en Spark 1.4.0. Quiero definir un particionador personalizado en DataFrames, en Scala, pero no veo cómo hacerlo. Una de las tablas de datos

Tengo un marco de datos con tiempos y precios de Unix. Quiero convertir la columna de índice para que se muestre en fechas legibles por humanos. Entonces, por ejemplo, tengo

¿Hay alguna manera de aplicar una función agregada a todas (o a una lista de) columnas de un marco de datos al realizar un groupBy? En otras palabras, ¿hay alguna

Creo que estoy buscando un análogo de rbind.fill(en el paquete de Hadley plyr) para cbind. Miré, pero no hay cbind.fill. Lo que quiero hacer es lo siguiente: #set these just

Tengo un marco de datos como: a1 = c(1, 2, 3, 4, 5) a2 = c(6, 7, 8, 9, 10) a3 = c(11, 12, 13, 14, 15) aframe = data.frame(a1,

Dado un marco de datos "foo", ¿cómo puedo seleccionar solo esas filas de "foo" donde, por ejemplo foo$location = "there"? foo = data.frame(location = c("here", "there", "here", "there", "where"), x

Tengo una columna en Python pandasDataFrame que tiene valores booleanos True/ False, pero para más cálculos necesito 1/ 0representación. ¿Existe una forma rápida pandasde numpyhacer eso?

La función duplicada en R realiza búsqueda de filas duplicadas. Si queremos eliminar los duplicados, solo necesitamos escribir df[!duplicated(df),]y los duplicados se eliminarán del marco de datos. ¿Pero cómo encontrar

Tengo un DataFrame simple como el siguiente: Equipo Primera Estación Juegos totales 0 Cowboys de Dallas 1960 894 1 Osos de chicago 1920 1357 2 Empacadores de Green Bay 1921

Quiero aplicar mi función personalizada (usa una escalera if-else) a estas seis columnas ( ,,,,, ) en cada fila de mi marco de datos ERI_Hispanic.ERI_AmerInd_AKNatvERI_AsianERI_Black_Afr.AmerERI_HI_PacIslERI_White Probé diferentes métodos de otras