Preguntas más recientes sobre 'dataframe'

enumerar todos los niveles de factores de un data.frame

8

respuestas

34

votos

vistas

con str(data)obtengo los headde los niveles (1-2 valores) fac1: Factor w/ 2 levels ... : fac2: Factor w/ 5 levels ... : fac3: Factor w/ 20 levels ... : val:

ckluss

r

dataframe

r-factor

Pandas read_sql con parámetros

2

respuestas

92

votos

202.4k

vistas

¿Hay algún ejemplo de cómo pasar parámetros con una consulta SQL en Pandas? En particular, estoy usando un motor SQLAlchemy para conectarme a una base de datos PostgreSQL. Hasta ahora

tobycoleman

python

sql

pandas

dataframe

psycopg2

Eliminar columnas del marco de datos donde TODOS los valores son NA

14

respuestas

210

votos

vistas

Tengo un marco de datos donde algunas de las columnas contienen valores NA. ¿ Cómo puedo eliminar columnas donde todas las filas contienen valores NA?

Gnark

r

apply

dataframe

Para cada fila en un marco de datos R

9

respuestas

212

votos

vistas

Tengo un marco de datos y para cada fila de ese marco de datos tengo que hacer algunas búsquedas complicadas y agregar algunos datos a un archivo. El marco de

Carl Coryell-Martin

r

dataframe

rows

Convierta Pandas Multi-Index en una columna

8

respuestas

265

votos

248.0k

vistas

Tengo un marco de datos con 2 niveles de índice: value Trial measurement 1 0 13 1 3 2 4 2 0 NaN 1 12 3 0 34 Que quiero

TheChymera

python

pandas

dataframe

flatten

multi-index

¿Cómo definir la partición de DataFrame?

5

respuestas

145

votos

204.0k

vistas

Comencé a usar Spark SQL y DataFrames en Spark 1.4.0. Quiero definir un particionador personalizado en DataFrames, en Scala, pero no veo cómo hacerlo. Una de las tablas de datos

rake

scala

apache-spark

dataframe

apache-spark-sql

partitioning

Convierta la hora de Unix en una fecha legible en el marco de datos de pandas

5

respuestas

222

votos

314.3k

vistas

Tengo un marco de datos con tiempos y precios de Unix. Quiero convertir la columna de índice para que se muestre en fechas legibles por humanos. Entonces, por ejemplo, tengo

W A Carnegie

python

pandas

unix-timestamp

dataframe

Spark SQL: aplica funciones agregadas a una lista de columnas

4

respuestas

98

votos

221.9k

vistas

¿Hay alguna manera de aplicar una función agregada a todas (o a una lista de) columnas de un marco de datos al realizar un groupBy? En otras palabras, ¿hay alguna

lilloraffa

apache-spark

dataframe

apache-spark-sql

aggregate-functions

cbind un marco de datos con un marco de datos vacío - cbind.fill?

10

respuestas

52

votos

vistas

Creo que estoy buscando un análogo de rbind.fill(en el paquete de Hadley plyr) para cbind. Miré, pero no hay cbind.fill. Lo que quiero hacer es lo siguiente: #set these just

Xu Wang

r

dataframe

cbind

¿Convertir la columna data.frame en un vector?

12

respuestas

222

votos

vistas

Tengo un marco de datos como: a1 = c(1, 2, 3, 4, 5) a2 = c(6, 7, 8, 9, 10) a3 = c(11, 12, 13, 14, 15) aframe = data.frame(a1,

Dolan Antenucci

r

dataframe

vector

type-conversion

Subconjunto/filtrar filas en un marco de datos según una condición en una columna

3

respuestas

87

votos

vistas

Dado un marco de datos "foo", ¿cómo puedo seleccionar solo esas filas de "foo" donde, por ejemplo foo$location = "there"? foo = data.frame(location = c("here", "there", "here", "there", "where"), x

wishihadabettername

r

dataframe

subset

r-faq

¿Cómo puedo asignar Verdadero/Falso a 1/0 en un DataFrame de Pandas?

13

respuestas

303

votos

401.4k

vistas

Tengo una columna en Python pandasDataFrame que tiene valores booleanos True/ False, pero para más cálculos necesito 1/ 0representación. ¿Existe una forma rápida pandasde numpyhacer eso?

Simon Righley

python

pandas

dataframe

numpy

boolean

Buscar índices de filas duplicadas [duplicar]

2

respuestas

82

votos

vistas

La función duplicada en R realiza búsqueda de filas duplicadas. Si queremos eliminar los duplicados, solo necesitamos escribir df[!duplicated(df),]y los duplicados se eliminarán del marco de datos. ¿Pero cómo encontrar

annndrey

r

duplicates

dataframe

Pandas DataFrame: reemplaza todos los valores en una columna, según la condición

10

respuestas

288

votos

638.2k

vistas

Tengo un DataFrame simple como el siguiente: Equipo Primera Estación Juegos totales 0 Cowboys de Dallas 1960 894 1 Osos de chicago 1920 1357 2 Empacadores de Green Bay 1921

ichimok

python

pandas

dataframe

Cree una nueva columna basada en valores de otras columnas / aplique una función de múltiples columnas, por filas en Pandas

8

respuestas

619

votos

1.3M

vistas

Quiero aplicar mi función personalizada (usa una escalera if-else) a estas seis columnas ( ,,,,, ) en cada fila de mi marco de datos ERI_Hispanic.ERI_AmerInd_AKNatvERI_AsianERI_Black_Afr.AmerERI_HI_PacIslERI_White Probé diferentes métodos de otras

Dave

python

pandas

dataframe

numpy

apply

Preguntas con la etiqueta [dataframe]