Preguntas con la etiqueta [dataframe]

Lista dataframe preguntas

Sumar filas en data.frame o matriz

0
respuestas
107
votos
vistas

Tengo un marco de datos muy grande con filas como observaciones y columnas como marcadores genéticos. Me gustaría crear una nueva columna que contenga la suma de un número seleccionado

Fusionar dos marcos de datos por índice

7
respuestas
332
votos
595.8k
vistas

Tengo los siguientes marcos de datos: > df1 id begin conditional confidence discoveryTechnique 0 278 56 false 0.0 1 1 421 18 false 0.0 1 > df2 concept 0 A

Tengo un data.frame en el que ciertas variables contienen una cadena de texto. Deseo contar el número de apariciones de un carácter determinado en cada cadena individual. Ejemplo: q.data<-data.frame(number=1:3, string=c("greatgreat",

Tengo un marco de datos de pandas en el siguiente formato: df = pd.DataFrame([ [1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], list('AAABBBBABCBDDD'), [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], ['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'], ['1','3','3','2','4','2','5','3','6','3','5','1','1','1'] ]).T

Tengo una columna que contiene precios con una moneda. Quiero convertir estos precios a flotadores. El problema aquí es que estos precios contienen espacios después de miles. Mi marco de

Dado un marco de datos de muestra: C1<-c(3,2,4,4,5) C2<-c(3,7,3,4,5) C3<-c(5,4,3,6,3) DF<-data.frame(ID=c("A","B","C","D","E"),C1=C1,C2=C2,C3=C3) DF ID C1 C2 C3 1 A 3 3 5 2 B 2 7 4 3 C 4 3

Estoy usando R y he cargado datos en un marco de datos usando read.csv(). ¿Cómo determino el tipo de datos de cada columna en el marco de datos?

Mi conjunto de datos contiene ID y muchas columnas que tienen ID en su nombre. data = data.frame(ID = rep(1:3,2), col1 = 1:6, col2 = 7:12, col3 = 13:18) print(data)

Tengo los dos siguientes marcos de datos (ejemplo): df1: name profile type strand A 4.5 1 + B 3.2 1 + C 5.5 1 + D 14.0 1 - E

Tengo una situación en la que a veces, cuando leo un csvfrom df, aparece una columna similar a un índice no deseada llamada unnamed:0. file.csv ,A,B,C 0,1,2,3 1,4,5,6 2,7,8,9 El

Necesito crear un marco de datos leyendo datos de un archivo, usando read_csvel método. Sin embargo, los separadores no son muy regulares: algunas columnas están separadas por tabulaciones ( \t),

¿Cómo accedo al marco de datos groupby correspondiente en un objeto groupby mediante la clave? Con el siguiente grupo: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B':

¿ Cuál es la mejor manera de asignar a varias columnas usando data.table? Por ejemplo: f <- function(x) {c("hi", "hello")} x <- data.table(id = 1:10) Me gustaría hacer algo como

Pandas df.apply no modifica DataFrame

2
respuestas
8
votos
5.3k
vistas

Recién estoy comenzando con pandas, así que perdonen si esto es algo estúpido. Estoy intentando aplicar una función a una columna pero no funciona y tampoco veo ningún error. capitalizer

Ahora hay muchas preguntas similares, pero la mayoría responde cómo eliminar las columnas duplicadas. Sin embargo, quiero saber cómo puedo hacer una lista de tuplas donde cada tupla contenga los