Preguntas con la etiqueta [dataframe]
Sumar filas en data.frame o matriz
Tengo un marco de datos muy grande con filas como observaciones y columnas como marcadores genéticos. Me gustaría crear una nueva columna que contenga la suma de un número seleccionado
Fusionar dos marcos de datos por índice
Tengo los siguientes marcos de datos: > df1 id begin conditional confidence discoveryTechnique 0 278 56 false 0.0 1 1 421 18 false 0.0 1 > df2 concept 0 A
¿Cómo calcular el número de apariciones de un carácter determinado en cada fila de una columna de cadenas?
Tengo un data.frame en el que ciertas variables contienen una cadena de texto. Deseo contar el número de apariciones de un carácter determinado en cada cadena individual. Ejemplo: q.data<-data.frame(number=1:3, string=c("greatgreat",
Pandas DataFrame Groupby dos columnas y obtener recuentos
Tengo un marco de datos de pandas en el siguiente formato: df = pd.DataFrame([ [1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], list('AAABBBBABCBDDD'), [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], ['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'], ['1','3','3','2','4','2','5','3','6','3','5','1','1','1'] ]).T
Convierta una cadena que contiene un precio con espacio después de miles para que flote en la columna pandas
Tengo una columna que contiene precios con una moneda. Quiero convertir estos precios a flotadores. El problema aquí es que estos precios contienen espacios después de miles. Mi marco de
Calcular las medias de las filas en un subconjunto de columnas
Dado un marco de datos de muestra: C1<-c(3,2,4,4,5) C2<-c(3,7,3,4,5) C3<-c(5,4,3,6,3) DF<-data.frame(ID=c("A","B","C","D","E"),C1=C1,C2=C2,C3=C3) DF ID C1 C2 C3 1 A 3 3 5 2 B 2 7 4 3 C 4 3
Determinar los tipos de datos de las columnas de un marco de datos.
Estoy usando R y he cargado datos en un marco de datos usando read.csv(). ¿Cómo determino el tipo de datos de cada columna en el marco de datos?
Extraiga valores de diferentes columnas según el ID
Mi conjunto de datos contiene ID y muchas columnas que tienen ID en su nombre. data = data.frame(ID = rep(1:3,2), col1 = 1:6, col2 = 7:12, col3 = 13:18) print(data)
¿Eliminar filas que existen en otro marco de datos? [duplicar]
Tengo los dos siguientes marcos de datos (ejemplo): df1: name profile type strand A 4.5 1 + B 3.2 1 + C 5.5 1 + D 14.0 1 - E
¿Cómo deshacerse de la columna "Sin nombre: 0" en un DataFrame de pandas leído desde un archivo CSV?
Tengo una situación en la que a veces, cuando leo un csvfrom df, aparece una columna similar a un índice no deseada llamada unnamed:0. file.csv ,A,B,C 0,1,2,3 1,4,5,6 2,7,8,9 El
¿Cómo hacer que el separador en pandas read_csv sea más flexible con espacios en blanco, para separadores irregulares?
Necesito crear un marco de datos leyendo datos de un archivo, usando read_csvel método. Sin embargo, los separadores no son muy regulares: algunas columnas están separadas por tabulaciones ( \t),
Cómo acceder a submarcos de datos de pandas groupby por clave
¿Cómo accedo al marco de datos groupby correspondiente en un objeto groupby mediante la clave? Con el siguiente grupo: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B':
Asigne varias columnas usando := en data.table, por grupo
¿ Cuál es la mejor manera de asignar a varias columnas usando data.table? Por ejemplo: f <- function(x) {c("hi", "hello")} x <- data.table(id = 1:10) Me gustaría hacer algo como
Pandas df.apply no modifica DataFrame
Recién estoy comenzando con pandas, así que perdonen si esto es algo estúpido. Estoy intentando aplicar una función a una columna pero no funciona y tampoco veo ningún error. capitalizer
Agrupar ID de columnas duplicadas en el marco de datos de pandas
Ahora hay muchas preguntas similares, pero la mayoría responde cómo eliminar las columnas duplicadas. Sin embargo, quiero saber cómo puedo hacer una lista de tuplas donde cada tupla contenga los