Calcular las medias de las filas en un subconjunto de columnas
Dado un marco de datos de muestra:
C1<-c(3,2,4,4,5)
C2<-c(3,7,3,4,5)
C3<-c(5,4,3,6,3)
DF<-data.frame(ID=c("A","B","C","D","E"),C1=C1,C2=C2,C3=C3)
DF
ID C1 C2 C3
1 A 3 3 5
2 B 2 7 4
3 C 4 3 3
4 D 4 4 6
5 E 5 5 3
¿Cuál es la mejor manera de crear un segundo marco de datos que contenga la ID
columna y la media de cada fila? Algo como esto:
ID Mean
A 3.66
B 4.33
C 3.33
D 4.66
E 4.33
Algo parecido a:
RM<-rowMeans(DF[,2:4])
Me gustaría mantener los medios alineados con ID
los de ellos.
Aceptado
Calcule las medias de las filas en un subconjunto de columnas:
Cree un nuevo data.frame que especifique la primera columna de DF como una columna llamada ID y calcule la media de todos los demás campos en esa fila, y la coloque en la columna titulada 'Medios':
data.frame(ID=DF[,1], Means=rowMeans(DF[,-1]))
ID Means
1 A 3.666667
2 B 4.333333
3 C 3.333333
4 D 4.666667
5 E 4.333333
Comenzando con su marco de datos DF
, puede usar el data.table
paquete:
library(data.table)
## EDIT: As suggested by @MichaelChirico, setDT converts a
## data.frame to a data.table by reference and is preferred
## if you don't mind losing the data.frame
setDT(DF)
# EDIT: To get the column name 'Mean':
DF[, .(Mean = rowMeans(.SD)), by = ID]
# ID Mean
# [1,] A 3.666667
# [2,] B 4.333333
# [3,] C 3.333333
# [4,] D 4.666667
# [5,] E 4.333333
Puede crear una nueva fila $
en su marco de datos correspondiente a las Medias
DF$Mean <- rowMeans(DF[,2:4])
Usando dplyr :
library(dplyr)
DF %>%
transmute(ID,
Mean = rowMeans(across(C1:C3)))
O
DF %>%
transmute(ID,
Mean = rowMeans(select(., C1:C3)))
# ID Mean
# 1 A 3.666667
# 2 B 4.333333
# 3 C 3.333333
# 4 D 4.666667
# 5 E 4.333333