Preguntas con la etiqueta [data.table]

Lista data.table preguntas

Me gustaría modificar a data.tabledentro de una función. Si uso la :=característica dentro de la función, el resultado solo se imprime para la segunda llamada. Mira la siguiente ilustración: library(data.table)

Tengo un problema simple que quería resolver usando data.table. Me sorprendió el siguiente comportamiento, ya que pensé que las asignaciones en base R siempre se copian: library(data.table) df <- data.frame(

Para deshacerme de una columna llamada "foo" en a data.frame, puedo hacer: df <- df[-grep('foo', colnames(df))] Sin embargo, una vez que dfse convierte en un data.tableobjeto, no hay forma de

¿ Cuál es la mejor manera de asignar a varias columnas usando data.table? Por ejemplo: f <- function(x) {c("hi", "hello")} x <- data.table(id = 1:10) Me gustaría hacer algo como

Resumiendo varias columnas con data.table

1
respuestas
81
votos
vistas

Estoy intentando utilizar data.table para acelerar el procesamiento de un data.frame grande (300k x 60) formado por varios data.frames fusionados más pequeños. Soy nuevo en data.table. El código hasta el

Tengo una tabla de datos grande , con muchos valores faltantes repartidos por sus ~200k filas y 200 columnas. Me gustaría volver a codificar esos valores de NA a ceros

Aquí hay un marco de datos de muestra: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Quiero que el subconjunto dcontenga las filas con los 5 valores

Tengo una tabla de datos: require(data.table) set.seed(1) data <- data.table(time = c(1:3, 1:4), groups = c(rep(c("b", "a"), c(3, 4))), value = rnorm(7)) data # groups time value # 1: b

Tengo algunos problemas para comprender las propiedades de paso por referencia de data.table. Algunas operaciones parecen "romper" la referencia y me gustaría entender exactamente qué está sucediendo. Al crear una

Tengo una tabla de datos con la que me gustaría realizar la misma operación en determinadas columnas. Los nombres de estas columnas se dan en un vector de caracteres. En

Deseo (1) agrupar datos por una variable ( State), (2) dentro de cada grupo encontrar la fila de valor mínimo de otra variable ( Employees) y (3) extraer la fila

En data.frame(o data.table), me gustaría "rellenar" los NA con el valor anterior que no sea NA más cercano. Un ejemplo simple, usando vectores (en lugar de a data.frame) es el

Supongamos que tengo un archivo data.tableque contiene algunos jugadores de béisbol: library(plyr) library(data.table) bdt <- as.data.table(baseball) Para cada grupo (dado por el jugador 'id'), quiero seleccionar filas correspondientes al número

¿Cómo se hace referencia a las variables en a data.tablesi los nombres de las variables se almacenan en un vector de caracteres? Por ejemplo, esto funciona para data.frame: df <-