Preguntas con la etiqueta [data.table]
objetos data.table asignados con: = desde dentro de la función no impresos
Me gustaría modificar a data.tabledentro de una función. Si uso la :=característica dentro de la función, el resultado solo se imprime para la segunda llamada. Mira la siguiente ilustración: library(data.table)
¿`<-` también se usa para data.frames a veces mediante llamada por referencia? [duplicar]
Tengo un problema simple que quería resolver usando data.table. Me sorprendió el siguiente comportamiento, ya que pensé que las asignaciones en base R siempre se copian: library(data.table) df <- data.frame(
¿Cómo se elimina una columna por nombre en data.table?
Para deshacerme de una columna llamada "foo" en a data.frame, puedo hacer: df <- df[-grep('foo', colnames(df))] Sin embargo, una vez que dfse convierte en un data.tableobjeto, no hay forma de
Asigne varias columnas usando := en data.table, por grupo
¿ Cuál es la mejor manera de asignar a varias columnas usando data.table? Por ejemplo: f <- function(x) {c("hi", "hello")} x <- data.table(id = 1:10) Me gustaría hacer algo como
Resumiendo varias columnas con data.table
Estoy intentando utilizar data.table para acelerar el procesamiento de un data.frame grande (300k x 60) formado por varios data.frames fusionados más pequeños. Soy nuevo en data.table. El código hasta el
La forma más rápida de reemplazar NA en una tabla de datos grande
Tengo una tabla de datos grande , con muchos valores faltantes repartidos por sus ~200k filas y 200 columnas. Me gustaría volver a codificar esos valores de NA a ceros
Obteniendo los valores principales por grupo
Aquí hay un marco de datos de muestra: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Quiero que el subconjunto dcontenga las filas con los 5 valores
¿Cómo crear una variable de retraso dentro de cada grupo?
Tengo una tabla de datos: require(data.table) set.seed(1) data <- data.table(time = c(1:3, 1:4), groups = c(rep(c("b", "a"), c(3, 4))), value = rnorm(7)) data # groups time value # 1: b
Comprender exactamente cuándo una tabla de datos es una referencia a (frente a una copia de) otra tabla de datos.
Tengo algunos problemas para comprender las propiedades de paso por referencia de data.table. Algunas operaciones parecen "romper" la referencia y me gustaría entender exactamente qué está sucediendo. Al crear una
Aplicar una función a cada columna especificada en una tabla de datos y actualizarla por referencia
Tengo una tabla de datos con la que me gustaría realizar la misma operación en determinadas columnas. Los nombres de estas columnas se dan en un vector de caracteres. En
Extraer fila correspondiente al valor mínimo de una variable por grupo
Deseo (1) agrupar datos por una variable ( State), (2) dentro de cada grupo encontrar la fila de valor mínimo de otra variable ( Employees) y (3) extraer la fila
Reemplazo de NA con el último valor que no es NA
En data.frame(o data.table), me gustaría "rellenar" los NA con el valor anterior que no sea NA más cercano. Un ejemplo simple, usando vectores (en lugar de a data.frame) es el
Subconjunto de filas correspondientes al valor máximo por grupo usando data.table
Supongamos que tengo un archivo data.tableque contiene algunos jugadores de béisbol: library(plyr) library(data.table) bdt <- as.data.table(baseball) Para cada grupo (dado por el jugador 'id'), quiero seleccionar filas correspondientes al número
Seleccionar/asignar a data.table cuando los nombres de las variables se almacenan en un vector de caracteres
¿Cómo se hace referencia a las variables en a data.tablesi los nombres de las variables se almacenan en un vector de caracteres? Por ejemplo, esto funciona para data.frame: df <-