Preguntas con la etiqueta [group-by]

Lista group-by preguntas

Tengo un marco de datos con tres columnas de cadena. Sé que el único valor de la tercera columna es válido para cada combinación de los dos primeros. Para limpiar

Quiero dividir el siguiente marco de datos según la columna ZZ df = N0_YLDF ZZ MAT 0 6.286333 2 11.669069 1 6.317000 6 11.669069 2 6.324889 6 11.516454 3 6.320667

Necesito contar IDvalores únicos en cada domain. tengo datos: ID, domain 123, vk.com 123, vk.com 123, twitter.com 456, vk.com' 456, facebook.com 456, vk.com 456, google.com 789, twitter.com 789, vk.com lo

Supongamos que tengo pandas DataFrame como este: df = pd.DataFrame({'id':[1,1,1,2,2,2,2,3,4], 'value':[1,2,3,1,2,3,4,1,1]}) que se parece a: id value 0 1 1 1 1 2 2 1 3 3 2 1 4

¿Qué significa la cláusula SQL "GROUP BY 1"?

6
respuestas
388
votos
233.2k
vistas

Alguien me envió una consulta SQL donde la GROUP BYcláusula consistía en la declaración: GROUP BY 1. Esto debe ser un error tipográfico ¿verdad? Ninguna columna recibe el alias 1.

Orden de MySQL por antes de agrupar por

13
respuestas
301
votos
443.7k
vistas

Hay muchas preguntas similares aquí, pero no creo que ninguna responda la pregunta adecuadamente. Continuaré con la pregunta más popular actual y usaré su ejemplo si está bien. La tarea

agrupar por en agrupar por y promedio

3
respuestas
131
votos
420.9k
vistas

Tengo un marco de datos como este: cluster org time 1 a 8 1 a 6 2 h 34 1 c 23 2 d 74 3 w 6 Me gustaría

Me gustaría mostrar la columna Ben mi siguiente SQL, pero cuando la agrego a la consulta me da el siguiente error: La columna T2.B' no es válida en la lista

Recuperando el último registro de cada grupo - MySQL

34
respuestas
1.3k
votos
1.2M
vistas

Hay una tabla messagesque contiene datos como se muestra a continuación: Id Name Other_Columns ------------------------- 1 A A_data_1 2 A A_data_2 3 A A_data_3 4 B B_data_1 5 B B_data_2

Dado un marco de datos, quiero agrupar por la primera columna y obtener la segunda columna como listas en filas, de modo que un marco de datos como: a b

¿Hay alguna diferencia entre GROUP BY y DISTINCT?

25
respuestas
467
votos
380.0k
vistas

Las dos consultas siguientes dan cada una el mismo resultado: SELECT column FROM table GROUP BY column SELECT DISTINCT column FROM table ¿Hay algo diferente en la forma en que

Llenar los valores faltantes por media en cada grupo

0
respuestas
136
votos
154.0k
vistas

Esto debería ser sencillo, pero lo más parecido que he encontrado es esta publicación: pandas: Llenar valores faltantes dentro de un grupo , y todavía no puedo resolver mi problema...

¿Cómo encuentro todas las filas en un DataFrame de pandas que tienen el valor máximo para countla columna, después de agruparlas por ['Sp','Mt']columnas? Ejemplo 1: el siguiente DataFrame: Sp Mt