Preguntas con la etiqueta [group-by]

Lista group-by preguntas

¿Cómo puedo pivotar un marco de datos?

5
respuestas
620
votos
73.3k
vistas

¿Qué es el pivote? ¿Cómo giro? ¿De formato largo a formato ancho? He visto muchas preguntas sobre tablas dinámicas, incluso si no lo saben. Es prácticamente imposible escribir una pregunta

Equivalente de 'recuento (distinto)' de pandas

11
respuestas
412
votos
730.7k
vistas

Estoy usando Pandas como sustituto de la base de datos porque tengo varias bases de datos ( Oracle , SQL Server , etc.) y no puedo realizar una secuencia de

Tengo un marco de datos de pandas en el siguiente formato: df = pd.DataFrame([ [1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], list('AAABBBBABCBDDD'), [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], ['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'], ['1','3','3','2','4','2','5','3','6','3','5','1','1','1'] ]).T

como cuando lo hago SELECT [Date] FROM [FRIIB].[dbo].[ArchiveAnalog] GROUP BY [Date] ¿Cómo puedo especificar el período del grupo? Estoy usando MS SQL 2008. Probé esto, tanto con % 10como /

¿Cuál es la forma más eficaz de agrupar objetos en una matriz? Por ejemplo, dada esta matriz de objetos: [ { Phase: "Phase 1", Step: "Step 1", Task: "Task 1",

¿Cómo accedo al marco de datos groupby correspondiente en un objeto groupby mediante la clave? Con el siguiente grupo: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B':

Utilice pandas.shift() dentro de un grupo

2
respuestas
83
votos
86.0k
vistas

Tengo un marco de datos con datos de panel, digamos que son series de tiempo para 100 objetos diferentes: object period value 1 1 24 1 2 67 ... 1

Estoy buscando una manera de concatenar las cadenas de un campo dentro de un grupo mediante consulta. Entonces, por ejemplo, tengo una tabla: IDENTIFICACIÓN ID DE LA COMPAÑÍA EMPLEADO 1

Esto es lo que estoy tratando de hacer. Digamos que tengo esta tabla t: key_id | id | record_date | other_cols 1 | 18 | 2011-04-03 | x 2 |

Tengo un DataFrame con las columnas A, B y C. Para cada valor de A, me gustaría seleccionar la fila con el valor mínimo en la columna B. Es decir,

Porcentaje de pandas del total con groupby

17
respuestas
303
votos
526.0k
vistas

Obviamente, esto es simple, pero como novato me estoy estancando. Tengo un archivo CSV que contiene 3 columnas, el Estado, el ID de la oficina y las Ventas de esa

Tengo una SELECTconsulta SQL que también usa un GROUP BY, quiero contar todos los registros después delGROUP BY cláusula filtró el conjunto de resultados. ¿Hay alguna forma de hacer esto

Tengo el siguiente marco de datos. Grupo Tamaño Corto Pequeño Corto Pequeño Moderado Medio Moderado Pequeño Alto Grande Quiero contar la frecuencia de cuántas veces aparece la misma fila en

Posibles duplicados: ¿Función de tipo implosión en SQL Server 2000? Concatenar valores de fila T-SQL Tengo una vista que estoy consultando y que se parece a esta: BuildingName PollNumber ------------

Supongamos que tengo esta tabla: nombrado = the_table cuya estructura es: postgreSQL: create table the_table (col3 SERIAL, col2 varchar, col1 varchar, PRIMARY KEY(col3)); MySQL: create table the_table ( col3 INT