Preguntas con la etiqueta [pandas]

Lista pandas preguntas

¿Cómo puedo pivotar un marco de datos?

5
respuestas
620
votos
73.3k
vistas

¿Qué es el pivote? ¿Cómo giro? ¿De formato largo a formato ancho? He visto muchas preguntas sobre tablas dinámicas, incluso si no lo saben. Es prácticamente imposible escribir una pregunta

Mi entrada es este marco de datos: df = pd.DataFrame( { 'ID': ['ID001', 'ID002', 'ID003'], 'RUNNING': [5, 6, 3], 'QUEUE': [1, 2, 5], 'FINISHED': [6, 2, 4], 'PROCESSED': [2, 6,

Cómo encontrar la versión de pandas instalada

6
respuestas
326
votos
484.4k
vistas

Tengo problemas con algunas de las funcionalidades de pandas. ¿Cómo verifico cuál es mi versión de instalación?

Digamos que tengo una columna en un marco de datos que tiene algunos números y otros no números. >> df['foo'] 0 0.0 1 103.8 2 751.1 3 0.0 4 0.0

Tengo un marco de datos de pandas donde las primeras 3 columnas son cadenas: ID text1 text 2 0 2345656 blah blah 1 3456 blah blah 2 541304 blah blah

¿ Cuál es la diferencia entre groupby("x").county groupby("x").sizedentro de los pandas? ¿El tamaño simplemente excluye nada?

Equivalente de 'recuento (distinto)' de pandas

11
respuestas
412
votos
730.7k
vistas

Estoy usando Pandas como sustituto de la base de datos porque tengo varias bases de datos ( Oracle , SQL Server , etc.) y no puedo realizar una secuencia de

Pandas cada enésima fila

7
respuestas
229
votos
249.2k
vistas

Dataframe.resample()sólo funciona con datos de series temporales. No puedo encontrar una manera de obtener cada enésima fila de datos que no son de serie temporal. ¿Cuál es el mejor método?

Fusionar dos marcos de datos por índice

7
respuestas
332
votos
595.8k
vistas

Tengo los siguientes marcos de datos: > df1 id begin conditional confidence discoveryTechnique 0 278 56 false 0.0 1 1 421 18 false 0.0 1 > df2 concept 0 A

Tengo un marco de datos de pandas en el siguiente formato: df = pd.DataFrame([ [1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], list('AAABBBBABCBDDD'), [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], ['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'], ['1','3','3','2','4','2','5','3','6','3','5','1','1','1'] ]).T

Cómo mantener el índice al usar pandas merge

10
respuestas
240
votos
185.5k
vistas

Me gustaría fusionar dos DataFramesy mantener el índice del primer fotograma como índice en el conjunto de datos fusionado. Sin embargo, cuando hago la fusión, el DataFrame resultante tiene un

Tengo una columna que contiene precios con una moneda. Quiero convertir estos precios a flotadores. El problema aquí es que estos precios contienen espacios después de miles. Mi marco de

Ambos parecen extremadamente similares y tengo curiosidad por saber qué paquete sería más beneficioso para el análisis de datos financieros.

Pandas: asignaciones encadenadas [duplicado]

1
respuestas
19
votos
28.1k
vistas

He estado leyendo este enlace sobre "Devolver una vista frente a una copia". Realmente no entiendo cómo funciona el concepto de asignación encadenada en Pandas y cómo lo afecta el

Si tengo un marco de datos con las siguientes columnas: 1. NAME object 2. On_Time object 3. On_Budget object 4. %actual_hr float64 5. Baseline Start Date datetime64[ns] 6. Forecast Start