Preguntas con la etiqueta [pandas]

Lista pandas preguntas

Supongamos que tengo una función y un marco de datos definidos como se muestra a continuación: def get_sublist(sta, end): return mylist[sta:end+1] df = pd.DataFrame({'ID':['1','2','3'], 'col_1': [0,2,3], 'col_2':[1,4,5]}) mylist = ['a','b','c','d','e','f']

Supongamos que tengo pandas DataFrame como este: df = pd.DataFrame({'id':[1,1,1,2,2,2,2,3,4], 'value':[1,2,3,1,2,3,4,1,1]}) que se parece a: id value 0 1 1 1 1 2 2 1 3 3 2 1 4

Tengo un archivo de hoja de cálculo grande (.xlsx) que estoy procesando usando Python Pandas. Sucede que necesito datos de dos pestañas (hojas) en ese archivo tan grande. Una de

¿Cómo elimino los valores nan, infy -infde a DataFramesin restablecerlos mode.use_inf_as_null? ¿Puedo indicar dropnaque se incluyan infen su definición los valores faltantes para que funcione lo siguiente? df.dropna(subset=["col1", "col2"], how="all")

Utilizo pandas.to_datetimepara analizar las fechas en mis datos. Pandas representa de forma predeterminada las fechas con datetime64[ns], aunque todas las fechas son solo diarias. Me pregunto si existe una forma

Tengo un DataFrame de pandas con 4 columnas y quiero crear un nuevo DataFrame que solo tenga tres de las columnas. Esta pregunta es similar a: Extraer columnas específicas de

agrupar por en agrupar por y promedio

3
respuestas
131
votos
420.9k
vistas

Tengo un marco de datos como este: cluster org time 1 a 8 1 a 6 2 h 34 1 c 23 2 d 74 3 w 6 Me gustaría

Combinando dos series en un DataFrame en pandas

9
respuestas
408
votos
568.1k
vistas

Tengo dos Series s1y s2con los mismos índices (no consecutivos). ¿Cómo combino s1y s2soy dos columnas en un DataFrame y mantengo uno de los índices como tercera columna?

Cómo aplanar un índice jerárquico en columnas

20
respuestas
559
votos
506.5k
vistas

Tengo un data frame con un índice jerárquico en el eje 1 (columnas) (de una groupby.aggoperación): USAF WBAN year month day s_PC s_CL s_CD s_CNT tempf sum sum sum sum

Estoy intentando modificar un DataFrame dfpara que solo contenga filas cuyos valores en la columna closing_priceestén entre 99 y 101 y estoy intentando hacer esto con el siguiente código. Sin

Pandas Reemplace NaN con una cadena en blanco/vacía

8
respuestas
394
votos
654.1k
vistas

Tengo un Pandas Dataframe como se muestra a continuación: 1 2 3 0 a NaN read 1 b l unread 2 c NaN read Quiero eliminar los valores NaN con

Recibo un mensaje ValueError: cannot reindex from a duplicate axiscuando intento establecer un índice en un valor determinado. Intenté reproducir esto con un ejemplo sencillo, pero no pude hacerlo. Aquí

Tengo dos marcos de datos (ambos son de tipo flotante). El primero se llama Pricesy contiene solo precios: El segundo se llama Table_ScenarioPercentagesy contiene porcentajes donde los precios deben multiplicarse

Función de derretimiento de pandas

2
respuestas
25
votos
52.9k
vistas

Tengo un marco de datos: df = pd.DataFrame([[2, 4, 7, 8, 1, 3, 2013], [9, 2, 4, 5, 5, 6, 2014]], columns=['Amy', 'Bob', 'Carl', 'Chris', 'Ben', 'Other', 'Year']) Amy Bob

Tengo un DataFrame de pandas con una columna de valores de cadena. Necesito seleccionar filas en función de coincidencias de cadenas parciales. Algo como este modismo: re.search(pattern, cell_in_question) devolviendo un