Preguntas con la etiqueta [pandas]
Cómo aplicar una función a dos columnas del marco de datos de Pandas
Supongamos que tengo una función y un marco de datos definidos como se muestra a continuación: def get_sublist(sta, end): return mylist[sta:end+1] df = pd.DataFrame({'ID':['1','2','3'], 'col_1': [0,2,3], 'col_2':[1,4,5]}) mylist = ['a','b','c','d','e','f']
Los pandas obtienen los n primeros registros dentro de cada grupo
Supongamos que tengo pandas DataFrame como este: df = pd.DataFrame({'id':[1,1,1,2,2,2,2,3,4], 'value':[1,2,3,1,2,3,4,1,1]}) que se parece a: id value 0 1 1 1 1 2 2 1 3 3 2 1 4
Usando Pandas para pd.read_excel() para múltiples hojas de trabajo del mismo libro
Tengo un archivo de hoja de cálculo grande (.xlsx) que estoy procesando usando Python Pandas. Sucede que necesito datos de dos pestañas (hojas) en ese archivo tan grande. Una de
¿Dejar caer valores infinitos de marcos de datos en pandas?
¿Cómo elimino los valores nan, infy -infde a DataFramesin restablecerlos mode.use_inf_as_null? ¿Puedo indicar dropnaque se incluyan infen su definición los valores faltantes para que funcione lo siguiente? df.dropna(subset=["col1", "col2"], how="all")
Mantenga solo la parte de la fecha cuando use pandas.to_datetime
Utilizo pandas.to_datetimepara analizar las fechas en mis datos. Pandas representa de forma predeterminada las fechas con datetime64[ns], aunque todas las fechas son solo diarias. Me pregunto si existe una forma
Extraer columnas seleccionadas específicas al nuevo DataFrame como una copia
Tengo un DataFrame de pandas con 4 columnas y quiero crear un nuevo DataFrame que solo tenga tres de las columnas. Esta pregunta es similar a: Extraer columnas específicas de
agrupar por en agrupar por y promedio
Tengo un marco de datos como este: cluster org time 1 a 8 1 a 6 2 h 34 1 c 23 2 d 74 3 w 6 Me gustaría
Combinando dos series en un DataFrame en pandas
Tengo dos Series s1y s2con los mismos índices (no consecutivos). ¿Cómo combino s1y s2soy dos columnas en un DataFrame y mantengo uno de los índices como tercera columna?
Cómo aplanar un índice jerárquico en columnas
Tengo un data frame con un índice jerárquico en el eje 1 (columnas) (de una groupby.aggoperación): USAF WBAN year month day s_PC s_CL s_CD s_CNT tempf sum sum sum sum
Cómo seleccionar filas en un DataFrame entre dos valores
Estoy intentando modificar un DataFrame dfpara que solo contenga filas cuyos valores en la columna closing_priceestén entre 99 y 101 y estoy intentando hacer esto con el siguiente código. Sin
Pandas Reemplace NaN con una cadena en blanco/vacía
Tengo un Pandas Dataframe como se muestra a continuación: 1 2 3 0 a NaN read 1 b l unread 2 c NaN read Quiero eliminar los valores NaN con
¿Qué significa "ValueError: no se puede reindexar desde un eje duplicado"?
Recibo un mensaje ValueError: cannot reindex from a duplicate axiscuando intento establecer un índice en un valor determinado. Intenté reproducir esto con un ejemplo sencillo, pero no pude hacerlo. Aquí
Multiplica dos columnas de diferentes marcos de datos en Python
Tengo dos marcos de datos (ambos son de tipo flotante). El primero se llama Pricesy contiene solo precios: El segundo se llama Table_ScenarioPercentagesy contiene porcentajes donde los precios deben multiplicarse
Función de derretimiento de pandas
Tengo un marco de datos: df = pd.DataFrame([[2, 4, 7, 8, 1, 3, 2013], [9, 2, 4, 5, 5, 6, 2014]], columns=['Amy', 'Bob', 'Carl', 'Chris', 'Ben', 'Other', 'Year']) Amy Bob
Filtrar pandas DataFrame por criterios de subcadena
Tengo un DataFrame de pandas con una columna de valores de cadena. Necesito seleccionar filas en función de coincidencias de cadenas parciales. Algo como este modismo: re.search(pattern, cell_in_question) devolviendo un