Preguntas con la etiqueta [pandas]
¿Cómo guardar una nueva hoja en un archivo de Excel existente, usando Pandas?
Quiero usar archivos de Excel para almacenar datos elaborados con Python. Mi problema es que no puedo agregar hojas a un archivo de Excel existente. Aquí sugiero un código de
Pandas DataFrame a la lista de diccionarios
Tengo el siguiente marco de datos: cliente artículo1 artículo2 artículo3 1 tomate con leche de manzana 2 patatas agua naranja 3 chips de mango en jugo que quiero traducirlo a
Pandas: ¿eliminar un nivel de un índice de columna de varios niveles?
Si tengo un índice de columna de varios niveles: >>> cols = pd.MultiIndex.from_tuples([("a", "b"), ("a", "c")]) >>> pd.DataFrame([[1,2], [3,4]], columns=cols) a ---+-- segundo | C --+---+-- 0 | 1 |
¿Cómo dividir los datos en 3 conjuntos (entrenamiento, validación y prueba)?
Tengo un marco de datos de pandas y deseo dividirlo en 3 conjuntos separados. Sé que al usar train_test_split de sklearn.cross_validation, se pueden dividir los datos en dos conjuntos (entrenar
Crear un marco de datos a partir de un diccionario donde las entradas tienen diferentes longitudes
Digamos que tengo un diccionario con 10 pares clave-valor. Cada entrada tiene un numpy array. Sin embargo, la longitud del mismo arrayno es la misma para todos ellos. ¿ Cómo
GroupBy pandas DataFrame y seleccione el valor más común
Tengo un marco de datos con tres columnas de cadena. Sé que el único valor de la tercera columna es válido para cada combinación de los dos primeros. Para limpiar
pandas: fusionar (unir) dos marcos de datos en varias columnas
Estoy intentando unir dos marcos de datos de pandas usando dos columnas: new_df = pd.merge(A_df, B_df, how='left', left_on='[A_c1,c2]', right_on = '[B_c1,c2]') pero obtuve el siguiente error: pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4164)()
Dividir el marco de datos de pandas según los valores de una columna usando groupby
Quiero dividir el siguiente marco de datos según la columna ZZ df = N0_YLDF ZZ MAT 0 6.286333 2 11.669069 1 6.317000 6 11.669069 2 6.324889 6 11.516454 3 6.320667
¿Cómo reemplazar NaN por valores anteriores o siguientes en pandas DataFrame?
Supongamos que tengo un DataFrame con algunos NaNs: >>> import pandas as pd >>> df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]]) >>> df 0 1 2
Cuente valores únicos por grupos con Pandas [duplicado]
Necesito contar IDvalores únicos en cada domain. tengo datos: ID, domain 123, vk.com 123, vk.com 123, twitter.com 456, vk.com' 456, facebook.com 456, vk.com 456, google.com 789, twitter.com 789, vk.com lo
¿Cómo probar si una cadena contiene una de las subcadenas de una lista, en pandas?
¿Existe alguna función que sea equivalente a una combinación de df.isin()y df[col].str.contains()? Por ejemplo, digamos que tengo la serie s = pd.Series(['cat','hat','dog','fog','pet'])y quiero encontrar todos los lugares donde scontiene alguno
¿Cómo extraer la fecha de una cadena de columna de csv en Python?
Tengo una columna con versión nombrada y con contenido. Version 2024-01-02 rev. 003 2024-01-02 rev. 003 2023-11-17 rev. 003 cómo obtener los datos excepto la fecha mayor, es decir, 2024-01-02
Mejorar el tamaño/espaciado de las subtramas con muchas subtramas
Necesito generar un montón de gráficos apilados verticalmente en matplotlib. El resultado se guardará savefigy se verá en una página web, por lo que no me importa qué tan alta
pandas uniendo tres vías múltiples marcos de datos en columnas
Tengo 3 archivos CSV. Cada uno tiene la primera columna como los nombres (cadena) de las personas, mientras que todas las demás columnas en cada marco de datos son atributos
Comprender inplace=True en pandas
En la pandasbiblioteca muchas veces hay una opción para cambiar el objeto in situ, como con la siguiente declaración... df.dropna(axis='index', how='all', inplace=True) Tengo curiosidad por saber qué se devuelve y