Preguntas con la etiqueta [pandas]

Lista pandas preguntas

Quiero usar archivos de Excel para almacenar datos elaborados con Python. Mi problema es que no puedo agregar hojas a un archivo de Excel existente. Aquí sugiero un código de

Pandas DataFrame a la lista de diccionarios

6
respuestas
411
votos
303.7k
vistas

Tengo el siguiente marco de datos: cliente artículo1 artículo2 artículo3 1 tomate con leche de manzana 2 patatas agua naranja 3 chips de mango en jugo que quiero traducirlo a

Si tengo un índice de columna de varios niveles: >>> cols = pd.MultiIndex.from_tuples([("a", "b"), ("a", "c")]) >>> pd.DataFrame([[1,2], [3,4]], columns=cols) a ---+-- segundo | C --+---+-- 0 | 1 |

Tengo un marco de datos de pandas y deseo dividirlo en 3 conjuntos separados. Sé que al usar train_test_split de sklearn.cross_validation, se pueden dividir los datos en dos conjuntos (entrenar

Digamos que tengo un diccionario con 10 pares clave-valor. Cada entrada tiene un numpy array. Sin embargo, la longitud del mismo arrayno es la misma para todos ellos. ¿ Cómo

Tengo un marco de datos con tres columnas de cadena. Sé que el único valor de la tercera columna es válido para cada combinación de los dos primeros. Para limpiar

Estoy intentando unir dos marcos de datos de pandas usando dos columnas: new_df = pd.merge(A_df, B_df, how='left', left_on='[A_c1,c2]', right_on = '[B_c1,c2]') pero obtuve el siguiente error: pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4164)()

Quiero dividir el siguiente marco de datos según la columna ZZ df = N0_YLDF ZZ MAT 0 6.286333 2 11.669069 1 6.317000 6 11.669069 2 6.324889 6 11.516454 3 6.320667

Supongamos que tengo un DataFrame con algunos NaNs: >>> import pandas as pd >>> df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]]) >>> df 0 1 2

Necesito contar IDvalores únicos en cada domain. tengo datos: ID, domain 123, vk.com 123, vk.com 123, twitter.com 456, vk.com' 456, facebook.com 456, vk.com 456, google.com 789, twitter.com 789, vk.com lo

¿Existe alguna función que sea equivalente a una combinación de df.isin()y df[col].str.contains()? Por ejemplo, digamos que tengo la serie s = pd.Series(['cat','hat','dog','fog','pet'])y quiero encontrar todos los lugares donde scontiene alguno

Tengo una columna con versión nombrada y con contenido. Version 2024-01-02 rev. 003 2024-01-02 rev. 003 2023-11-17 rev. 003 cómo obtener los datos excepto la fecha mayor, es decir, 2024-01-02

Necesito generar un montón de gráficos apilados verticalmente en matplotlib. El resultado se guardará savefigy se verá en una página web, por lo que no me importa qué tan alta

Tengo 3 archivos CSV. Cada uno tiene la primera columna como los nombres (cadena) de las personas, mientras que todas las demás columnas en cada marco de datos son atributos

Comprender inplace=True en pandas

11
respuestas
171
votos
280.7k
vistas

En la pandasbiblioteca muchas veces hay una opción para cambiar el objeto in situ, como con la siguiente declaración... df.dropna(axis='index', how='all', inplace=True) Tengo curiosidad por saber qué se devuelve y