Preguntas con la etiqueta [pandas]
Manera eficiente de desanidar (explotar) múltiples columnas de lista en un DataFrame de pandas
Estoy leyendo varios objetos JSON en un DataFrame. El problema es que algunas de las columnas son listas. Además, los datos son muy grandes y por eso no puedo utilizar
Cómo agregar una nueva columna a un DataFrame existente
Tengo el siguiente DataFrame indexado con columnas y filas con nombre, números no continuos: a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758
Dividir (explotar) la entrada de cadena del marco de datos de pandas en filas separadas
Tengo una pandas dataframeen la que una columna de cadenas de texto contiene valores separados por comas. Quiero dividir cada campo CSV y crear una nueva fila por entrada (supongamos
Normalizar columnas de un marco de datos
Tengo un marco de datos en pandas donde cada columna tiene un rango de valores diferente. Por ejemplo: df: A B C 1000 10 0.5 765 5 0.35 800 7
Error "El objeto 'DataFrame' no tiene el atributo 'añadir'"
Estoy intentando agregar un diccionario a un objeto DataFrame, pero aparece el siguiente error: AttributeError: el objeto 'DataFrame' no tiene el atributo 'añadir' Hasta donde yo sé, DataFrame tiene el
Llenar los valores faltantes por media en cada grupo
Esto debería ser sencillo, pero lo más parecido que he encontrado es esta publicación: pandas: Llenar valores faltantes dentro de un grupo , y todavía no puedo resolver mi problema...
Convertir un DataFrame de Pandas en un diccionario
Tengo un DataFrame con cuatro columnas. Quiero convertir este DataFrame en un diccionario de Python. Quiero que los elementos de la primera columna sean keysy los elementos de otras columnas
Agrupar una columna con pandas
Tengo una columna de marco de datos con valores numéricos: df['percentage'].head() 46.5 44.2 100.0 42.12 Quiero ver la columna como cuenta el contenedor : bins = [0, 1, 5, 10,
Importe varios archivos CSV a pandas y concatenelos en un DataFrame
Me gustaría leer varios archivos CSV de un directorio en pandas y concatenarlos en un gran DataFrame. Aunque no he podido resolverlo. Esto es lo que tengo hasta ahora: import
Anotar barras con valores en los gráficos de barras de Pandas
Estaba buscando una manera de anotar mis barras en un diagrama de barras de Pandas con los valores numéricos redondeados de mi DataFrame. >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df A B
¿Cómo leo un archivo csv grande con pandas?
Estoy intentando leer un archivo csv grande (aproximadamente 6 GB) en pandas y aparece un error de memoria: MemoryError Traceback (most recent call last) <ipython-input-58-67a72687871b> in <module>() ----> 1 data=pd.read_csv('aphro.csv',sep=';')
¿Cómo seleccionar todas las columnas excepto una en pandas?
Tengo un marco de datos que se parece a este: a b c d 0 0.418762 0.042369 0.869203 0.972314 1 0.991058 0.510228 0.594784 0.534366 2 0.407472 0.259811 0.396664 0.894202 3
Cómo proporcionar una copia reproducible de su DataFrame con to_clipboard()
2018-09-18_reproducible_dataframe.ipynb Esta pregunta se marcó anteriormente como un duplicado de Cómo hacer buenos ejemplos de pandas reproducibles. . Vaya a esa pregunta si necesita crear datos sintéticos (falsos) para compartir.
El valor de verdad de una Serie es ambiguo. Utilice a.empty, a.bool(), a.item(), a.any() o a.all()
Quiero filtrar mi marco de datos con una orcondición para mantener las filas con los valores de una columna en particular que están fuera del rango [-0.25, 0.25]. Lo intenté:
Imprime una serie completa de Pandas/DataFrame
Trabajo mucho con Series y DataFrames en la terminal. El valor predeterminado __repr__para una Serie devuelve una muestra reducida, con algunos valores iniciales y finales, pero falta el resto. ¿Existe