Preguntas con la etiqueta [pandas]

Lista pandas preguntas

Estoy leyendo varios objetos JSON en un DataFrame. El problema es que algunas de las columnas son listas. Además, los datos son muy grandes y por eso no puedo utilizar

Tengo el siguiente DataFrame indexado con columnas y filas con nombre, números no continuos: a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758

Tengo una pandas dataframeen la que una columna de cadenas de texto contiene valores separados por comas. Quiero dividir cada campo CSV y crear una nueva fila por entrada (supongamos

Normalizar columnas de un marco de datos

24
respuestas
472
votos
1.0M
vistas

Tengo un marco de datos en pandas donde cada columna tiene un rango de valores diferente. Por ejemplo: df: A B C 1000 10 0.5 765 5 0.35 800 7

Estoy intentando agregar un diccionario a un objeto DataFrame, pero aparece el siguiente error: AttributeError: el objeto 'DataFrame' no tiene el atributo 'añadir' Hasta donde yo sé, DataFrame tiene el

Llenar los valores faltantes por media en cada grupo

0
respuestas
136
votos
154.0k
vistas

Esto debería ser sencillo, pero lo más parecido que he encontrado es esta publicación: pandas: Llenar valores faltantes dentro de un grupo , y todavía no puedo resolver mi problema...

Convertir un DataFrame de Pandas en un diccionario

12
respuestas
425
votos
804.7k
vistas

Tengo un DataFrame con cuatro columnas. Quiero convertir este DataFrame en un diccionario de Python. Quiero que los elementos de la primera columna sean keysy los elementos de otras columnas

Agrupar una columna con pandas

4
respuestas
200
votos
261.5k
vistas

Tengo una columna de marco de datos con valores numéricos: df['percentage'].head() 46.5 44.2 100.0 42.12 Quiero ver la columna como cuenta el contenedor : bins = [0, 1, 5, 10,

Me gustaría leer varios archivos CSV de un directorio en pandas y concatenarlos en un gran DataFrame. Aunque no he podido resolverlo. Esto es lo que tengo hasta ahora: import

Estaba buscando una manera de anotar mis barras en un diagrama de barras de Pandas con los valores numéricos redondeados de mi DataFrame. >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df A B

¿Cómo leo un archivo csv grande con pandas?

0
respuestas
321
votos
523.1k
vistas

Estoy intentando leer un archivo csv grande (aproximadamente 6 GB) en pandas y aparece un error de memoria: MemoryError Traceback (most recent call last) <ipython-input-58-67a72687871b> in <module>() ----> 1 data=pd.read_csv('aphro.csv',sep=';')

Tengo un marco de datos que se parece a este: a b c d 0 0.418762 0.042369 0.869203 0.972314 1 0.991058 0.510228 0.594784 0.534366 2 0.407472 0.259811 0.396664 0.894202 3

2018-09-18_reproducible_dataframe.ipynb Esta pregunta se marcó anteriormente como un duplicado de Cómo hacer buenos ejemplos de pandas reproducibles. . Vaya a esa pregunta si necesita crear datos sintéticos (falsos) para compartir.

Quiero filtrar mi marco de datos con una orcondición para mantener las filas con los valores de una columna en particular que están fuera del rango [-0.25, 0.25]. Lo intenté:

Imprime una serie completa de Pandas/DataFrame

14
respuestas
1.2k
votos
1.4M
vistas

Trabajo mucho con Series y DataFrames en la terminal. El valor predeterminado __repr__para una Serie devuelve una muestra reducida, con algunos valores iniciales y finales, pero falta el resto. ¿Existe