Preguntas con la etiqueta [pandas]
Clasificación personalizada en el marco de datos de pandas
Tengo un marco de datos de Python Pandas, en el que una columna contiene el nombre del mes. ¿Cómo puedo hacer una clasificación personalizada usando un diccionario, por ejemplo? custom_dict
¿Cómo convertir un archivo XML en un bonito marco de datos de pandas?
Supongamos que tengo un XML como este: <author type="XXX" language="EN" gender="xx" feature="xx" web="foobar.com"> <documents count="N"> <document KEY="e95a9a6c790ecb95e46cf15bee517651" web="www.foo_bar_exmaple.com"><![CDATA[A large text with lots of strings and punctuations symbols [...] ]]> </document>
Cómo crear un diagrama de dispersión por categoría [duplicado]
Estoy tratando de hacer un diagrama de dispersión simple en pyplot usando un objeto Pandas DataFrame, pero quiero una forma eficiente de trazar dos variables pero tener los símbolos dictados
Gráfico de barras apiladas con etiquetas centradas
Estoy intentando centrar "robustamente" las etiquetas de datos en un gráfico de barras apiladas. A continuación se muestran un ejemplo de código simple y el resultado. Como puede ver, las
Eliminar filas de pandas con índices duplicados
¿Cómo eliminar filas con valores de índice duplicados? En el marco de datos meteorológico a continuación, a veces un científico regresa y corrige las observaciones, no editando las filas erróneas,
¿Cómo inserto una columna en un índice de columna específico en pandas?
¿Puedo insertar una columna en un índice de columna específico en pandas? import pandas as pd df = pd.DataFrame({'l':['a','b','c','d'], 'v':[1,2,1,2]}) df['n'] = 0 Esto colocará la columna ncomo la última
Cómo agregar etiquetas de valor en un gráfico de barras
Estoy creando un gráfico de barras y no sé cómo agregar etiquetas de valor en las barras (en el centro de la barra o justo encima). Creo que la solución
los pandas obtienen filas que NO están en otro marco de datos
Tengo dos marcos de datos de pandas que tienen algunas filas en común. Supongamos que el marco de datos2 es un subconjunto del marco de datos1. ¿Cómo puedo obtener las
Cómo eliminar filas de un DataFrame de pandas basado en una expresión condicional [duplicado]
Tengo un DataFrame de pandas y quiero eliminar filas donde la longitud de la cadena en una columna en particular es mayor que 2. Espero poder hacer esto (según esta
¿Cómo puedo mostrar información completa (no truncada) del marco de datos en HTML al convertir del marco de datos de Pandas a HTML?
Convertí un marco de datos de Pandas en una salida HTML usando la DataFrame.to_htmlfunción. Cuando guardo esto en un archivo HTML separado, el archivo muestra una salida truncada. Por ejemplo,
Crear Pandas DataFrame a partir de una cadena
Para probar alguna funcionalidad, me gustaría crear un archivo DataFramea partir de una cadena. Digamos que mis datos de prueba se ven así: TESTDATA="""col1;col2;col3 1;4.4;99 2;4.5;200 3;4.7;65 4;3.2;140 """ ¿
¿Obtener la lista de la columna o fila del marco de datos de pandas?
Tengo un marco de datos dfimportado de un documento de Excel como este: cluster load_date budget actual fixed_price A 1/1/2014 1000 4000 Y A 2/1/2014 12000 10000 Y A 3/1/2014
Pandas groupby con unión delimitadora
Intenté usar groupby para agrupar filas con múltiples valores. col val A Cat A Tiger B Ball B Bat import pandas as pd df = pd.read_csv("Inputfile.txt", sep='\t') group = df.groupby(['col'])['val'].sum()
Seleccionar con criterios complejos de pandas.DataFrame
Por ejemplo tengo DF simple: import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in range(10)], 'B': [randint(1, 9)*10 for x in range(10)], 'C':
¿Cómo puedo utilizar la función apply() para una sola columna?
Tengo un marco de datos de pandas con varias columnas. Quiero cambiar los valores solo de la primera columna sin afectar las otras columnas. ¿ Cómo puedo hacer eso usando