Preguntas con la etiqueta [pandas]
xlrd.biffh.XLRDError: archivo Excel xlsx; no compatible [duplicado]
Estoy intentando leer una hoja de cálculo de Excel habilitada para macros utilizando pandas.read_excella biblioteca xlrd. Está funcionando bien en local, pero cuando intento insertar lo mismo en PCF, aparece
Cómo explotar una lista dentro de una celda de marco de datos en filas separadas
Estoy buscando convertir una celda de pandas que contiene una lista en filas para cada uno de esos valores. Entonces, toma esto: Si quisiera descomprimir y apilar los valores de
Cómo trazar y anotar un gráfico de barras agrupadas
Me encontré con un problema complicado sobre matplotlib en Python. Quiero crear un gráfico de barras agrupadas con varios códigos, pero el gráfico sale mal. ¿Podrías ofrecerme algún consejo? El
¿Cómo obtengo una lista de todos los elementos duplicados usando pandas en Python?
Tengo una lista de artículos que probablemente tengan algunos problemas de exportación. Me gustaría obtener una lista de los elementos duplicados para poder compararlos manualmente. Cuando intento utilizar el método
Convierta el DateTimeIndex de pandas compatible con la zona horaria en una marca de tiempo ingenua, pero en cierta zona horaria
Puede usar la función tz_localizepara hacer que una marca de tiempo o DateTimeIndex tenga en cuenta la zona horaria, pero ¿cómo puede hacer lo contrario: cómo puede convertir una marca
¿Por qué debería hacer una copia de un marco de datos en pandas?
Al seleccionar un marco de datos secundario de un marco de datos principal, noté que algunos programadores hacen una copia del marco de datos usando el .copy()método. Por ejemplo, X
Pandas: convierte categorías en números
Supongamos que tengo un marco de datos con países que dice así: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 Sé que hay
Cómo invertir el eje x o y
Tengo un gráfico de diagrama de dispersión con un montón de coordenadas x, y aleatorias. Actualmente, el eje Y comienza en 0 y sube hasta el valor máximo. Me gustaría
¿Cómo entrenar un clasificador de bosque aleatorio con un gran conjunto de datos para evitar errores de memoria en Python?
Tengo un conjunto de datos de 30 millones de filas. Tengo dos columnas: una que contiene una etiqueta 1 o 0 y la otra columna tiene una lista de 1280
¿Agregar a un DataFrame vacío en Pandas?
¿Es posible agregar a un marco de datos vacío que no contiene índices ni columnas? Intenté hacer esto, pero sigo recibiendo un marco de datos vacío al final. p.ej import
Cómo eliminar filas de Pandas DataFrame cuyo valor en una determinada columna es NaN
Tengo este DataFrame y solo quiero los registros cuya columna EPS no sea NaN: STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016
Cómo imprimir pandas DataFrame sin índice
Quiero imprimir todo el marco de datos, pero no quiero imprimir el índice Además, una columna es del tipo fecha y hora, solo quiero imprimir la hora, no la fecha.
¿Cómo puedo obtener el NOT lógico por elementos de una serie de pandas?
Tengo un Seriesobjeto pandas que contiene valores booleanos. ¿ Cómo puedo obtener una serie que contenga la lógica NOTde cada valor? Por ejemplo, considere una serie que contenga: True True
Cómo fusionar múltiples marcos de datos
Tengo diferentes marcos de datos y necesito fusionarlos según la columna de fecha. Si solo tuviera dos marcos de datos, podría usar df1.merge(df2, on='date'), para hacerlo con tres marcos de
Codificación de etiquetas en varias columnas en scikit-learn
Estoy intentando usar scikit-learn LabelEncoderpara codificar pandas DataFramede etiquetas de cadenas. Como el marco de datos tiene muchas (50+) columnas, quiero evitar crear un LabelEncoderobjeto para cada columna; Prefiero tener