¿Cuáles son las diferencias entre Pandas y NumPy+SciPy en Python? [cerrado]
Ambos parecen extremadamente similares y tengo curiosidad por saber qué paquete sería más beneficioso para el análisis de datos financieros.
pandas proporciona herramientas de manipulación de datos de alto nivel construidas sobre NumPy. NumPy por sí solo es una herramienta de nivel bastante bajo, similar a MATLAB. Pandas, por otro lado, proporciona una rica funcionalidad de series de tiempo, alineación de datos, estadísticas compatibles con NA, métodos de agrupación, fusión y unión, y muchas otras comodidades. Se ha vuelto muy popular en los últimos años en aplicaciones financieras. Tendré un capítulo dedicado al análisis de datos financieros utilizando pandas en mi próximo libro.
Los pandas requieren Numpy (y prácticamente todas las herramientas numéricas para Python). Scipy no es estrictamente necesario para los pandas, pero figura como una "dependencia opcional". No diría que pandas sea una alternativa a Numpy y/o Scipy. Más bien, es una herramienta adicional que proporciona una forma más simplificada de trabajar con datos numéricos y tabulares en Python. Puede utilizar estructuras de datos de pandas pero recurrir libremente a las funciones de Numpy y Scipy para manipularlas.
Pandas ofrece una excelente manera de manipular tablas, ya que puede facilitar la agrupación ( agrupar un marco de datos en pandas en Python ) y calcular estadísticas. Otra cosa que es genial en pandas es la clase Panel con la que puedes unir series de capas con diferentes propiedades y combinarlas usando la función groupby.