¿Cómo extraer la fecha de una cadena de columna de csv en Python?

Resuelto Priyatosh asked hace 8 meses • 0 respuestas

Tengo una columna con versión nombrada y con contenido.

Version
2024-01-02 rev. 003
2024-01-02 rev. 003
2023-11-17 rev. 003

cómo obtener los datos excepto la fecha mayor, es decir, 2024-01-02 rev. 003

Lo intenté sin igual a la fecha máxima, pero el valor nulo aparece en el marco de datos

df3['Version'] = pd.to_datetime(df3['Version'], format='%Y-%m-%d', errors="coerce")

print("df3 version=======\n", df3['Version'])
df3 = df3[df3['Version'].ne(df3['Version'].max())]
print (df3)
Priyatosh avatar Feb 16 '24 18:02 Priyatosh
Aceptado

Úselo Series.str.extractpara obtener fechas y horas en formato YYYY-MM-DDprimero como ayuda Seriesy úselo para filtrar el original DataFrame:

s = df3['Version'].str.extract(r'(\d{4}-\d{2}-\d{2})', expand=False)
dates = pd.to_datetime(s, format='%Y-%m-%d', errors="coerce")


df3 = df3[dates.ne(dates.max())]
print (df3)
               Version
2  2023-11-17 rev. 003
jezrael avatar Feb 16 '2024 11:02 jezrael