¿Cómo extraer la fecha de una cadena de columna de csv en Python?
Tengo una columna con versión nombrada y con contenido.
Version
2024-01-02 rev. 003
2024-01-02 rev. 003
2023-11-17 rev. 003
cómo obtener los datos excepto la fecha mayor, es decir, 2024-01-02 rev. 003
Lo intenté sin igual a la fecha máxima, pero el valor nulo aparece en el marco de datos
df3['Version'] = pd.to_datetime(df3['Version'], format='%Y-%m-%d', errors="coerce")
print("df3 version=======\n", df3['Version'])
df3 = df3[df3['Version'].ne(df3['Version'].max())]
print (df3)
Aceptado
Úselo Series.str.extract
para obtener fechas y horas en formato YYYY-MM-DD
primero como ayuda Series
y úselo para filtrar el original DataFrame
:
s = df3['Version'].str.extract(r'(\d{4}-\d{2}-\d{2})', expand=False)
dates = pd.to_datetime(s, format='%Y-%m-%d', errors="coerce")
df3 = df3[dates.ne(dates.max())]
print (df3)
Version
2 2023-11-17 rev. 003