¿Cómo utilizar la función tryCatch()?
Quiero escribir código para tryCatch
solucionar errores al descargar datos de la web.
url <- c(
"http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
"http://en.wikipedia.org/wiki/Xz")
y <- mapply(readLines, con=url)
Estas dos declaraciones se ejecutan correctamente. A continuación, creo una dirección web que no existe:
url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz")
url[1]
no existe. ¿Cómo se escribe un tryCatch
bucle (función) para que:
- Cuando la URL es incorrecta, el resultado será: "La URL web es incorrecta, no se puede obtener".
- Cuando la URL es incorrecta, ¿el código no se detiene, sino que continúa descargándose hasta el final de la lista de URL?
Configurando el código
urls <- c(
"http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
"http://en.wikipedia.org/wiki/Xz",
"xxxxx"
)
readUrl <- function(url) {
tryCatch(
{
# Just to highlight: if you want to use more than one
# R expression in the "try" part then you'll have to
# use curly brackets.
# 'tryCatch()' will return the last evaluated expression
# in case the "try" part was completed successfully
message("This is the 'try' part")
suppressWarnings(readLines(url))
# The return value of `readLines()` is the actual value
# that will be returned in case there is no condition
# (e.g. warning or error).
},
error = function(cond) {
message(paste("URL does not seem to exist:", url))
message("Here's the original error message:")
message(conditionMessage(cond))
# Choose a return value in case of error
NA
},
warning = function(cond) {
message(paste("URL caused a warning:", url))
message("Here's the original warning message:")
message(conditionMessage(cond))
# Choose a return value in case of warning
NULL
},
finally = {
# NOTE:
# Here goes everything that should be executed at the end,
# regardless of success or error.
# If you want more than one expression to be executed, then you
# need to wrap them in curly brackets ({...}); otherwise you could
# just have written 'finally = <expression>'
message(paste("Processed URL:", url))
message("Some other message at the end")
}
)
}
Usando el código
> y <- lapply(urls, readUrl)
This is the 'try' part
Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html
Some other message at the end
This is the 'try' part
Processed URL: http://en.wikipedia.org/wiki/Xz
Some other message at the end
This is the 'try' part
URL does not seem to exist: xxxxx
Here's the original error message:
cannot open the connection
Processed URL: xxxxx
Some other message at the end
Investigando la salida
> head(y[[1]])
[1] "<!DOCTYPE html><html><head><title>R: Functions to Manipulate Connections (Files, URLs, ...)</title>"
[2] "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />"
[3] "<meta name=\"viewport\" content=\"width=device-width, initial-scale=1.0, user-scalable=yes\" />"
[4] "<link rel=\"stylesheet\" href=\"https://cdn.jsdelivr.net/npm/[email protected]/dist/katex.min.css\">"
[5] "<script type=\"text/javascript\">"
[6] "const macros = { \"\\\\R\": \"\\\\textsf{R}\", \"\\\\code\": \"\\\\texttt\"};"
> length(y)
[1] 3
> y[[3]]
[1] NA
Observaciones adicionales
tryCatch
tryCatch
devuelve el valor asociado a la ejecución expr
a menos que haya un error o una advertencia. En este caso, se pueden especificar valores de retorno específicos (ver NA
arriba) proporcionando una función de controlador respectiva (ver argumentos error
y warning
en ?tryCatch
). Estas pueden ser funciones que ya existen, pero también puedes definirlas dentro tryCatch()
(como hice arriba).
Las implicaciones de elegir valores de retorno específicos de las funciones del controlador
Como hemos especificado que NA
debe devolverse en caso de error, el tercer elemento y
es NA
.
tryCatch
tiene una estructura de sintaxis ligeramente compleja. Sin embargo, una vez que entendemos las 4 partes que constituyen una llamada tryCatch completa como se muestra a continuación, resulta fácil de recordar:
expr : [ Obligatorio ] Código(s) R a evaluar
error : [ Opcional ] ¿Qué debería ejecutarse si se produce un error al evaluar los códigos en expr?
advertencia : [ Opcional ] ¿Qué debería ejecutarse si se produjera una advertencia al evaluar los códigos en expr?
finalmente : [ Opcional ] Qué debería ejecutarse justo antes de salir de la llamada tryCatch, independientemente de si expr se ejecutó correctamente, con un error o con una advertencia
tryCatch(
expr = {
# Your code...
# goes here...
# ...
},
error = function(e){
# (Optional)
# Do this if an error is caught...
},
warning = function(w){
# (Optional)
# Do this if a warning is caught...
},
finally = {
# (Optional)
# Do this at the end before quitting the tryCatch structure...
}
)
Por lo tanto, un ejemplo de juguete para calcular el logaritmo de un valor podría verse así:
log_calculator <- function(x){
tryCatch(
expr = {
message(log(x))
message("Successfully executed the log(x) call.")
},
error = function(e){
message('Caught an error!')
print(e)
},
warning = function(w){
message('Caught an warning!')
print(w)
},
finally = {
message('All done, quitting.')
}
)
}
Ahora, ejecutando tres casos:
Un caso válido
log_calculator(10)
# 2.30258509299405
# Successfully executed the log(x) call.
# All done, quitting.
Un caso de "advertencia"
log_calculator(-10)
# Caught an warning!
# <simpleWarning in log(x): NaNs produced>
# All done, quitting.
Un caso de "error"
log_calculator("log_me")
# Caught an error!
# <simpleError in log(x): non-numeric argument to mathematical function>
# All done, quitting.
He escrito sobre algunos casos de uso útiles que utilizo con regularidad. Encuentre más detalles aquí: Uso de tryCatch para scripts R sólidos
Espero que esto sea útil.