¿Cómo utilizar la función tryCatch()?

Resuelto Dd Pp asked hace 54 años • 6 respuestas

Quiero escribir código para tryCatchsolucionar errores al descargar datos de la web.

url <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz")
y <- mapply(readLines, con=url)

Estas dos declaraciones se ejecutan correctamente. A continuación, creo una dirección web que no existe:

url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz")

url[1]no existe. ¿Cómo se escribe un tryCatchbucle (función) para que:

  1. Cuando la URL es incorrecta, el resultado será: "La URL web es incorrecta, no se puede obtener".
  2. Cuando la URL es incorrecta, ¿el código no se detiene, sino que continúa descargándose hasta el final de la lista de URL?
Dd Pp avatar Jan 01 '70 08:01 Dd Pp
Aceptado

Configurando el código

urls <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz",
    "xxxxx"
)

readUrl <- function(url) {
    tryCatch(
        {
            # Just to highlight: if you want to use more than one
            # R expression in the "try" part then you'll have to
            # use curly brackets.
            # 'tryCatch()' will return the last evaluated expression
            # in case the "try" part was completed successfully

            message("This is the 'try' part")

            suppressWarnings(readLines(url))
            # The return value of `readLines()` is the actual value
            # that will be returned in case there is no condition
            # (e.g. warning or error).
        },
        error = function(cond) {
            message(paste("URL does not seem to exist:", url))
            message("Here's the original error message:")
            message(conditionMessage(cond))
            # Choose a return value in case of error
            NA
        },
        warning = function(cond) {
            message(paste("URL caused a warning:", url))
            message("Here's the original warning message:")
            message(conditionMessage(cond))
            # Choose a return value in case of warning
            NULL
        },
        finally = {
            # NOTE:
            # Here goes everything that should be executed at the end,
            # regardless of success or error.
            # If you want more than one expression to be executed, then you
            # need to wrap them in curly brackets ({...}); otherwise you could
            # just have written 'finally = <expression>' 
            message(paste("Processed URL:", url))
            message("Some other message at the end")
        }
    )
}

Usando el código

> y <- lapply(urls, readUrl)
This is the 'try' part
Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html
Some other message at the end
This is the 'try' part
Processed URL: http://en.wikipedia.org/wiki/Xz
Some other message at the end
This is the 'try' part
URL does not seem to exist: xxxxx
Here's the original error message:
cannot open the connection
Processed URL: xxxxx
Some other message at the end

Investigando la salida

> head(y[[1]])
[1] "<!DOCTYPE html><html><head><title>R: Functions to Manipulate Connections (Files, URLs, ...)</title>"
[2] "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />"
[3] "<meta name=\"viewport\" content=\"width=device-width, initial-scale=1.0, user-scalable=yes\" />"
[4] "<link rel=\"stylesheet\" href=\"https://cdn.jsdelivr.net/npm/[email protected]/dist/katex.min.css\">"
[5] "<script type=\"text/javascript\">"
[6] "const macros = { \"\\\\R\": \"\\\\textsf{R}\", \"\\\\code\": \"\\\\texttt\"};"

> length(y)
[1] 3

> y[[3]]
[1] NA

Observaciones adicionales

tryCatch

tryCatchdevuelve el valor asociado a la ejecución expra menos que haya un error o una advertencia. En este caso, se pueden especificar valores de retorno específicos (ver NAarriba) proporcionando una función de controlador respectiva (ver argumentos errory warningen ?tryCatch). Estas pueden ser funciones que ya existen, pero también puedes definirlas dentro tryCatch()(como hice arriba).

Las implicaciones de elegir valores de retorno específicos de las funciones del controlador

Como hemos especificado que NAdebe devolverse en caso de error, el tercer elemento yes NA.

Rappster avatar Aug 30 '2012 11:08 Rappster

tryCatchtiene una estructura de sintaxis ligeramente compleja. Sin embargo, una vez que entendemos las 4 partes que constituyen una llamada tryCatch completa como se muestra a continuación, resulta fácil de recordar:

expr : [ Obligatorio ] Código(s) R a evaluar

error : [ Opcional ] ¿Qué debería ejecutarse si se produce un error al evaluar los códigos en expr?

advertencia : [ Opcional ] ¿Qué debería ejecutarse si se produjera una advertencia al evaluar los códigos en expr?

finalmente : [ Opcional ] Qué debería ejecutarse justo antes de salir de la llamada tryCatch, independientemente de si expr se ejecutó correctamente, con un error o con una advertencia

tryCatch(
    expr = {
        # Your code...
        # goes here...
        # ...
    },
    error = function(e){ 
        # (Optional)
        # Do this if an error is caught...
    },
    warning = function(w){
        # (Optional)
        # Do this if a warning is caught...
    },
    finally = {
        # (Optional)
        # Do this at the end before quitting the tryCatch structure...
    }
)

Por lo tanto, un ejemplo de juguete para calcular el logaritmo de un valor podría verse así:

log_calculator <- function(x){
    tryCatch(
        expr = {
            message(log(x))
            message("Successfully executed the log(x) call.")
        },
        error = function(e){
            message('Caught an error!')
            print(e)
        },
        warning = function(w){
            message('Caught an warning!')
            print(w)
        },
        finally = {
            message('All done, quitting.')
        }
    )    
}

Ahora, ejecutando tres casos:

Un caso válido

log_calculator(10)
# 2.30258509299405
# Successfully executed the log(x) call.
# All done, quitting.

Un caso de "advertencia"

log_calculator(-10)
# Caught an warning!
# <simpleWarning in log(x): NaNs produced>
# All done, quitting.

Un caso de "error"

log_calculator("log_me")
# Caught an error!
# <simpleError in log(x): non-numeric argument to mathematical function>
# All done, quitting.

He escrito sobre algunos casos de uso útiles que utilizo con regularidad. Encuentre más detalles aquí: Uso de tryCatch para scripts R sólidos

Espero que esto sea útil.

Rahul avatar Dec 20 '2018 21:12 Rahul