Cara menulis trycatch di R

342

Saya ingin menulis trycatchkode untuk mengatasi kesalahan dalam mengunduh dari web.

url <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz")
y <- mapply(readLines, con=url)

Kedua pernyataan ini berjalan dengan sukses. Di bawah, saya membuat alamat web yang tidak ada:

url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz")

url[1]tidak ada. Bagaimana cara menulis satu trycatchloop (fungsi) sehingga:

  1. Ketika URL salah, hasilnya adalah: "URL web salah, tidak bisa mendapatkan".
  2. Ketika URL salah, kode tidak berhenti, tetapi terus mengunduh hingga akhir daftar URL?
Dd Pp
sumber

Jawaban:

625

Baiklah kalau begitu: selamat datang di dunia R ;-)

Ini dia

Menyiapkan kode

urls <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz",
    "xxxxx"
)
readUrl <- function(url) {
    out <- tryCatch(
        {
            # Just to highlight: if you want to use more than one 
            # R expression in the "try" part then you'll have to 
            # use curly brackets.
            # 'tryCatch()' will return the last evaluated expression 
            # in case the "try" part was completed successfully

            message("This is the 'try' part")

            readLines(con=url, warn=FALSE) 
            # The return value of `readLines()` is the actual value 
            # that will be returned in case there is no condition 
            # (e.g. warning or error). 
            # You don't need to state the return value via `return()` as code 
            # in the "try" part is not wrapped insided a function (unlike that
            # for the condition handlers for warnings and error below)
        },
        error=function(cond) {
            message(paste("URL does not seem to exist:", url))
            message("Here's the original error message:")
            message(cond)
            # Choose a return value in case of error
            return(NA)
        },
        warning=function(cond) {
            message(paste("URL caused a warning:", url))
            message("Here's the original warning message:")
            message(cond)
            # Choose a return value in case of warning
            return(NULL)
        },
        finally={
        # NOTE:
        # Here goes everything that should be executed at the end,
        # regardless of success or error.
        # If you want more than one expression to be executed, then you 
        # need to wrap them in curly brackets ({...}); otherwise you could
        # just have written 'finally=<expression>' 
            message(paste("Processed URL:", url))
            message("Some other message at the end")
        }
    )    
    return(out)
}

Menerapkan kode

> y <- lapply(urls, readUrl)
Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html
Some other message at the end
Processed URL: http://en.wikipedia.org/wiki/Xz
Some other message at the end
URL does not seem to exist: xxxxx
Here's the original error message:
cannot open the connection
Processed URL: xxxxx
Some other message at the end
Warning message:
In file(con, "r") : cannot open file 'xxxxx': No such file or directory

Investigasi hasilnya

> head(y[[1]])
[1] "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">"      
[2] "<html><head><title>R: Functions to Manipulate Connections</title>"      
[3] "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">"
[4] "<link rel=\"stylesheet\" type=\"text/css\" href=\"R.css\">"             
[5] "</head><body>"                                                          
[6] ""    

> length(y)
[1] 3

> y[[3]]
[1] NA

Tanda tambahan

coba tangkap

tryCatchmengembalikan nilai yang terkait dengan mengeksekusi exprkecuali ada kesalahan atau peringatan. Dalam hal ini, nilai-nilai pengembalian spesifik (lihat di return(NA)atas) dapat ditentukan dengan memasok fungsi penangan masing-masing (lihat argumen errordan warningdalam ?tryCatch). Ini bisa berupa fungsi yang sudah ada, tetapi Anda juga bisa mendefinisikannya di dalam tryCatch()(seperti yang saya lakukan di atas).

Implikasi dari pemilihan nilai pengembalian spesifik dari fungsi handler

Seperti yang telah kami tentukan yang NAharus dikembalikan jika terjadi kesalahan, elemen ketiga yadalah NA. Jika kita memilih NULLuntuk menjadi nilai balik, panjangnya ysaja 2bukan 3sebagai lapply()hanya akan "mengabaikan" nilai balik yang ada NULL. Juga perhatikan bahwa jika Anda tidak menentukan nilai balik eksplisit melalui return(), fungsi pawang akan kembali NULL(yaitu jika terjadi kesalahan atau kondisi peringatan).

Pesan peringatan "Tidak diinginkan"

Karena warn=FALSEtampaknya tidak memiliki efek, cara alternatif untuk menekan peringatan (yang dalam hal ini tidak benar-benar menarik) adalah menggunakan

suppressWarnings(readLines(con=url))

dari pada

readLines(con=url, warn=FALSE)

Beragam ekspresi

Perhatikan bahwa Anda juga dapat menempatkan banyak ekspresi di "bagian ekspresi aktual" (argumen exprdari tryCatch()) jika Anda membungkusnya dalam kurung keriting (seperti yang saya ilustrasikan di finallybagian).

Rappster
sumber
Mengingat bahwa string pertama dalam pastefungsi Anda berakhir dengan spasi, mengapa tidak menghilangkan spasi dan sep=""?
seancarmody
2
@seancarmody: true ;-) Saya hanya terbiasa menyatukan string yang lebih panjang / lebih rumit sehingga saya harus mengontrol spasi dengan benar-benar menuliskannya.
Rappster
3
Anda harus menggunakannya paste0untuk itu!
seancarmody
6
paste0() ada di pangkalan. Secara internal, baik paste()dan paste0()panggilan do_pastedi paste.c . Satu-satunya perbedaan adalah paste0()tidak lolos separgumen.
jthetzel
1
@JulienNavarre: ingat bahwa "bagian mencoba" selalu mengembalikan objek terakhir (saat ini readLines(con=url, warn=FALSE)yang merupakan hal yang sebenarnya bisa salah). Jadi jika Anda ingin menambahkan pesan, Anda perlu menyimpan nilai retun aktual dalam sebuah variabel: out <- readLines(con=url, warn=FALSE)diikuti oleh message("Everything worked")diikuti outuntuk menjadikan ini objek terakhir yang benar-benar dikembalikan
Rappster
69

R menggunakan fungsi untuk mengimplementasikan blok try-catch:

Sintaksnya terlihat seperti ini:

result = tryCatch({
    expr
}, warning = function(warning_condition) {
    warning-handler-code
}, error = function(error_condition) {
    error-handler-code
}, finally={
    cleanup-code
})

Di tryCatch () ada dua 'kondisi' yang dapat ditangani: 'peringatan' dan 'kesalahan'. Hal penting yang harus dipahami ketika menulis setiap blok kode adalah keadaan eksekusi dan ruang lingkup. @sumber

sebelum belajar
sumber
5
Ganti error-handler-codedengancat("web url is wrong, can't get")
seancarmody
2
Anda ketinggalan pesan-penangkapan
rawr
52

tryCatchmemiliki struktur sintaksis yang sedikit rumit. Namun, setelah kami memahami 4 bagian yang merupakan panggilan tryCatch lengkap seperti yang ditunjukkan di bawah ini, menjadi mudah diingat:

expr : [ Diperlukan ] Kode R untuk dievaluasi

error : [ Opsional ] Apa yang harus dijalankan jika terjadi kesalahan saat mengevaluasi kode dalam expr

peringatan : [ Opsional ] Apa yang harus dijalankan jika peringatan terjadi saat mengevaluasi kode dalam expr

akhirnya : [ Opsional ] Apa yang harus berjalan sebelum berhenti dari panggilan tryCatch, terlepas dari apakah expr berhasil dijalankan, dengan kesalahan, atau dengan peringatan

tryCatch(
    expr = {
        # Your code...
        # goes here...
        # ...
    },
    error = function(e){ 
        # (Optional)
        # Do this if an error is caught...
    },
    warning = function(w){
        # (Optional)
        # Do this if an warning is caught...
    },
    finally = {
        # (Optional)
        # Do this at the end before quitting the tryCatch structure...
    }
)

Jadi, contoh mainan, untuk menghitung log suatu nilai mungkin terlihat seperti:

log_calculator <- function(x){
    tryCatch(
        expr = {
            message(log(x))
            message("Successfully executed the log(x) call.")
        },
        error = function(e){
            message('Caught an error!')
            print(e)
        },
        warning = function(w){
            message('Caught an warning!')
            print(w)
        },
        finally = {
            message('All done, quitting.')
        }
    )    
}

Sekarang, menjalankan tiga kasus:

Kasing yang valid

log_calculator(10)
# 2.30258509299405
# Successfully executed the log(x) call.
# All done, quitting.

Kasus "peringatan"

log_calculator(-10)
# Caught an warning!
# <simpleWarning in log(x): NaNs produced>
# All done, quitting.

Kasus "kesalahan"

log_calculator("log_me")
# Caught an error!
# <simpleError in log(x): non-numeric argument to mathematical function>
# All done, quitting.

Saya telah menulis tentang beberapa use case yang berguna yang saya gunakan secara teratur. Temukan detail lebih lanjut di sini: https://rsangole.netlify.com/post/try-catch/

Semoga ini bermanfaat.

Rahul
sumber
34

Ini dia contoh langsung :

# Do something, or tell me why it failed
my_update_function <- function(x){
    tryCatch(
        # This is what I want to do...
        {
        y = x * 2
        return(y)
        },
        # ... but if an error occurs, tell me what happened: 
        error=function(error_message) {
            message("This is my custom message.")
            message("And below is the error message from R:")
            message(error_message)
            return(NA)
        }
    )
}

Jika Anda juga ingin menangkap "peringatan", cukup tambahkan yang warning=mirip dengan error=bagian itu.

Paul
sumber
1
Haruskah ada kurung keriting di sekitar exprbagian, karena ada dua garis, bukan satu?
Paul
Terima kasih! Setelah melakukan pengecekan ganda, saya tidak melihat adanya kebutuhan untuk kurung keriting
Paul
Terima kasih telah memeriksa ulang. Ketika saya menjalankan kode Anda, saya mendapat Error: unexpected ')' in " )"dan Error: unexpected ')' in " )". Menambahkan sepasang kurung keriting memecahkan masalah.
Paul
Untuk sebagian besar kasus penggunaan, Anda benar, terima kasih! Sudah diperbaiki.
Paul
23

Karena saya baru saja kehilangan dua hari dalam hidup saya mencoba menyelesaikan untuk tryCatch untuk fungsi irr, saya pikir saya harus berbagi kebijaksanaan saya (dan apa yang hilang). FYI - irr adalah fungsi aktual dari FinCal dalam kasus ini di mana mendapat kesalahan dalam beberapa kasus pada set data yang besar.

  1. Siapkan tryCatch sebagai bagian dari suatu fungsi. Sebagai contoh:

    irr2 <- function (x) {
      out <- tryCatch(irr(x), error = function(e) NULL)
      return(out)
    }
    
  2. Agar kesalahan (atau peringatan) berfungsi, Anda sebenarnya harus membuat fungsi. Saya awalnya untuk bagian kesalahan hanya menulis error = return(NULL)dan SEMUA nilai kembali nol.

  3. Ingatlah untuk membuat sub-output (seperti "keluar" saya) dan untuk return(out).

James
sumber
3
Mengapa nomor 3 diperlukan?
jan-glx