Kapan mengabaikan kesalahan yang umum dan program pulih dari [ditutup]

8

Saya memiliki program yang membuat ratusan permintaan CURL harian, permintaan SMTP, dan permintaan lainnya. Kurang dari 1 persen dari waktu, permintaan CURL atau SMTP akan gagal. Terbaik yang bisa saya katakan, penyebab masalahnya adalah eksternal dan tidak bisa diperbaiki menjadi 100% andal. Program saya selalu dapat pulih darinya dan tidak ada interaksi manusia yang diperlukan darinya. Saya memiliki sistem untuk mengirim peringatan email ketika ada sesuatu yang gagal. Sebagian besar dari apa yang saya terima adalah kegagalan CURL dan SMTP yang tidak berbahaya ini.

Haruskah saya tidak mengirim peringatan email untuk kegagalan umum dari program yang pulih?

Angsa
sumber
1
Karena Anda tampaknya menjadi penulis dan satu-satunya pengguna, milik Anda adalah satu-satunya pendapat yang penting.
Caleb
@ Caleb Saya bukan pengguna tunggal di bagian depan atau belakang aplikasi ini, tetapi saya adalah satu-satunya pengembang.
Angsa
13
Maka Anda pasti bertanya pada kelompok orang yang salah. Mengapa bertanya kepada kami, sekelompok orang yang tidak akan pernah menggunakan program Anda, ketika Anda bisa bertanya kepada pengguna yang sebenarnya apa yang mereka inginkan?
Caleb
4
@ Caleb Karena saya percaya ini adalah pertanyaan yang berlaku untuk banyak orang dan banyak proyek dan saya ingin memahami keputusan dengan lebih baik. "Hanya kirim email, jika tingkat kesalahan melebihi batas yang ditentukan yang menunjukkan bahwa intervensi manusia diperlukan." sangat membantu saya.
Angsa
Alih-alih mengirim email, Anda dapat menulis di log apa yang terjadi dan mungkin hanya mengatur tugas cron untuk mengirim satu email sehari jika kesalahan ini terjadi, sehingga pengguna tahu bahwa ia mungkin tertarik untuk memeriksa apa yang terjadi ...
Bakuriu

Jawaban:

13

Tergantung pada aplikasi Anda.

E-Mails mungkin berguna untuk statistik tetapi jika tidak, saya akan menghindari spam ini.
Apa yang saya lakukan dalam kasus serupa: Kirim ringkasan sekali sehari untuk diinformasikan seberapa baik kinerja program Anda (dan itu masih berjalan).

Saya hanya akan mengirim email, jika tingkat kesalahan melebihi batas yang ditetapkan yang menunjukkan bahwa diperlukan intervensi manusia.

MrSmith42
sumber
3
Bahkan laporan sekali sehari mungkin terlalu banyak. Sekali seminggu mungkin baik untuk banyak orang. (Bonus: beri opsi kepada penerima untuk memilih seberapa sering mengirimkan laporan kepada mereka.)
curiousdannii
Bonus yang lebih besar: Berikan opsi kepada pengguna untuk tidak diberi tahu melalui email tentang kesalahan dari mana program secara otomatis pulih tanpa kehilangan yang dapat dilihat oleh pengguna. Catatan: itu masih merupakan ide yang baik bagi program untuk melacak tingkat di mana kesalahan berselang ini terjadi dan memberi tahu pengguna jika tingkat di atas ambang batas yang ditetapkan pengguna.
Makyen
10

Dalam situasi ini saya akan segera berhenti mengirim email.

Email kesalahan harus bertindak sebagai sinyal bahwa ada sesuatu yang salah dan tindakan perlu diambil. Karena Anda mendapatkan begitu banyak dari mereka, mereka bertindak sebagai noise statis dan Anda akan dengan mudah kehilangan email kesalahan yang sangat penting yang masuk karena alasan lain.

Namun, jika Anda mendapatkan 5 dari email ini setiap jam dan mendapatkan email seperti setiap menit akan menjadi sesuatu yang tidak normal, Anda perlu membangun mekanisme yang mengirimkan sesuatu ketika kesalahan / jam melewati ambang tertentu. Karena satu email mungkin tidak berarti banyak lagi, jumlah mereka dalam periode tertentu (menit / jam / hari) dapat berarti sesuatu yang lebih besar.

Pieter B
sumber
2

Email bukan alat yang baik untuk melacak kesalahan. Lihatlah ke produk-produk seperti Relik Baru atau Wawasan Aplikasi untuk mencatat semua kesalahan Anda (dan informasi lainnya) sehingga Anda kemudian dapat melaporkannya atau mengirim peringatan email ketika kondisi tertentu dipenuhi (misalnya ketika itu berubah dari 1% gagal menjadi> 10% gagal ).

Dengan email terpisah untuk setiap kesalahan, Anda akhirnya mengabaikan email itu, dan bahkan mungkin tidak melihat lompatan dari 1% menjadi 10%. Lebih buruk lagi, penyedia email Anda mungkin melihat sejumlah besar email yang hampir identik dari satu alamat dan menandainya sebagai spam.

mereka
sumber
0

Dalam situasi semacam ini cobalah membuat algoritma untuk membuat log peristiwa kesalahan dan mengirim sekali dalam sehari. Seperti yang dikatakan pieter, berikan peringatan jika melebihi jumlah kesalahan. Itu akan menjadi cara sistematis pengelolaan aplikasi dan pemecahan masalah.

Nadhirsha bin shaju
sumber